Skip to main content

Survival Analysis Tool Icon 生存分析工具

生存分析工具实现了常见的生存分析方法。生存模型对事件发生前的时间进行建模(例如,寿险保单失效)。生存模型的独特之处在于它们具有删失功能;一个测试或试验可能在这种事件发生之前结束(例如,保单持有人可能在保单失效之前去世)。

重要

此工具不会随 Alteryx Designer 或 R 工具自动安装。要使用此工具,请从 Alteryx Analytics Gallery 下载。

此工具可用于两个目的(根据配置设置确定):

  1. 深入了解数据集的"生存函数"(即估计整个人群的生存时间分布)。

  2. 确定特定因素是否影响人群的生存功能(例如,比较不同组的生存功能)。

配置工具

使用“图表选项”选项卡设置输出图表控件。

  • 模型名称:需要为每个模型命名,以便以后可以对其进行识别。模型名称必须以字母开头,可包含字母、数字和特殊字符句点 (“.”)和下划线 (“_”)。不允许使用其它特殊字符,R 区分大小写。

  • 输入类型: 选择以下选项之一(取决于数据流中的数据)。

    • 数据包含持续时间: 数据包括一个表示持续时间的字段。

      • Select duration variable (选择持续时间变量):选择表示持续时间的字段。

    • 数据包含开始和停止时间: 数据包括一个表示开始时间的字段和一个表示停止时间的字段。

      • 选择开始时间/左删失变量: 选择代表开始时间的字段。

      • 选择结束时间/右删失变量: 选择代表结束时间的字段。

  • 删失:

    • 数据是左删失: 数据包括一个字段,表示记录生命开始的0/1删失。

      • 选择左删失变量: 选择一个0/1变量,其中0表示删失,1表示记录的生命从开始时间或0开始(如果之前指定了"数据包含持续时间")。

    • 数据是右删失: 数据包含一个字段,表示记录生命周期结束时的0/1截尾。

      • 选择右删失变量: 选择一个0/1变量,其中0表示删失,1表示记录的生命周期在结束时间或持续时间结束(如果之前指定了"数据包含持续时间")。

使用" 分析选项 "页签更好地定义如何计算分析。

  • Kaplan-Meier估计: 此选项将查找数据集的生存曲线,其中包含按一个变量分组的选项。

    • Choose field to group by (选择要分组依据的字段):此选项允许比较不同组的生存曲线。

      • 选择分组变量: 选择与分组变量对应的字段。

    • 使用置信区间: 此选项将显示绘制km估计值的上限和下限及其表。

      • 输入置信水平: 输入计算km估计的上限和下限的置信水平。

    • Cox比例风险: 用于查看影响生存曲线的协变量的影响和显著性。

      • 选择预测变量: 必须至少选择一个变量。

      • 联系处理方法: 处理联系时间的方法。**

      • 包括大小写权重: 此选项允许选择包含每个记录权重的字段。

        • 选择字段指定权重: 选择包含大小写权重的字段。

使用“图表选项”选项卡设置图表输出控件(可选)。

  • 图大小:选择英寸或厘米来丈量图表大小。

  • 图表分辨率:选择图表的分辨率(以每英寸点数为单位):1 x(96 dpi);2 x(192 dpi);或 3 x(288 dpi)。较低的分辨创建相对较小的文件,最适合在显示器上查看。更高的分辨率可以创建一个更大的文件,具有更好的打印质量。

查看输出

将浏览工具连接到每个输出锚点以查看结果。

o 锚点:包含序列化模型的表,其中包含模型名称和对象大小。各种模型的可用性取决于"分析选项"下的"分析类型"选择。

  • 汇总分析- Surv对象,Kaplan-Meier估计对象

  • 分组分析- Surv对象,Kaplan-Meier估计对象,Cox比例风险对象

  • 因子分析- Surv对象,Cox比例风险对象

Cox PH模型可以直接从O输出的第二个元素中访问。如果该模型为"模型",则可以通过"模型$surv"和"模型$KMest"分别访问Surv和KMest对象。

R锚点:由生存分析工具生成的报告片段组成,具体取决于"分析选项"下的"分析类型"选择。

  • 汇总分析-汇总统计量和生存函数的图形。

  • 分组分析-汇总统计量;每个组的观察结果与预期结果;组比较测试结果以了解组间的相似性(Lorank,似然比和Wald检验);比较不同组的生存曲线的图形;以及每个组的不同生存曲线和累积风险曲线。

  • 因子分析-汇总统计量;用于预测变量影响的因子分析测试结果,用于Logrank,似然比和Wald检验;以及详细描述预测变量影响的Cox比例风险模型汇总。

D 锚点:对于汇总分析和分组分析(在这种情况下添加了一个指定组的额外字段),这将构造生存曲线的Kaplan-Meier估计值。对于因子分析,未提供。

*https://en.wikipedia.org/wiki/Survival_analysis **https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html