生存分析ツール

生存分析ツールは、生存分析の一般的な方法を実装します。 生存モデルは、事象が発生するまでの時間(たとえば、生命保険契約の失効)をモデル化します。 生存モデルは、打ち切りを特徴とする点でユニークです。そのようなイベントが発生する前にテストや試行が終了する可能性があります(ポリシーが失効する前にポリシー保持者が離れるなど)。

ギャラリーツール

このツールは、Alteryx デザイナーまたは R ツールと共に自動的にはインストールされません。 このツールを使用するには、Alteryx アナリティクスギャラリーからダウンロードしてください。

このツールは、次の2つの目的(構成設定に基づいて決定)で使用できます。

  1. データセットの「生存関数」(つまり、全人口の生存時間の分散を推定する)についての洞察を得ます。
  2. 特定の因子が集団の生存機能に影響を与えるかどうかを決定します(たとえば、群間の生存関数を比較する)。

ツールを設定する

[必要なパラメータ] タブを使用して、モデル生成のコントロールを設定します。

  • モデル名: 後で識別できるように、各モデルに名前を指定する必要があります。 モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。 その他の特殊文字は使用できず、Rは大文字と小文字を区別します。

  • 入力タイプ: 次のいずれかを選択します (データストリームのデータによって異なります)。
    • データには期間が含まれます: データには期間を表すフィールドが含まれます。
      • 期間変数の選択: 期間を表すフィールドを選択します。
    • データには開始時刻と停止時間が含まれます: データには、開始時刻を表すフィールドと停止時間を表すフィールドが含まれます。
      • 開始時刻/左検閲変数を選択: 開始時刻を表すフィールドを選択します。
      • 選択終了時刻/右の検閲変数: 終了時刻を表すフィールドを選択します。
  • 検閲:
    • データが残っている-検閲: データは、レコードの寿命の開始の0/1 打ち切りを表すフィールドが含まれています。
      • 左打ち切り変数を選択: 0 が打ち切りを表す0/1 変数を選択し、1はレコードの寿命が開始時刻または0で始まったことを示します (「データが期間を含む」が以前に指定されている場合)。
    • データは右-検閲: データは、レコードの寿命の終わりの0/1 切り捨てを表すフィールドが含まれています。
      • [右打ち切り変数を選択]: 0/1 変数を選択し、0は打ち切りを表し、1はレコードの有効期間が終了時刻または継続時間 ("データに期間が含まれている場合) が終了したことを示します。

[分析オプション] タブを使用して、分析の計算方法をより適切に定義します。

  • カプラン-マイヤー推定: このオプションは、1つの変数によってグループ化するオプションを持つデータセットの生存曲線を見つける。

    • グループ化するフィールドを選択: このオプションは、異なるグループの生存曲線の比較を可能にします。
      • グループ変数の選択: グループ化変数に対応するフィールドを選択します。
    • 信頼区間を使用: このオプションは、KM の推定値とテーブルのプロットの上限と下限を表示します。
      • 入力信頼レベル: KM 推定の上限と下限を計算する信頼レベルを入力します。
  • コックス比例ハザード: 生存曲線に影響を与える変量の影響と意義を確認するために使用します。
    • 予測変数の選択: 少なくとも1つは選択する必要があります。
    • タイの処理のための方法: 縛られた時間に対処する方法。
    • [ケースウェイトを含める]: このオプションでは、各レコードのウェイトを含むフィールドを選択できます。
      • ウェイトを指定するフィールドを選択: ケースウェイトを含むフィールドを選択します。

グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。

  • [印刷サイズ]: グラフのサイズに対してインチまたはセンチメートルを選択します。
  • グラフの解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度が高いほど、向上した印刷品質のより大きなファイルを作成できます。

出力を見る

各出力アンカーに閲覧ツールを接続して、結果を表示します。

Oアンカー: モデル名とオブジェクトのサイズを持つシリアル化されたモデルのテーブルから成ります。 さまざまなモデルの利用可能性は、「分析オプション」の下の「分析タイプ」の選択に依存します。

  • 要約分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト
  • グループ分け分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト、Cox比例ハザードオブジェクト
  • 因子分析 - Survオブジェクト、Cox比例ハザードオブジェクト

Cox PHモデルは、O出力の出力の第2要素から直接アクセスすることができます。 そのモデルが「モデル」である場合、SurvオブジェクトとKMestオブジェクトはそれぞれ「model$surv」と「model$KMest」によってアクセスできます。

Rアンカー: 「分析オプション」の「分析タイプ」の選択に応じて、サバイバル分析ツールによって生成されたレポートスニペットから成ります。

  • 要約分析 - 要約統計と生存関数のグラフ。
  • グループ分け分析 - 要約統計量。観察されたもの対各グループの期待される結果。Logrank、Likelihood Ratio、およびWaldテストのグループの類似性に関するグループ比較テスト結果。異なるグループの生存曲線を比較するグラフ。各グループの明確な生存曲線と累積ハザード曲線。
  • 因子分析 - 要約統計量、Logrank、Likelihood Ratio、およびWaldテストの予測変数の影響に関する因子分析テスト結果。予測因子の影響を列挙するCox比例ハザードモデルの要約。

Dアンカー: サマリー分析とグループ化分析 (その場合、余分なフィールドは、グループを指定して追加されます)、これは生存曲線のカプラン-マイヤーの見積もりを構築します。 因子分析用には、提供されていません。

*https://en.wikipedia.org/wiki/Survival_analysis

* *https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html