
生存分析ツール
生存分析ツールは、生存分析の一般的な方法を実装します。生存モデルは、事象が発生するまでの時間(たとえば、生命保険契約の失効)をモデル化します。生存モデルは、打ち切りを特徴とする点でユニークです。そのようなイベントが発生する前にテストや試行が終了する可能性があります(ポリシーが失効する前にポリシー保持者が離れるなど)。
このツールは、Alteryx デザイナーまたは R ツールと共に自動的にはインストールされません。このツールを使用するには、Alteryx アナリティクス ギャラリーからダウンロードしてください。
このツールは、次の2つの目的(構成設定に基づいて決定)で使用できます。
- データセットの「生存関数」(つまり、全人口の生存時間の分散を推定する)についての洞察を得ます。
- 特定の因子が集団の生存機能に影響を与えるかどうかを決定します(たとえば、群間の生存関数を比較する)。
ツール設定
[必要なパラメータ] タブを使用して、モデル生成のコントロールを設定します。
- モデル名:後で識別できるように、各モデルに名前を付ける必要があります。モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
- 入力タイプ:次のいずれかを選択します。
次 (データ ストリーム内のデータに応じて)。- データには期間が含まれます。データには、期間を表すフィールドが含まれます。
- セレクト
期間 変数:期間を表すフィールドを選択します。
- セレクト
- データには開始時刻と停止時刻が含まれます。データには、開始時刻を表すフィールドと停止時間を表すフィールドが含まれます。
- 開始時刻/左打ち切り変数を選択します。開始時刻を表すフィールドを選択します。
- 終了時刻/右打ち切り変数を選択します。終了時刻を表すフィールドを選択します。
- データには期間が含まれます。データには、期間を表すフィールドが含まれます。
- 検閲:
- データは左打ち切りです。データには、レコードの寿命の開始の 0/1 の打ち切りを表すフィールドが含まれます。
- 左打ち切り変数を選択します。0/1 変数を選択し、0 は打ち切りを表し、1 はレコードの有効期間が開始時刻または 0 で始まったことを示します ("データに期間が含まれている場合" が以前に指定されている場合)。
- データは右打ち切りです。データには、レコードの寿命の終了の 0/1 切り捨てを表すフィールドが含まれます。
- 右打ち切り変数を選択します。0/1 変数を選択し、0 は打ち切りを表し、1 はレコードの有効期間が終了したことを示します ("データに期間が含まれている場合" が以前に指定されている場合)。
- データは左打ち切りです。データには、レコードの寿命の開始の 0/1 の打ち切りを表すフィールドが含まれます。
[分析オプション] タブを使用して、分析の計算方法をより適切に定義します。
- カプラン・マイヤー推定値:このオプションは、1 つの変数でグループ化するオプションを持つデータセットの生存曲線を検索します。
- 以下を選択します:
フィールド グループ化によって: このオプションは、異なるグループの生存曲線の比較を可能にします。- グループ化変数の選択:グループ化変数に対応するフィールドを選択します。
- 信頼区間を使用します。このオプションは、KM 推定値のプロットおよびテーブルに上下の境界を表示します。
- 入力信頼度:KM 見積の上限と下限を計算する信頼水準を入力します。
- コックス比例ハザード:生存曲線に影響を与える共変量の影響と有意性を確認するために使用します。
- 予測変数変数の選択:少なくとも 1 つを選択する必要があります。
- タイ処理の方法:タイドタイムに対処する方法。
- ケースの重みを含める:このオプションを使用すると、各レコードの重みを含むフィールドを選択できます。
- [重みを指定するフィールド] を選択します。ケースウェイトを含むフィールドを選択します。
- 以下を選択します:
グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。
- プロットサイズ:グラフのサイズに対してインチまたはセンチメートルを選択します。
- グラフの解像度: グラフの解像度を 1 インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi) で選択します。解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。
出力を表示
各出力アンカーに閲覧ツールを接続して、結果を表示します。
Oアンカー: モデル名とオブジェクトのサイズを持つシリアル化されたモデルのテーブルから成ります。さまざまなモデルの利用可能性は、「分析オプション」の下の「分析タイプ」の選択に依存します。
- 要約分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト
- グループ分け分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト、Cox比例ハザードオブジェクト
- 因子分析 - Survオブジェクト、Cox比例ハザードオブジェクト
Cox PHモデルは、O出力の出力の第2要素から直接アクセスすることができます。そのモデルが「モデル」である場合、SurvオブジェクトとKMestオブジェクトはそれぞれ「model$surv」と「model$KMest」によってアクセスできます。
Rアンカー: 「分析オプション」の「分析タイプ」の選択に応じて、サバイバル分析ツールによって生成されたレポートスニペットから成ります。
- 要約分析 - 要約統計と生存関数のグラフ。
- グループ分け分析 - 要約統計量。観察されたもの対各グループの期待される結果。Logrank、Likelihood Ratio、およびWaldテストのグループの類似性に関するグループ比較テスト結果。異なるグループの生存曲線を比較するグラフ。各グループの明確な生存曲線と累積ハザード曲線。
- 因子分析 - 要約統計量、Logrank、Likelihood Ratio、およびWaldテストの予測変数の影響に関する因子分析テスト結果。予測因子の影響を列挙するCox比例ハザードモデルの要約。
Dアンカー: サマリー分析とグループ化分析 (その場合、余分なフィールドは、グループを指定して追加されます)、これは生存曲線のカプラン-マイヤーの見積もりを構築します。因子分析用には、提供されていません。
*https://en.wikipedia.org/wiki/Survival_analysis
**https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html