Stepwise Tool Icon

ステップワイズツール

バージョン:
2021.3
Last modified: September 25, 2020

[ステップワイズ]ツールは線形、ロジスティック、およびその他の従来の回帰モデルの潜在的な予測変数のより大きなセットから、モデルに含めるための「最高の」予測変数を決定します。

ステップワイズ回帰の実装には、2つの基本的なアプローチが使用されます。 最初のアプローチ(後方選択として知られる)には、ターゲット変数に影響を与える可能性があるとみなされるすべての変数を含むモデルの使用が含まれ、その後、モデルに含まれる変数の数を調整する適合測定の良いところに基づいて、元のモデルからもっとも重要でない変数が削除されます。 その後の後方ステップで他の変数が削除されるこのプロセスは、調整された適合指標がそれ以上改善されなくなるまで継続されます。 第2の基本的アプローチ(前方変数選択として知られている)は、定数のみを含むモデルから始まり、そのモデルに調整された適合測定の最大の改善をもたらす一連の潜在変数のうちの1つの変数を追加します。 このプロセスは、一連の付加的前方ステップを使用して付加的変数を追加するために繰り返されます。これは、調整された適合測定にそれ以上の改善がない場合に終了します。 後方変数選択のベースでは、削除された変数は決して後続のステップで再入力されませんが、前方選択では変数はそれが追加された後のステップでは決して削除されません。 ハイブリッドアプローチは大きい「最大の」)初期モデルおよび第1の後方ステップで始まりますが、その後の各ステップで前(方および後方移動の両方が評価されます。

Alteryx Rベースのステップワイズ回帰ツールは、後方変数選択と後方および前方変数の混合選択の両方を使用します。 ツールを使用するには、まず問題と思われる変数をすべて含む「最大」回帰モデルを作成し、ステップワイズ回帰ツールを使用し、調整された適合測定に基づきこれらの変数のどれを削除するかを決定します。 2つの異なる調整された適合測定の選択肢、すなわち、赤池情報基準**(またはAIC)およびベイズ情報基準***(またはBIC)がユーザに提供されます。 これらの2つの指標は互いに似ていますが、BICはモデルに含まれる変数の数に大きなペナルティを与え、一般にAICを使用する場合よりも変数の少ない最終モデルになります。

このツールでは、入力データが通常のAlteryxデータストリームからのものであれば、適用可能なオープンソースR関数がモデル推定に使用されます。 入力がXDF 出力ツール または XDF 入力ツール ツール のいずれかから取得される場合、モデル推定に適切な Revo ScaleR 関数が使用されます。 Revo ScaleRベースの関数を使用する利点は、大量の(メモリ不足の)データセットを解析することができるが、オープンソースのR関数で利用可能なモデル診断出力の一部を作成できないということです。

このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し 、Alteryx のダウンロードとライセンス のポータルにサインインして、R と R ツールで使用されるパッケージをインストールします。 参照: 予測ツールのダウンロードとご利用

入力の接続

  • 「最大」モデルの作成に使用されるポアソン回帰、線形回帰またはロジスティック回帰ツールからの出力ストリーム。 ストリームは、ツールのいずれかの側に入力できます。
  • 「最大」モデルの作成に使用される同じAlteryxデータストリームまたはXDFメタデータストリーム。 ストリームは、ツールのいずれかの側に入力できます。

ツール設定

ステップワイズモデルのコントロールを設定するには、[ 構成] タブを使用します。

  • 新しいモデルの名前: これは、検索方向と選択基準に基づくステップワイズ変数選択を使用して見つかった最良のモデルです 選択.モデル名は文字で始まる必要があり、文字、数字、および特殊文字のピリオド ("." ")とアンダースコア ("_") を含めることができます。 他の特殊文字(スペースなど)は使用できません。また、Rは大文字と小文字を区別します。
  • 検索方向: 検索の方向が後方ステップと前方ステップの両方に関係するかどうか (メソッドは後方ステップで始まる)、または後方ステップのみが使用されます。
  • 調整されたフィット測定: 異なるモデルを比較するために使用される基準 選択 最高のモデル。 提供される選択肢は、赤池情報基準(AIC)またはベイズ情報基準(BIC)です。

[グラフィックス オプション]タブを使用して、グラフィック出力のコントロールを設定します。

  • グラフの解像度: グラフの解像度を 1 インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

出力を表示

各出力アンカーに閲覧ツールを接続して、結果を表示します。

  • アンカー : モデル名とオブジェクトのサイズを持つシリアル化されたモデルのテーブルで構成されます。
  • R アンカー: ステップワイズ ツールによって生成されたレポート スニペットで構成されます: 統計サマリー、逸脱または ANOVA テストのタイプ II 分析、および基本的な診断プロット。 データ入力が[XDF出力]または[XDF入力]ツールからもたらされたものである場合、逸脱またはANOVAテーブルのタイプII分析および基本診断プロットは生成されません。

*https://en.wikipedia.org/wiki/Stepwise_regression
**https://en.wikipedia.org/wiki/Akaike_information_criterion
https://en.wikipedia.org/wiki/Bayesian_information_criterion

このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。