スプラインモデルツール

スプラインモデルツールは、Friedmanの多変量適応回帰スプライン(またはMARS)アルゴリズムを提供します。*このメソッドは、次のような現代の統計学習モデルです。 (1)は、フィールドのどのサブセットが関心のあるターゲットフィールドを最もよく予測するかを自己決定します。 (2)フィールド間の高度に非線形の関係や相互作用を捕らえることが可能で、ユーザーにはわかりやすい方法で広範な回帰と分類の問題に自動的に対処できます(ユーザーはターゲットフィールドと一連の予測フィールドを指定するだけで十分ですが、ツールは上級ユーザーにより広範囲にわたって微調整することができます)。

このツールは分類、カウントデータ、および連続ターゲット回帰の問題など、幅広い問題に適用できます。 この方法では、2段階アプローチを使用してモデルを作成します。 最初のステップ(フォワードパスとして知られ、決定木ツールで使用される再帰的分割アルゴリズムに似ています)では、ターゲットを予測する上で最も重要な変数と、適切な「スプリットポイント」(「ノット」として知られています)変数の中で見つけられます。 しかし、決定木とは異なり、決定木で行われるように離散ジャンプを使用するのではなく、隣接するノッと(項と呼ばれる)間の線が適合します。 これにより、各変数の区分的線形関数が構築され、ターゲットと予測変数間のあらゆる関係を接近させることができます。 モデルが推定サンプルをオーバーフィットしている可能性を最小限に抑え、根底にある信号とは対照的に推定サンプルノイズをようにキャプチャするために、第2ステップ(逆方向またはプルーニングパスとして知られている)は、変数のノットのいくつかを削除します(残りの項で線分を伸ばします)。

このツールはRプログラミング言語を使用します。 オプション > 予測ツールをダウンロードの順にポイントして、RとRツールが使用するパッケージをインストールします。

入力

1つ以上の可能性のある予測フィールドとともに関心のあるターゲットフィールドを含むAlteryxデータストリーム。

構成プロパティ

必要なパラメータ

モデルのカスタマイズ(オプション)

グラフィックオプション

出力

*https://en.wikipedia.org/wiki/Multivariate_adaptive_regression_splines

**Freidman、Jerome H.、『多変量適応回帰スプライン』、スタンフォード大学、1990年8月

***Freidman、Jerome H.、『Fast MARS』、スタンフォード大学統計学科102号、1993年5月