ベクトルマシンサポート(SVM)、またはベクトルネットワークサポート(SVN)は、外来は分類(カテゴリカルターゲット)の問題のために開発された一連の一般的な監督下学習アルゴリズムであり、最近回帰(数値ターゲット)問題に拡張されました。 SVMはメモリが効率的であり、(予測数が予測レコードの数を超えた場合、不適切な適合を提供する可能性がありますが)多数の予測変数を扱うことができ、また多数の異なる「カーネル」関数をサポートしているため用途が広く、人気があります。
このメソッドの背後にある基本的な考え方は、予測変数が線(1つの予測)、平面(2つの予測)、または超平面(3つ以上の予測)の最高の方程式を見つけ、距離の測定、ターゲット変数に基づくさまざまなグループに入る推定レコードに基づき、レコードのグループを最大限に分離することです。 カーネル関数は、レコードを同じグループまたは異なるグループに配置させる原因となる距離の測定を提供し、距離メトリックを定義するために予測変数の関数の取り込みを含みます。
これがどのように機能するかを示す短いビデオはここに見ることが可能で、そのトピックについては ここで分かりやすく説明しています。 グループが使用されるカーネル関数で区切られる条件の範囲は、最大マージンとして知られています。 最後に、グループの分離は完全ではないかもしれませんが、コストパラメーター(推定レコードを「間違った」グループに配置するコスト)も指定することができます。
このツールは、 e1071 Rパッケージを使用します。
このツールはRプログラミング言語を使用します。 オプション > 予測ツールをダウンロードの順にポイントして、RとRツールが使用するパッケージをインストールします。
1つ以上の可能性のある予測フィールドとともに関心のあるターゲットフィールドを含むAlteryxデータストリーム。
サロゲート主キーや自然主キーなどのユニークな識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム例外を引き起こす可能性があります。
モデルのカスタマイズセクションでは、ユーザーが各カーネルのカーネルタイプと関連するパラメーターを選択します。 Alteryx SVMツールには、ユーザーが必要なパラメーターを直接設定できるオプションがあります(ラジオボタン: 「ユーザはパラメーターを提供する」)、またはパラメーターの範囲を提供し、可能性がある値のグリッドを検索することによって最良のパラメーターを見つけます(ラジオボタン: 「マシンがパラメーターを調整する」) 後者は、複数のパラメーター値でモデルをテストするために10倍のクロスバリデーションを実行するため、計算コストが高くなる(したがって時間がかかる)ことにご注意ください。 しかし、データにさらに適したモデルが得られる可能性があります。
ユーザーがパラメーターを提供する
カーネルタイプ: グループ間の分離を測定するために使用されるメトリックを決定します。
マシンがパラメーターを調整する
この場合に選択する必要があるパラメーターは、「ユーザがパラメーターを提供する」セクションの場合と同様ですが、次の点が異なります。
グラフの解像度: 1インチあたりのドット数でグラフの解像度を選択します。 1x(96dpi); 2x(192dpi);または3x(288 dpi)。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度が高いほど、向上した印刷品質のより大きなファイルを作成できます。
分類
回帰
レポートでは、各パフォーマンス評価測定の解釈方法について説明します。
© Alteryx, Inc All Rights Reserved Allocate®、Alteryx®、 Guzzler®、Solocast®はAlteryx, Inc.の登録商標です。