シミュレーションスコアリングツール
[[シミュレーションスコアリング]ツールは、モデルオブジェクトの誤差分散の近似からサンプルを取り込みます。 標準スコアリングは平均予測値を予測しようとしますが、シミュレーションスコアリングは誤差分布が考えられる値の範囲を提供することも考慮しています。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード ] に進み、 Alteryxダウンロード/ライセンスポータル R とパッケージをインストールするには、 Rツール。
入力を接続する
- Mアンカー: R ベースの予測モデリングツールのいずれかによって生成されたモデルオブジェクト。
- Vアンカー: オプション。 非線形モデル (非 LM) を接続するときに使用する検証データセット。 非 LM モデルを作成する Alteryx ツールは、 ロジスティック回帰、ポアソン回帰ツール、ガンマ回帰ツール、 ブーストモデルツール、決定木ツール、フォレストモデルツール、ナイーブベイズ分類子、 ニューラルネットワークツール、スプラインモデルツール、ステップワイズツールそしてベクトルマシンサポートツール。
- LMモデルのスコアリングを行っている場合は、LMの特性のために誤差分散を直接サンプリングすることができます。
- 他のモデル(非LM)をスコアリングしている場合、予測に関する誤差分散の均質性が想定されます。 これにより、モデルを検証セットに対してスコアリングすることで、単一の誤差分散を計算することができます。 その誤差分散はサンプリングされ、着信データのスコアリング結果に追加されます。
- Sアンカー: スコアにシミュレーションデータ。 これには、関連する予測モデルの作成に使用されるすべてのフィールド(同じタイプと名前を持つ)が含まれている必要があります。
エラー分布のサンプリング方法
警告
着信モデルオブジェクトが使用する場合は、この入力を接続しないでください。線形回帰ツール。
ツールを設定する
- スコアシミュレーションの名前の結果: 生成された結果のフィールド名。 フィールド名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")と下線( "_")を含める必要があります。 Rは大文字と小文字を区別します。
- 一度にスコアを記録するレコード数: このツールは、入力データをチャンクに分割し、一度にチャンクをスコア化して、R のメモリ内処理の制限を回避することができます。 このオプションは、各データチャンクに含まれる着信レコードの最大数を制御します。
- イテレーションごとのエラー分布からのサンプル数: 各受信レコードに対するモデルのエラー分布からの描画回数。
- ランダムシードの設定: (オプション) ランダムシードを指定します。 スコアリングするデータにシードフィールドがある場合、このオプションは表示されません。
出力を見る
- Dアンカー: シミュレートされたスコアとともに、得点するデータ。