スコアリングツール
スコアツールは、指定された予測変数のセットに R モデルを適用することによって、ターゲット変数の推定値を作成します。 ターゲット変数がカテゴリである場合は、(予測変数に基づく) レコードが各カテゴリに属する確率を提供します。 ターゲット変数が連続している場合は、ターゲット変数の値が推定されます。 モデルのパフォーマンスを評価するために使用できますが、それ自体では実行されません。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード ] に進み、 Alteryxダウンロード/ライセンスポータル R とパッケージをインストールするには、 Rツール。
モデルタイプ
[スコアリング]ツールでは、さまざまな場所からモデルを評価できます。
- ローカルモデル: モデルはローカルコンピュータからワークフローに取り込まれるか、データベース内でアクセスされます。
- モデルのプロモート: モデルはプロモートモデル管理システムに保存されます。
[スコアリング]ツールは、標準ワークフローによってアクセスされるモデル、またはIn-DBスイートを使用してアクセスされるモデルに対して構成できます。
[スコアリング]ツールには、次の2つの入力が必要です。
- Rベースの予測ツールで作成されたモデルオブジェクト。
- モデル構成で選択された、予測フィールドを含むデータストリーム。 これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力を[スコアリング]ツール入力に接続して設定を開始します。
サポートされているモデル
[スコアリング]ツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。 XDF メタデータストリームを使用できるのは、モデリングツールへの入力が XDF出力ツール または XDF入力ツールRevoScaleR関数を用いてモデルを推定した.
標準のAlteryxデータストリームで推定されたモデルをOracleデータソースのスコアリングに使用できますが、Oracleデータソースに接続されたIn-DB予測ツールを使用してOracle R Enterpriseによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることができません。
- 新しいフィールド名 (連続ターゲット) または接頭辞 (カテゴリターゲット): フィールド名または接頭辞は英字で始まり、文字、数字、および特殊文字ピリオド (".") とアンダースコア ("_") を含むことができます。 Rは大文字小文字を区別します。
- ターゲットフィールドにはオーバサンプル値があります: これらのフィールドは、実際のサンプルパーセンテージに一致するように適合した確率を調整するために使用されます。 以下を提供する場合に選択する:
- オーバサンプルされたターゲットフィールドの値: オーバサンプルフィールドの名前。
- オーバーサンプリングの前の元のデータのオーバサンプル値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。
- 非正規化線形回帰のみオプション:
- ターゲットフィールドは自然なログ変換されています: 値を元の尺度に戻す変換を適用し、その後の変換バイアスを考慮するためにスミア推定を使用する場合に選択します。
- 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。
- XDF 入力固有のオプション:
- 入力 XDF ファイルにスコアを追加: Alteryx データストリームに配置するのではなく、入力 XDF ファイルにスコアを追加する場合に選択します。
- 一度にスコアを記録するレコード数:グループ内のレコード数を選択します。 入力データは、Rのメモリ内処理の制限を回避するために、一度に1つのグループにスコアリングされます。
このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。
鉱石-作成されたモデル
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
[スコアリング]ツールは、Oracle、Microsoft SQL Server 2016、およびTeradataのインデータベース処理をサポートします。 参照: インデータベースの概要 データベース内のサポートとツールの詳細については。
In-DBバージョンの[スコアリング]ツールにアクセスするには:
- キャンバスにIn-DBツールを配置します。 [スコアリング]ツールはIn-DBのバージョンに自動的に変更されます。
- [スコアリング]ツールを右クリックし、ツールバージョンの選択をポイントし、In-DBバージョンを選択します。
参照: 予測分析 データベース内の予測サポートの詳細については。
[スコアリング]ツールには、次の2つの入力が必要です。
- Rベースの予測ツールで作成されたモデルオブジェクト。
- モデル構成で選択された、予測フィールドを含むデータストリーム。 これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力を[スコアリング]ツール入力に接続して設定を開始します。
サポートされているモデル
[スコアリング]ツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。 XDF メタデータストリームを使用できるのは、モデリングツールへの入力が XDF出力ツール または XDF入力ツールRevoScaleR関数を用いてモデルを推定した.
Oracleデータソースに接続されたIn-DB予測ツールを使用してOREによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることはできませんが、標準のAlteryxデータストリームで推定されたモデルを使用してOracleデータソースをスコアリングすることはできます。
- [出力テーブル名]: 結果がデータベースに保存されるテーブルの名前を入力します。
- 新しいフィールド名 (連続ターゲット) または接頭辞 (カテゴリターゲット): フィールド名または接頭辞は英字で始まり、文字、数字、および特殊文字ピリオド (".") とアンダースコア ("_") を含むことができます。
- ターゲットフィールドにはオーバサンプル値があります: これらのフィールドは、実際のサンプルパーセンテージに一致するように適合した確率を調整するために使用されます。 このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。 以下を提供する場合に選択する:
- オーバサンプルされたターゲットフィールドの値: オーバサンプルフィールドの名前。
- オーバーサンプリングの前の元のデータのオーバサンプル値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。
- 線形回帰のみのオプション:
- ターゲットフィールドは自然なログ変換されています: 値を元の尺度に戻す変換を適用し、その後の変換バイアスを考慮するためにスミア推定を使用する場合に選択します。
- 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。
- テラデータ固有の構成: Microsoft マシンラーニングサーバーは、使用する特定のテラサーバプラットフォームに関する追加の構成情報を必要とします。 この情報は、通常、ローカルのTeradata管理者によって提供されます。
- Rのバイナリ実行可能ファイルへのTeradataサーバーパス
- Microsoft マシンラーニングサーバーによって使用される一時ファイルの書き込み場所。
その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
鉱石-作成されたモデル
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
- [モデルソース]: スコアツールの (M) 入力に渡されるモデルオブジェクトのソースを選択します。 これは次のいずれかです。
- データベース内では、データストリームの「名前」フィールドの値によって識別されます。
- データストリームの「オブジェクト」フィールドに含まれます。
出力には、モデルの予測値を含む元のデータストリームが含まれます。 カテゴリターゲットを使用するモデルの場合、ターゲット変数の各レベルの予測確率は、ユーザーが提供する接頭辞と、ターゲット変数の可能なレベルに対応するフィールドの接尾部で構成されるフィールド名で提供されます。
Promoteは、予測モデルを展開、管理、スケーリングするためのプラットフォームです。 Alteryxは、Promoteプラットフォームに接続して、保存されたモデルにアクセスし、それをスコアリングすることができます。
Alteryx の昇格接続を確立します。
Alteryx Promoteの接続 : 保存されたPromoteから選択するために使用するドロップダウンリスト。
接続の追加 : 利用可能なPromote接続の一覧に追加するオプション。 Promote接続マネージャは、ワークフローとは独立して動作します。
- 接続の追加 をクリックします。
- [接続の追加] ウィンドウでモデルが格納されている場所を指す Alteryx Promote URL を入力します。
- 次へ をクリックします。
- Alteryx Promote 認証ウィンドウで、 ユーザー名 および API キー を入力します。
- 接続 をクリックします。
- 成功した場合、[接続済み] ウィンドウで、 完了 を選択します。 新しい接続が選択され、ドロップダウンに表示されます。
- 使用可能な接続を選択します。
- 接続の削除 をクリックします。
- 「確認」ウィンドウで、URLとユーザー名が削除する接続に関連付けられていることを確認します。
- OK をクリックします。 この接続は、ドロップダウンでは使用できなくなりました。
Promoteへのアクセス
Promote機能へのアクセス権があるか、またはアクセスに必要な資格情報を探す必要があるかどうか不明な場合は、ローカル管理者またはサポート担当者に問い合わせてください。
アクセスできるモデルのリストが生成されます。 リストをスクロールするか、検索機能を使用してスコアリングするモデルを探し、モデルパスを選択します。
モデルパスを選択すると、モデルに関する情報が取り込まれます。
- 名前: モデル名。
- 所有者: モデル所有者。
- ステータス: モデルのアクセシビリティを反映した現在の状態。
- オンライン: モデルは最新であり、データを処理する準備が整いました。
- 建物: モデルは現在更新中で、データを処理できません。
- 失敗した単体テスト: モデルの構築が完了しましたが、コンポーネントを正しくビルドできませんでした。 モデルはデータを処理できません。
- 失敗: モデルを正しく構築できず、データを処理できませんでした。
- オフライン: モデルが構築されておらず、データを処理できません。
- 最終更新日: 最後のモデルビルドのタイムスタンプ。
モデルがデータ処理に使用可能であることを確認し、[完了] を選択します。
構成の概要には、 使用された資格情報と、選択したモデルのモデルの概要 が示されます。