
スコアリングツール
スコアツールは、指定された予測変数のセットにRモデルを適用することによって、ターゲット変数の推定値を作成します。 ターゲット変数がカテゴリである場合は、(予測変数に基づく) レコードが各カテゴリに属する確率を提供します。 ターゲット変数が連続している場合は、ターゲット変数の値が推定されます。 モデルのパフォーマンスを評価するために使用できますが、それ自体では実行されません。
このツールは R ツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用されるパッケージをインストールします。 予測ツールのダウンロードと使用を参照してください。
モデルタイプ
スコアツールは、いくつかの場所からモデルを評価することができます。
- ローカルモデル: モデルはローカルコンピュータからワークフローに取り込まれるか、データベース内でアクセスされます。
- モデルのプロモート: モデルはプロモートモデル管理システムに保存されます。
ローカルモデルの設定
スコア ツールは、標準ワークフローによってアクセスされるモデル、または In-DB スイートを使用してアクセスされるモデルに対して構成できます。
標準処理用にツールを構成する
入力を接続する
スコアツールには、次の2つの入力が必要です。
- R ベースの予測ツールで生成されるモデル オブジェクト。
- モデル構成で選択された、予測フィールドを含むデータストリーム。 これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力をスコア ツールの入力に接続して、構成を開始します。
サポートされているモデル
スコアツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルのデータストリームを使用できます。 スコアツールは、モデリングツールへの入力がXDF出力ツールまたはXDF入力ツールからの入力であり、モデルがRevoScaleR関数を使用して推定された場合にのみ、XDFメタデータストリームを使用できます。
Oracle R Enterprise が Oracle データ・ソースに接続された In-DB 予測ツールを使用して見積もられたモデルは、標準 Alteryx データ・ストリームのスコア付けには使用できませんが、標準 Alteryx データ・ストリームで推定されるモデルを使用して Oracle データ・ソースのスコア付けを行うことができます。
設定
このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。
- 新しいフィールド名 (連続ターゲット) またはプレフィックス (カテゴリ ターゲット): フィールド名またはプレフィックスは文字で始まる必要があり、文字、数字、および特殊文字ピリオド (".") とアンダースコア ("_") を含めることができます。 Rは大文字小文字を区別します。
- ターゲットフィールドにはオーバサンプル値があります: これらのフィールドは、実際のサンプルパーセンテージに一致するように適合した確率を調整するために使用されます。 以下を提供する場合に選択する:
- オーバサンプルされたターゲットフィールドの値: オーバサンプルフィールドの名前。
- オーバーサンプリングの前の元のデータのオーバサンプル値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。
- 非正規化線形回帰のみのオプション
鉱石-作成されたモデル
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
- ターゲットフィールドは自然なログ変換されています: 値を元の尺度に戻す変換を適用し、その後の変換バイアスを考慮するためにスミア推定を使用する場合に選択します。
- 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。
- XDF入力特有のオプション:
- 入力 XDF ファイルにスコアを追加する:Alteryx データ ストリームにスコアを配置するのではなく、入力 XDF ファイルにスコアを追加する場合に選択します。
- 一度にスコア付けするレコードの数: グループ内のレコード数を選択します。 入力データは、R のメモリ内処理の制限を回避するために、一度に 1 つのグループにスコア付けされます。
データベース内処理用にツールを構成する
スコア ツールは、Oracle、Microsoft SQL Server 2016、およびデータベース内のテラデータ処理をサポートします。 データベース内サポートとツールの詳細については、「データベース内の概要」を参照してください。
スコアツールの In-DB バージョンにアクセスするには、次の手順に従います。
- キャンバスに In-DB ツールを配置します。 スコアツールは自動的に In-DB バージョンに変更されます。
- スコアツールを右クリックし、[ツールバージョンの選択]をポイントして、In-DB バージョンを選択します。
データベース内の予測サポートの詳細については、「予測分析」を参照してください。
入力を接続する
スコアツールには、次の2つの入力が必要です。
- R ベースの予測ツールで生成されるモデル オブジェクト。
- モデル構成で選択された、予測フィールドを含むデータストリーム。 これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力をスコア ツールの入力に接続して、構成を開始します。
サポートされているモデル
スコアツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルのデータストリームを使用できます。 スコアツールは、モデリングツールへの入力がXDF出力ツールまたはXDF入力ツールからの入力であり、モデルがRevoScaleR関数を使用して推定された場合にのみ、XDFメタデータストリームを使用できます。
Oracle データ ソースに接続された In-DB 予測ツールを使用して ORE によって推定されるモデルは、標準 Alteryx データ ストリームのスコア付けには使用できませんが、標準 Alteryx データ ストリームで推定されるモデルを使用して Oracle データ ソースをスコアリングすることはできます。
設定
その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
- [出力テーブル名]: 結果がデータベースに保存されるテーブルの名前を入力します。
- 新しいフィールド名 (連続ターゲット) またはプレフィックス (カテゴリ ターゲット): フィールド名またはプレフィックスは文字で始まる必要があり、文字、数字、および特殊文字ピリオド (".") とアンダースコア ("_") を含めることができます。
- ターゲットフィールドにはオーバサンプル値があります: これらのフィールドは、実際のサンプルパーセンテージに一致するように適合した確率を調整するために使用されます。 このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。 以下を提供する場合に選択する:
- オーバサンプルされたターゲットフィールドの値: オーバサンプルフィールドの名前。
- オーバーサンプリングの前の元のデータのオーバサンプル値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。
- 線形回帰のみのオプション:
鉱石-作成されたモデル
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
- ターゲットフィールドは自然なログ変換されています: 値を元の尺度に戻す変換を適用し、その後の変換バイアスを考慮するためにスミア推定を使用する場合に選択します。
- 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。
- テラデータ固有の構成: Microsoft マシンラーニングサーバーは、使用する特定のテラサーバプラットフォームに関する追加の構成情報を必要とします。 この情報は、通常、ローカルのTeradata管理者によって提供されます。
- Rのバイナリ実行可能ファイルへのTeradataサーバーパス
- Microsoft 機械学習サーバーで使用される一時ファイルの書き込み場所。
モデル・ソース(Oracleのみ)
- モデルソース: スコアツールの(M)入力に渡されるモデルオブジェクトのソースを選択します。 これは次のいずれかです。
- データベース内では、データストリームの「名前」フィールドの値によって識別されます。
- データストリームの「オブジェクト」フィールドに含まれます。
出力を表示
出力には、モデルの予測値を含む元のデータストリームが含まれます。 カテゴリターゲットを使用するモデルの場合、ターゲット変数の各レベルの予測確率は、ユーザーが提供する接頭辞と、ターゲット変数の可能なレベルに対応するフィールドの接尾部で構成されるフィールド名で提供されます。
Promoteモデルの構成
Promoteは、予測モデルを展開、管理、スケーリングするためのプラットフォームです。 Alteryxはプロモートプラットフォームに接続して、保存されたモデルにアクセスし、それらに対してスコアを付けることができます。
Promote資格認定書
- Alteryx プロモート接続を確立する :
- Alteryx プロモート接続: 保存されたプロモート接続から選択するためのドロップダウン リスト。
- 接続の追加: 使用可能なプロモート接続のリストに追加するオプション。 Promote 接続マネージャは、ワークフローとは独立して作動します。
昇格接続の追加
- [接続の追加]をクリックします。
- [接続の追加] ウィンドウで、モデルが格納されている場所を指す URL を[Alteryx プロモート URL]に入力します。
- [次へ] をクリックします。
- [Alteryx 昇格認証情報] ウィンドウで、ユーザ名とAPI キーを入力します。
- [接続] をクリックします。
- 成功した場合は、[接続が確立されました] ウィンドウで [完了] を選択します。 新しい接続が選択され、ドロップダウンに表示されます。
昇格接続を削除する
- 使用可能な接続を選択します。
- [接続の削除] をクリックします。
- 「確認」ウィンドウで、URLとユーザー名が削除する接続に関連付けられていることを確認してください。
- OK をクリックします。 この接続は、ドロップダウンでは使用できなくなりました。
アクセスの昇格
プロモート機能にアクセスできるかどうか不明な場合や、必要な資格情報を見つけるサポートが必要な場合は、最寄りの管理者またはサポート担当者にお問い合わせください。
モデルの選択
アクセスできるモデルのリストが生成されます。 リストをスクロールするか、検索機能を使用してスコアを付けるモデルを見つけ、モデルパスを選択します。
モデルパスを選択すると、モデルに関する情報が取り込まれます。
- 名前: モデル名。
- 所有者: モデル所有者。
- ステータス: アクセシビリティを反映したモデルの現在の状態。
- オンライン: モデルは最新であり、データを処理する準備ができています。
- 建物: モデルは現在更新中であり、データを処理できません。
- 失敗した単体テスト: モデルの構築は完了しましたが、コンポーネントは正しく構築できませんでした。 モデルはデータを処理できません。
- 失敗しました: モデルは正しく構築できず、データを処理できません。
- オフライン: モデルは構築されておらず、データを処理できません。
- 最終更新日: 最後のモデル ビルドのタイムスタンプ。
モデルがデータ処理に使用できることを確認し、[完了] を選択します。
設定の概要
[構成の概要] には、使用する資格情報の概要と、選択したモデルのモデルの概要が表示されます。