アシスト付モデリング

Version:
Current
Last modified: June 03, 2020

機械学習モデルの構築に役立つ場合は、支援オプションを使用します。ターゲットと機械学習の方法の選択、データ型の設定、欠損値のクリーンアップ、機能の選択、最適なアルゴリズムの選択など、手順を追って説明します。最適なアルゴリズムがわからない場合は、アシスト モデリングを使用して、スコア ボードのアルゴリズムを比較できます。その後、モデルのトレーニングに使用したすべての機械学習ツールを含むパイプラインを Designer キャンバスに追加できます。

アシスト・モデリングを使用するには、事前に-ERR:REF-NOT-FOUND-「入力データ」ツールを使用してデータを Designer に取り込み、そのデータをアシスト・モデリング・ツールに接続する必要があります。[実行] を選択した後、構成ウィンドウで [補助モデリングの開始] を選択できます。

1. ターゲットと機械学習の選択

ターゲットを選択し、ターゲットの予測に使用する機械学習方法を選択できます。

  1. [使用可能なターゲット]セクションに、データセット内のフィーチャの名前が一覧表示されます。ターゲットとして設定する機能を選択します。
  2. 補助モデリングは、ターゲットにカテゴリデータまたは数値データが含まれているかどうかを自動的に検出し、適切な機械学習方法を選択します。
  3. [次へ] を選択して、[ステップ 2: データ型の設定] に進みます。

モデリング支援では、次の手順に進む前に、正しいターゲットを選択したことを確認します。その後、プロセス全体を再起動せずにターゲットを変更することはできません。適切なターゲットを選択した場合は、[続行]を選択します。

2. データ型を設定

モデリング支援は、各フィーチャーのデータタイプを設定します。[データ型] 列に推奨されるデータが表示されます。推奨オプションには、(数値(推奨)など) というラベルが付いています。

  1. 機能を選択すると、その機能に関する情報が [列の詳細] セクションに表示されます。そこでは、フィーチャが特定のデータ型であることをどれだけ確実にモデリング支援しているかを示すデータ型確率が表示されます。データのサンプルを含むプレビューも表示できます。この情報を使用して、データ型が正しく設定されていることを確認します。
  2. フィーチャのデータ型が正しくない場合は、[データ型] 列のドロップダウン リストを使用して、正しいデータ型を選択します。
  3. [次へ] を選択して、[ステップ 3: 不足値をクリーンアップする] に進みます。

ヒント

用語の意味がわからない場合は、補助モデリングの用語集セクションを確認してください。このセクションには、データ サイエンティストが使用する一般的な用語の多くについて役立つ情報が含まれています。

3. 欠落値を整理

補助モデリングでは、データ内の欠損値をクリーンアップします。欠損値を含む各フィーチャについて、[方法] 列に欠損値をクリーンアップするための推奨方法が表示されます。推奨オプションにはラベルが付いています (たとえば、中央値で置き換え (推奨))。

  1. 機能を選択すると、その機能に関する情報が [列の詳細] セクションに表示されます。そこでは、"駆除方法" を参照して、欠損データをクリーンアップする方法を補助モデリングで選択する方法を説明しています。データのサンプルを含むプレビューも表示できます。この情報を使用して、不足している値を処理するための正しいメソッドを使用していることを確認します。
  2. 別のクリーンアップ方法を使用する場合は、[方法] 列のドロップダウンを使用して、適切なクリーンアップ方法を選択します。
  3. [次へ] を選択して[ステップ 4: 機能の選択]に進みます。

4. 特徴量を選択

補助モデリングでは、最適なモデルを実現するフィーチャを選択します。各機能について、[機能情報] 列で、それが良好な予測変数であるかどうかを評価します。

  1. 機能を選択すると、その機能に関する情報が [列の詳細] セクションに表示されます。そこでは、機能のパフォーマンスの2つの指標である「予測の詳細」を見ることができます: GiniとGKT。補助モデリングでは、両方のメジャーを使用して、フィーチャがターゲットに関連付け過ぎるか少ないかを判断します。データのサンプルを含むプレビューも表示できます。この情報を使用して、機能が優れた予測変数であることを確認します。
  2. 機能を使用しない場合は、その機能の名前の横にあるチェックボックスをオフにします。
  3. [次へ] を選択して[ステップ 5: アルゴリズムの選択]に進みます。

5. アルゴリズムを選択

補助モデリングでは、選択できるアルゴリズムを選択できます。どのような問題を解決したいかによって、さまざまなアルゴリズムを推奨します。この手順では、スコア ボードで評価するアルゴリズムを選択します。

  1. 各アルゴリズムのカードには、長所と短所、説明、およびいくつかのユース ケースが表示されます。この情報を使用して、アルゴリズムを評価することを確認します。
  2. アルゴリズムを評価するには、名前の横にあるチェックボックスをオンにします。アルゴリズムを評価しない場合は、チェックボックスをオフにします。
  3. [選択したアルゴリズムの実行 ] を選択します

リーダーボード

補助モデリングでは、選択したアルゴリズムのパフォーマンスを比較するために使用できるスコア ボードが生成されます。

リーダーボードの出力は、解決する問題の種類によって異なりますが、UI をナビゲートする方法の基本は次のとおりです。

  • アルゴリズムに固有の情報を表示するには、[スコア ボード] セクションでカードを選択します。
  • 他のアルゴリズムに対して実行されたアルゴリズムの情報を表示するには、[比較] タブを選択します。
  • アルゴリズムの個々のパフォーマンスに関する情報を表示するには、[概要] タブを選択します。
  • アルゴリズムが最も評価されている機能を確認するには、[解釈] タブを選択します。
  • 補助モデリングプロセスで行った選択内容を思い出すために、[構成] タブを選択します。
  • 補助モデリングを使用してやり直すが、スコア ボードに含まれる情報を保持するには、[新しいモデルの作成] を選択します。
  • リーダーボードの表示/非表示を切り替える場合は、[リーダーボードを表示しない] または [リーダーボードの表示] を選択します。

最適なアルゴリズムを決定したら、モデルをトレーニングする機械学習パイプラインの一部として、Designer キャンバスに追加するアルゴリズムを選択できます。

  1. キャンバスに追加するアルゴリズムの名前の横にあるチェックボックスをオンにします。選択したアルゴリズムの数が表示されます。
  2. [モデルの追加とワークフローの続行] を選択します。

モデルの結果を含むレポートをエクスポートできます。

  1. 縦の省略記号アイコンを選択します。
  2. ドロップダウンから[ HTMLレポートのエクスポート] を選択します。
  3. ファイル エクスプローラを使用して、レポートを保存する場所を選択します。

Python ツールで、機械学習パイプラインのコードを Jupyter ノートブックにエクスポートできます。

  1. 縦の省略記号アイコンを選択します。
  2. ドロップダウンから[Python にモデルをエクスポート]を選択します。
  3. [モデリングの支援] ウィンドウを終了すると、ワークフローに Python ツールが表示されます。これには、機械学習パイプラインのすべてのコードを含む、メモが付けられた Jupyter ノートブックが含まれています。
Was This Helpful?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support.