フォレストモデルツールは1つのモデルを作成し、1つ以上の予測変数に基づいて、ターゲット変数を予測する一連の決定木モデルを構築します。 異なるモデルは、元のデータの無作為のサンプル、すなわちブートストラップと呼ばれる手順を使用して構築されます。 さらに、ツリースプリットごとに限られた数の変数しか考慮されず、決定された数はRによって自動的に設定されるか、またはユーザーによって設定されます。 ランダムフォレストを参照してください。
このツールはRプログラミング言語を使用します。 オプション > 予測ツールをダウンロードの順にポイントして、RとRツールが使用するパッケージをインストールします。
1つ以上の可能性のある予測フィールドと共に、関心のあるターゲットフィールドを含むAlteryxデータストリームまたはXDFメタデータストリームを接続します。
入力データがAlteryxデータストリームからのものである場合、オープンソースのR randomForest関数(randomForest パッケージ)がモデル推定に使用されます。
入力データが XDF出力ツール または XDF入力ツールに由来する場合、RevoScaleR rxDForest関数がモデル推定に使用されます。 RevoScaleRベースの関数を使用する利点は、大量の(メモリから作り出された)データセットを解析することが可能であるということですが、XDFファイルを作成するための余分なオーバーヘッドができるというデメリットもあり、データ上でより多くのパスを作成する必要のあるアルゴリズムを使用して、オープンソースのrandomForest関数より(ずっと遅くなりる)アンサンブル内にそれぞれのツリーを作成します。 その結果、アンサンブル内のツリー数をデフォルトの500ツリーから減らすことを強くお勧めします。
サロゲート主キーや自然主キーなどのユニークな識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム例外を引き起こす可能性があります。
モデルのカスタマイズをクリックしてモデル設定を変更します。
グラフの解像度: 1インチあたりのドット数でグラフの解像度を選択します。 1x(96dpi); 2x(192dpi);または3x(288 dpi)。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度が高いほど、向上した印刷品質のより大きなファイルを作成できます。
各出力アンカーに閲覧ツールを接続して、結果を表示します。
フォレストモデルツールは、Microsoft SQL Server 2016のインデータベース処理をサポートしています。 インデータベースのサポートとツールの詳細については、インデータベースの概要を参照してください。
フォレストモデルツールが別のDB内ツールを使用してキャンバスに配置されると、ツールは自動的にIn-DBバージョンに変更されます。 ツールのバージョンを変更するには、ツールを右クリックし、[ツールバージョンの選択]をポイントして、別のバージョンのツールをクリックします。 予測インデータベースサポートの詳細については、予測分析を参照してください。
関心のあるターゲットフィールドを含むインデータベースデータストリームを、1つ以上の可能性のある予測フィールドと共に接続します。
入力がSQL ServerまたはTeradataインデータベースのデータストリームに由来する場合、( RevoScaleR パッケージからの)Microsoft R ServerのrxDForest関数がモデル推定に使用されます。 これにより、ローカルマシンとサーバーの両方がMicrosoft Rサーバーで構成されている限り、データベースサーバー上で処理が実行され、パフォーマンスが大幅に向上します。
サロゲート主キーや自然主キーなどのユニークな識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム例外を引き起こす可能性があります。
グラフの解像度: 1インチあたりのドット数でグラフの解像度を選択します。 1x(96dpi); 2x(192dpi);または3x(288 dpi)。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度が高いほど、向上した印刷品質のより大きなファイルを作成できます。
各出力アンカーに閲覧ツールを接続して、結果を表示します。
© Alteryx, Inc All Rights Reserved Allocate®、Alteryx®、 Guzzler®、Solocast®はAlteryx, Inc.の登録商標です。