
シミュレーションサンプリングツール
バージョン:
2022.3
Last modified: November 02, 2021
シミュレーションサンプリングツールは分布から、入力データから、または分散に最適な組み合わせとしてパラメトリックにデータをサンプリングします。 分布のパラメータが不明で、データが不足している場合は、データを「描画」することもできます。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用されるパッケージをインストールします。 参照: 予測ツールのダウンロードとご利用
入力を接続する
- D アンカー: オプション。 サンプルデータ。 この入力は、生データまたはビニングされたデータからサンプリングする場合に必要です。
- S アンカー: オプション。 シミュレーションデータ。 以前のシミュレーションツールを使用した場合は、それらのツールのデータをこの入力に接続してデータを付加し、繰り返し回数とシードを取得することができます。
ツール設定
- サンプリングメカニズムを選択します。 モンテカルロ/シンプルサンプリングまたはラテンハイパーキューブ/層状サンプリング。 データからの層別サンプリングの場合、最大層サイズはチャンクサイズの選択によって決まります。
- チャンクサイズ: 一度に評価するデータの最大サイズ。 これは、Rのインメモリ処理の制限を回避するために使用できます。 データからの層別サンプリングの場合、これは層の最大サイズでもあります。
- シード: サンプリングに使用されるランダム シード。 このオプションは、シードフィールドを含むデータセットがS入力に接続されている場合、そのシードがインクリメントされて代わりに使用されるため、使用できません。
- 繰り返し回数: 選択するサンプルの数。 データセットがS入力に接続されている場合、このデータセットのサイズによって反復回数が決まるため、このオプションは使用できません。
- サンプリングモードを選択:
- パラメーター的にサンプリング
- パラメトリックサンプリングの場合、データストリームをD入力に接続しないでください。
- 送信データの名前を入力してください: 出力フィールドのフィールド名を指定します。
- 分布の選択: サポートされているディストリビューションの一覧から選択します。 パラメーターとともに、図示した累積密度/質量関数のプロットを決定します。
- パラメータと境界を入力します。 分布のパラメータを定義するには、スライダまたは上下矢印を使用して値を調整するか、手動で値を入力します。 選択された分散に沿って、図示された累積密度/質量関数のプロットが決定されます。 必要に応じて、分散の境界を指定することができます。 境界が指定されている場合、拒否サンプリングを使用して、描画されたサンプルが下限と上限の間にあることを確認し ます。 範囲は包括的です。
- パラメトリックサンプリングの場合、データストリームをD入力に接続しないでください。
- データからサンプリング
- D入力または手動入力経由のサンプルにデータストリームを接続します。
- 置換を伴うサンプル: 置換を行ってサンプルを作成するには、このオプションを選択します。
- データの種類を指定します。 データ オプションのいずれかを選択します。
- 生データ (ビン分割されていない): サンプリングするフィールドを選択し、サンプリング戦略を選択します (下記参照)。
- ビン分割されたデータ: ID フィールドと、等間隔のビンを持つ値フィールドが必要です。 (id は等間隔の数字です)。送信データの名前 (出力フィールド名)、サンプリング戦略 (以下を参照)、ビニングデータの ID フィールド、およびビニングデータの値フィールドを指定します。
- 手動入力: ルーレットウィジェットを使用して手動でデータを入力します。 送信データの名前 (出力フィールド名) とルーレットウィジェットのパラメータを入力します。 下方、上方、高さ、および数値ビンオプションを使用して、グリッドのサイズを構成します。 グリッド内をクリックして、ビンの高さを指定します。
- サンプリングするフィールドを選択してください: データのサンプリング対象の列を選択します。
- サンプリング戦略を選択します。 データのサンプリング方法を選択します。 行全体、各列を個別に、または最適な分布からサンプリングします。 最も適合する分散からサンプリングすることを選択した場合、データに適合する分布を選択します。
- D入力または手動入力経由のサンプルにデータストリームを接続します。
- パラメーター的にサンプリング
出力を表示
結果を表示するには、参照ツールを出力アンカーに接続します。
- D アンカー: データ出力。 これはシミュレーションの結果です。