Create Samples tool

サンプル作成ツール

Last modified: March 21, 2022

サンプル作成を使用して、入力行を 2 つまたは 3 つのランダムサンプルに分割します。このツールでは、推定サンプルと検証サンプルに含まれる行のパーセンテージを指定します。合計が 100% 未満の場合、残りの行はホールドアウトサンプルになります。

ツールコンポーネント

 

4 つのアンカーがあるサンプル作成ツール

サンプル作成ツールには次の 4 つのアンカーがあります。

  • 入力アンカー: 入力アンカーは、サンプルの作成元データの接続に使用します。
  • E アンカー: 推定出力ストリームには、入力行のランダムサンプルが含まれます。
  • ​​V アンカー: 検証ストリームには、入力行のランダムサンプルが含まれます。
  • H アンカー: ホールドアウトストリームには、推定サンプルまたは検証サンプルのいずれにも配置されなかった残りの行が含まれます。

出力アンカーの詳細については、「出力の表示」を参照してください。

 ツールの設定

  1. 推定サンプルパーセント: 推定サンプルに配置するデータのパーセンテージ (1% から 99% の間)。
  2. 検証サンプルパーセント: 検証サンプルに配置するデータのパーセンテージ (1% から 99% の間)。

    推定サンプルパーセント検証サンプルパーセントの合計は、100 以下である必要があります。合計が 100 より小さい場合、残りのパーセンテージはホールドアウトサンプルに配置されます。既定の設定を使用すると、行の 34% が推定サンプルに含まれ、検証サンプルとホールドアウトサンプルに各 33% ずつデータ行が含まれます。

  3. ランダムシード: 1 - 1,000 の整数値。この値を変更すると、データの個々の行が配置されるサンプルが変更されます。この値を変更する特別な理由がない限り、既定値の 1 が推奨されます。

 出力の表示

サンプル作成ツールからの出力は3つあります。

  • E アンカー: 推定出力ストリームには、入力行のランダムサンプルが含まれます。このストリームの行のカウントは、上記の推定プロパティで指定された合計行のパーセントに等しくなります。
  • V アンカー: 検証ストリームには、入力行のランダムサンプルが含まれます。このストリームの行のカウントは、上記の検証サンプルプロパティで指定された合計行のパーセントに等しくなります。
  • H アンカー: ホールドアウトストリームには、推定サンプルまたは検証サンプルのいずれにも配置されなかった残りの行が含まれます。

奇数の行があり、推定と検証が両方とも 50% に設定されている場合、推定出力ストリームは検証ストリームよりも 1 行多くなります。

このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。