サンプル作成ツール

サンプル作成ツールは、入力レコードを2つまたは3つのランダムサンプルに分割します。 このツールでは、推定サンプルと検証サンプルに含まれるレコードのパーセンテージを指定します。 合計が100%未満の場合、残りのレコードは保留サンプルになります。

ツールを設定する

  1. 推定サンプルパーセント: 推定サンプルに格納されるデータの割合 (1% ~ 99%)。
  2. 検証サンプルパーセント: 検証サンプルに格納されるデータの割合 (1% ~ 99%)。
  3. ランダムシード: 1 ~ 1000 の整数値。 この値を変更すると、データの個々の行が配置されているサンプルが変更されます。 この値を変更する特別な理由がない限り、デフォルト値の1が推奨される選択です。

出力を見る

サンプル作成ツールからの出力は3つあります。

  • Eアンカー: 推定出力ストリームには、入力レコードのランダムなサンプルが含まれます。 このストリームのレコードのカウントは、上記の推定プロパティで指定された合計レコードのパーセントに等しくなります。
  • Vアンカー: 検証ストリームには、入力レコードのランダムなサンプルが含まれます。 このストリームのレコードのカウントは、上記の検証サンプルプロパティで指定された合計レコードのパーセントに等しくなります。
  • Hアンカー: 提示されたストリームには、見積もりまたは検証のサンプルに配置されていない残りのレコードが含まれます。

奇数のレコードがあり、推定と検証が両方とも50%に設定されている場合、推定出力ストリームは検証ストリームよりも1レコード多くなります