サンプル作成ツール
サンプル作成ツールは、入力レコードを2つまたは3つのランダムサンプルに分割します。 このツールでは、推定サンプルと検証サンプルに含まれるレコードのパーセンテージを指定します。 合計が100%未満の場合、残りのレコードは保留サンプルになります。
ツールを設定する
- 推定サンプルパーセント: 推定サンプルに格納されるデータの割合 (1% ~ 99%)。
- 検証サンプルパーセント: 検証サンプルに格納されるデータの割合 (1% ~ 99%)。
- ランダムシード: 1 ~ 1000 の整数値。 この値を変更すると、データの個々の行が配置されているサンプルが変更されます。 この値を変更する特別な理由がない限り、デフォルト値の1が推奨される選択です。
出力を見る
サンプル作成ツールからの出力は3つあります。
- Eアンカー: 推定出力ストリームには、入力レコードのランダムなサンプルが含まれます。 このストリームのレコードのカウントは、上記の推定プロパティで指定された合計レコードのパーセントに等しくなります。
- Vアンカー: 検証ストリームには、入力レコードのランダムなサンプルが含まれます。 このストリームのレコードのカウントは、上記の検証サンプルプロパティで指定された合計レコードのパーセントに等しくなります。
- Hアンカー: 提示されたストリームには、見積もりまたは検証のサンプルに配置されていない残りのレコードが含まれます。
奇数のレコードがあり、推定と検証が両方とも50%に設定されている場合、推定出力ストリームは検証ストリームよりも1レコード多くなります