サンプル作成ツール
サンプル作成ツールを用いて、入力行を2つまたは3つのランダムサンプルに分割します。ツールでは、各サンプルにおける行のパーセンテージを指定します。合計が100%未満の場合、残りの行はホールドアウト、またはHアンカーに出力されます。
ツールの設定
[行の割り当て]を選択します。サンプル1とサンプル2のパーセンテージの合計は100%以下である必要があります。合計が100%未満の場合、残りのパーセンテージはHアンカーに出力されます。
サンプル1: Eアンカーに出力されます。これは、推定サンプルに配置するデータのパーセンテージ(1%から99%の間)です。
サンプル2: Vアンカーに出力されます。検証サンプルに配置するデータのパーセンテージ(1%から99%の間)です。
ランダムシードを入力します。ランダムシードは、乱数生成の開始点となる1から1000の間の整数値です。この値を変更すると、各データ行が配置されるサンプルが変更されます。この値を変更する特別な理由がない限り、既定値には1を選択することが推奨されます。
出力の表示
サンプル作成ツールからの出力は3つあります。
Eアンカー: 推定出力ストリームには、入力行のランダムなサンプルが含まれます。このストリームの行数は、サンプル1で指定した、合計行のパーセントに等しくなります。
Vアンカー: 検証ストリームには、入力行のランダムなサンプルが含まれます。このストリームの行数は、サンプル2で指定した、合計行のパーセントに等しくなります。
Hアンカー: ホールドアウトストリームには、推定サンプルまたは検証サンプルのいずれにも配置されなかった残りの行が含まれます。
行数が奇数で、推定と検証の両方が50%に設定されている場合、Eアンカー出力ストリームの行は、Vアンカーストリームよりも1行多くなります。