创建样本工具
使用创建样本工具将输入行拆分为 2 个或 3 个随机样本。在该工具中,您可以指定每个样本中行数的百分比。如果总计小于 100%,则将剩余行输出到保留区,即 H 锚点。
配置工具
选择行分配。样本 1 和样本 2 的百分比之和必须小于或等于 100%。如果总计小于 100%,则剩余百分比输出到 H 锚点:
样本 1:输出到 E 锚点。这是放入估计样本的数据百分比(介于 1% 到 99% 之间)。
样本 2:输出到 V 锚点。这是放入验证样本的数据百分比(介于 1% 到 99% 之间)。
输入随机种子:介于 1 到 1000 之间的整数值,用作生成随机数的起点。更改此值会改变单行数据所属的样本。除非有特定原因需更改此值,否则建议使用默认值 1。
查看输出
“创建样本”工具有 3 个输出:
E 锚点:“估计”输出流包含输入行的随机样本。此流中的行数等于样本 1 中指定的总行数百分比。
V 锚点:“验证”流包含输入行的随机样本。此流中的行数等于样本 2 中指定的总行数百分比。
H 锚点:“保留”流包含任何未放入估计样本或验证样本中的剩余行。
如果行数为奇数,且“估计”和“验证”都设置为 50%,则 E 锚点输出流比 V 锚点输出流多 1 行。