Herramienta crear ejemplos

La herramienta crear ejemplos divide los registros de entrada en dos o tres muestras aleatorias. En la herramienta se especifica el porcentaje de registros que se encuentran en las muestras de estimación y validación. Si el total es menos del 100 %, los registros restantes pertenecen a la muestra de reserva.

Configurar la herramienta

  1. Porcentaje de estimaciónde la muestra: la proporción de los datos que se colocarán en la muestra de estimación (entre 1% y 99%).
  2. Porcentaje de la muestrade validación: proporción de los datos que se colocarán en la muestra de validación (entre 1% y 99%).
  3. Semilla aleatoria: un valor entero entre 1 y 1000. Si cambia este valor, se alterará la muestra en la que se coloca una fila individual de los datos. A menos que haya una razón específica para cambiar este valor, el valor predeterminado de 1 es la opción recomendada.

Ver la salida

Hay 3 salidas de la herramienta Create Samples:

  • E ancla: la corriente de salida de estimación contendrá una muestra aleatoria de registros de entrada. El conteo de registros de esta secuencia será igual al porcentaje de registros totales especificados en la propiedad de estimación anterior.
  • V ancla: la secuencia de validación contendrá una muestra aleatoria de registros de entrada. El conteo de registros de esta secuencia será igual al porcentaje de registros totales especificados en la propiedad de muestra de validación anterior.
  • H Anchor: la secuencia retención incluirá los registros sobrantes que no hayan sido colocados en las muestras de estimación o de validación.

Si hay un número impar de registros y la estimación y la validación se establecen a 50%, el flujo de salida de estimación tendrá un registro más que el vapor de validación