Herramienta Crear muestras
La herramienta Crear muestras divide las filas de entrada en 2 o 3 muestras aleatorias. En la herramienta, especifica el porcentaje de filas en cada muestra. Si el total es inferior al 100 %, las filas restantes generan un resultado en la reserva o en el ancla H.
Configurar la herramienta
Selecciona la Asignación de fila. La suma de los porcentajes de la muestra 1 y la muestra 2 debe ser inferior o igual al 100 %. Si el total es inferior al 100 %, el porcentaje restante genera un resultado en el ancla H:
Muestra 1: genera un resultado en el ancla E. Este es el porcentaje de los datos que se incluirá en la muestra de estimación (entre 1 % y 99 %).
Muestra 2: genera un resultado en el ancla V. Este es el porcentaje de los datos que se incluirá en la muestra de validación (entre 1 % y 99 %).
Ingresa una semilla aleatoria: un valor entero entre 1 y 1000 que proporciona el punto de partida para generar números aleatorios. Cambiar este valor altera la muestra en la que se coloca una fila individual de los datos. A menos que haya una razón específica para cambiar este valor, se recomienda el valor predeterminado de 1.
Ver la salida
Hay tres salidas de la herramienta Crear muestras:
Ancla E: el flujo de salida de Estimación contiene una muestra aleatoria de las filas de entrada. El recuento de filas de este flujo es igual al porcentaje de filas totales especificado en la Muestra 1.
Ancla V: el flujo de Validación contiene una muestra aleatoria de las filas de entrada. El recuento de filas de este flujo es igual al porcentaje de filas totales especificado en la Muestra 2.
Ancla H: el flujo de Reserva incluye las filas sobrantes que no se colocaron en las muestras de Estimación o Validación.
Si el número de filas es impar, y Estimación y Validación se establecen en un 50 %, el flujo de salida del ancla E tiene una fila más que el flujo del ancla V.