Skip to main content

Herramienta Muestra

Utiliza la herramienta Muestra para limitar el flujo de datos a un número, un porcentaje o un conjunto aleatorio de filas especificados. Además, la herramienta Muestra aplica la configuración seleccionada a las columnas por las que quieres agrupar.

Componentes de la herramienta

Sample Data anchors.png

Figura: Herramienta Muestra con anclas.

La herramienta Muestra tiene 2 anclas.

  • Ancla de entrada: utiliza el ancla de entrada para seleccionar los datos que quieres mostrar.

  • Ancla de salida: genera los datos de muestra.

Configurar la herramienta

  1. Selecciona un método de muestreo. N se selecciona con el cuadro de texto siguiendo los métodos de muestra y se limita a 16 caracteres. Las opciones son las siguientes…

    • Primeras N filas: devuelve cada fila de los datos desde la primera hasta la fila N.

    • Últimas N filas: a partir de la fila que está a N filas de distancia del final de los datos, devuelve cada fila hasta el final de los datos.

    • Omitir las primeras N filas: devuelve todas las filas en los datos después de N fila.

    • 1 de cada N filas: devuelve la primera fila de cada grupo de N filas.

    • Primer N% de filas: devuelve N% de filas. Esta opción requiere que los datos pasen a través de la herramienta dos veces: una vez para calcular el conteo de filas y otra vez para devolver el porcentaje especificado de filas.

    • 1 en N probabilidades de incluir cada fila: determina al azar si cada fila está incluida en la muestra, independientemente de la inclusión de otras filas.

      Nota

      La opción 1 en N probabilidades de incluir cada fila devuelve una aproximación. Por ejemplo, si tienes 1000 filas, seleccionas una muestra aleatoria y específicas “N” como “10”, es posible que esperes que la herramienta devuelva 100 filas. Sin embargo, podría devolver entre 75 y 150 filas.

  2. Ingresa un número en N= para especificar el valor de N.

  3. Columnas por las que agrupar (Opcional): si se especifican grupos, se obtienen N filas por cada grupo. Esta opción no está disponible para la 1 en N probabilidades de incluir cada fila en el método de muestra.

    Nota

    Si seleccionas agrupar por una columna denominada “Ciudad”, especificas “N” como “2” y seleccionas “Primeras N filas”, Designer Clouddevolverá las 2 primeras filas para cada ciudad.