Skip to main content

Preparación

Prepara los datos para análisis posterior.

Elemento

Descripción

Herramienta Crear muestras

Utiliza la herramienta Crear muestra para dividir los registros de entrada en dos o tres muestras aleatorias.

Herramienta Limpieza de datos

Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más.

Herramienta Filtro

Utiliza la herramienta Filtro para seleccionar datos utilizando una condición.

Herramienta Fórmula

Utiliza la herramienta Fórmula para crear columnas nuevas, actualizar columnas y usar una o más expresiones para realizar una variedad de cálculos y operaciones.

Imputation Tool

Utiliza la herramienta Imputación para borrar valores ausentes en tus datos.

Multi-Column Binning Tool

Utiliza Agrupamiento multicolumna para reunir o agrupar en mosaicos varias columnas.

Herramienta Fórmula de columnas múltiples

Utiliza la herramienta Fórmula de columnas múltiples para crear o actualizar varias columnas con una sola expresión.

Oversample Column Tool

Utiliza la herramienta Columna de sobremuestreo para crear muestras equilibradas automáticamente desde datos sin equilibrar para uso en un modelado estadístico.

Herramienta Muestra porcentual aleatoria

Utiliza la herramienta Muestra porcentual aleatoria para devolver un número esperado de filas que causan una muestra aleatoria del flujo de datos entrante.

Herramienta Id. de fila

Utiliza la herramienta Id. de fila para crear una nueva columna en los datos y asignar un identificador único, que aumenta secuencialmente para cada fila de los datos.

Herramienta Muestra

Utiliza la herramienta Muestra para limitar el flujo de datos a un número, un porcentaje o un conjunto aleatorio de filas especificados. Además, la herramienta Muestra aplica la configuración seleccionada a las columnas por las que quieres agrupar.

Herramienta Seleccionar

Utiliza la herramienta Seleccionar para incluir, excluir y reordenar las columnas de datos que pasan por tu flujo de trabajo.

Herramienta Seleccionar filas

Utiliza la herramienta Seleccionar filas para devolver filas y rangos de filas especificados, incluidos los rangos interrumpidos de filas. Esta herramienta es útil para la solución de problemas y el muestreo.

Herramienta Ordenar

Utiliza la herramienta Ordenar para organizar las filas en una tabla en orden alfanumérico según los valores de los campos de datos especificados.

Herramienta Mosaico

Utiliza la herramienta Mosaico para asignar un valor (mosaico) según los rangos en los datos. La herramienta realiza esto según la especificación del usuario de uno de los tres métodos.

Herramienta Único

Utiliza la herramienta Único para distinguir si una fila es única o un duplicado agrupando por una o más columnas especificadas y, luego, ordenando según esas columnas.