Herramienta Limpieza de datos
Ejemplo de cada herramienta
La herramienta Limpieza de datos tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más.
Limitaciones conocidas
La herramienta Limpieza de datos no es dinámica. Usada en una configuración dinámica, como una macro destinada a trabajar con nombres de campo recién generados, la herramienta no interactúa con los campos, por más que todas las opciones estén seleccionadas. Considera reemplazar la herramienta Limpieza de datos por una herramienta Fórmula multicampo .
Visita la serie de Dominio de herramientas de la Comunidad Alteryx para aprender aún más sobre esta y otras herramientas.
Componentes de la herramienta
La herramienta Limpieza de datos tiene dos anclas:
Ancla de entrada: conecta los datos que quieres limpiar.
Ancla de salida: los datos limpios salen por el ancla de salida.
Configurar la herramienta
Utiliza la pestaña Opciones para determinar cómo se manejan los problemas de calidad de datos.
Eliminar datos nulos
Utiliza estas opciones para eliminar filas y columnas completas de datos nulos.
Quitar filas nulas
Quita todas las filas con un valor nulo en cada columna.
Quita filas con valores nulos, no quita filas con valores de cadena vacíos.
Solo quita las filas que tienen un valor nulo en cada columna.
Aparece un mensaje en la ventana de Resultados con el número de filas que se eliminaron.
Eliminar columnas nulas
Elimina todas las columnas con un valor nulo en cada fila.
Elimina columnas con valores nulos, no elimina columnas con valores de cadena vacíos.
Solo elimina las columnas que tienen un valor nulo en cada fila.
Aparece un mensaje en la ventana de Resultados con el número de columnas que se eliminaron.
Selecciona campos para limpiar
Selecciona los campos para limpiar con las siguientes opciones de configuración. Haz clic en el enlace “Todos” para seleccionar todos los campos o en el enlace “Ninguno” para anular la selección de todos los campos.
Datos de tipo cadena (String)
Todas las opciones, excepto Reemplazar nulos por 0, se aplican a tipos de datos de cadena. Para especificar diferentes opciones para diferentes campos, utiliza varias herramientas Limpieza de datos en el flujo de trabajo.
Reemplazar nulos
Para reemplazar nulos por valores que no sean espacios en blanco o 0, utiliza la herramienta Imputación .
Reemplazar con espacios en blanco (campos de cadena) : reemplaza los valores nulos con un valor de cadena en blanco. Un espacio en blanco se registra como “ ” en vez de [Null]. Esta opción está seleccionada de manera predeterminada.
Reemplazar con 0 (campos numéricos) : reemplaza los valores nulos con un 0 (cero). Esta opción está seleccionada de manera predeterminada.
Eliminar caracteres no deseados
Espacios en blanco iniciales y finales : elimina los espacios en blanco iniciales y finales. Esta opción está seleccionada de manera predeterminada.
Tabulaciones, saltos de línea y espacios en blanco duplicados : sustituye cualquier ocurrencia de espacios en blanco con un solo espacio, incluidos los finales de línea, las tabulaciones, los espacios múltiples y otras zonas de espacios consecutivos.
Todos los espacios en blanco : elimina cualquier ocurrencia de espacios en blanco.
Letras : elimina todas las letras, incluso las letras de alfabetos no latinos como A b Z À é ö .
Números : elimina todos los números.
Signos de puntuación : elimina los siguientes caracteres:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Cambiar mayúsculas/minúsculas
Selecciona Cambiar mayúsculas/minúsculas y elige una opción del menú desplegable para cambiar las mayúsculas de los datos de tipo cadena:
Mayúsculas : convierte todas las letras de una cadena en mayúsculas.
Minúsculas : convierte todas las letras de una cadena en minúsculas.
Tipo título : pone en mayúscula la primera letra de todas las palabras de una cadena.