Herramienta Limpieza de datos
Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más.
Limitaciones conocidas
Los números con más de 15 dígitos deben tratarse como cadenas o pierden precisión. Establece el tipo de columna como cadena con la herramienta Seleccionar.
Componentes de la herramienta
![]() |
Figura: herramienta Limpieza de datos con anclas.
La herramienta Limpieza de datos tiene dos anclas:
Ancla de entrada: conecta los datos que quieres limpiar.
Ancla de salida: los datos limpios salen por el ancla de salida.
Configurar la herramienta
Eliminar datos nulos
Utiliza estas opciones para eliminar filas y columnas completas de datos nulos:
Quitar filas nulas
Quita todas las filas con un valor nulo en cada columna.
Quita filas con valores nulos, no quita filas con valores de cadena vacíos.
Solo quita las filas que tienen un valor nulo en cada columna.
Selecciona las columnas para limpiar
Marca las columnas que deseas limpiar. Marca Seleccionar todo para seleccionar todas las columnas y desmárcalo a fin de anular la selección de todas las columnas.
Datos de tipo cadena (String)
Todas las opciones, excepto Reemplazar nulos por 0, se aplican a tipos de datos de cadena. Utiliza varias herramientas de limpieza de datos en tu flujo de trabajo para especificar diferentes opciones para diferentes columnas.
Reemplazar nulos
Reemplazar por espacios en blanco (columnas de cadena): reemplaza los valores nulos por un valor de cadena en blanco. Un espacio en blanco se registra como
“ ”en vez de[Null]. Esta opción está seleccionada de manera predeterminada.Reemplazar por 0 (columnas numéricas): reemplaza los valores nulos con un
0(cero). Esta opción está seleccionada de manera predeterminada.
Eliminar caracteres no deseados
Espacios en blanco iniciales y finales: elimina los espacios en blanco iniciales y finales. Esta opción está seleccionada de manera predeterminada.
Tabulaciones, saltos de línea y espacios en blanco duplicados: reemplaza cualquier ocurrencia de espacios en blanco con un solo espacio, incluso los finales de línea, tabulaciones, espacios múltiples y otros espacios en blanco consecutivos.
Todos los espacios en blanco: elimina cualquier ocurrencia de espacios en blanco.
Letras: elimina todas las letras, incluso las letras del alfabeto no latino como A b Z À é ö.
Números: elimina todos los números.
Signos de puntuación: elimina los siguientes caracteres: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Cambiar estilo de mayúsculas y minúsculas
Selecciona Cambiar estilo de mayúsculas y minúsculas y elije una opción del menú desplegable para cambiar las mayúsculas de los datos de tipo cadena:
Mayúsculas: convierte todas las letras de una cadena en mayúsculas.
Minúsculas: convierte todas las letras de una cadena en minúsculas.
Tipo título: pone en mayúscula la primera letra de todas las palabras de una cadena.
