Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.
Dica
Esta ferramenta tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente no Designer Cloud.
Numbers with more than 15 digits need to be treated as strings, or they lose precision. Set the column type to a string with the Select tool.
![]() |
Figura: ferramenta Limpeza de Dados com âncoras.
A ferramenta Limpeza de Dados tem duas âncoras.
Âncora de entrada : use a âncora de entrada para conectar os dados que deseja limpar.
Âncora de saída : a âncora de saída faz a saída dos dados limpos.
Use estas opções para remover linhas e colunas inteiras de dados nulos:
Remover linhas nulas
Remova todas as linhas que apresentam um valor nulo em todas as colunas.
Remova linhas com valores nulos (a ferramenta não remove linhas com cadeias de caracteres vazias).
Remova apenas as linhas que apresentam um valor nulo em todas as colunas do conjunto.
Remove Null Columns
Remove all columns with a null value in every row.
Remove columns with null values—doesn't remove columns with empty string values.
Only remove columns that have a null value in every row.
A message displays in the Results window with the number of columns that were removed.
Marque as colunas para limpar. Marque Selecionar tudo para selecionar todas as colunas e desmarque para desmarcar todas as colunas.
Todas as opções, exceto a de Substituir nulos por 0 , se aplicam a dados do tipo cadeia de caracteres. Para especificar opções diferentes para colunas diferentes, use múltiplas ferramentas Limpeza de Dados em seu fluxo de trabalho.
Substituir por espaços vazios (colunas de cadeia de caracteres) : substitui valores nulos por cadeias de caracteres vazias. Um espaço vazio é registrado como
" "
em vez de[Null]
. Essa opção vem selecionada por padrão.Substituir por 0 (colunas numéricas) : substitua valores nulos por
0
(zero). Essa opção vem selecionada por padrão.
Espaços em branco à esquerda e à direita : remove os espaços em branco à esquerda e à direita. Essa opção vem selecionada por padrão.
Tabulações, quebras de linha e espaços em branco duplicados : substitui qualquer ocorrência de espaços em branco por um só espaço, incluindo terminações de linha, tabulações, espaços múltiplos e outros espaços em branco consecutivos.
Todos os espaços em branco : remove qualquer ocorrência de espaços em branco.
Letras : remove todas as letras, inclusive as que não estão no alfabeto latino, como A b Z À é ö.
Números : remove todos os números.
Pontuação : remove estes caracteres: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Selecione Modificar maiúsculas/minúsculas para alterar o uso de maiúsculas em dados de cadeia de caracteres:
Maiúscula : coloca em maiúsculo todas as letras de uma cadeia de caracteres.
Minúscula : coloca em minúsculo todas as letras de uma cadeia de caracteres.
Cada palavra iniciada por maiúscula : coloca em maiúsculo a primeira letra de todas as palavras em uma cadeia de caracteres.