
Ferramenta Limpeza de Dados
A documentação de ajuda está disponível antes do lançamento do Designer Cloud para que você possa dar uma olhadinha. O conteúdo pode mudar até o lançamento oficial.
Exemplo de cada ferramenta
A ferramenta Limpeza de dados tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer Cloud.
Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.
Limitações conhecidas
A ferramenta Limpeza de Dados não é dinâmica. Se usada em ambientes dinâmicos, como em uma macro destinada a trabalhar com nomes de colunas recém-criadas, a ferramenta não interage com colunas, mesmo que todas as opções estejam selecionadas. Considere substituir a ferramenta Limpeza de Dados pela ferramenta Fórmula de Múltiplos Campos.
Números com mais de 15 dígitos precisam ser tratados como cadeias de caracteres para que não se perca precisão. Defina o tipo de coluna como uma cadeia de caracteres usando a ferramenta Selecionar.
Componentes da ferramenta
A ferramenta Limpeza de Dados tem duas âncoras.
- Âncora de entrada: use a âncora de entrada para conectar os dados que deseja limpar.
- Âncora de saída: a âncora de saída exibe os dados limpos.
Configurar a ferramenta
Use a guia Opções para determinar como os problemas de qualidade dos dados devem ser tratados.
Remover dados nulos
Use estas opções para remover linhas e colunas inteiras de dados nulos:
- Remover linhas nulas
- Remove todas as linhas que apresentam um valor nulo em todas as colunas.
- Remove linhas com valores nulos – não remove linhas com cadeias de caracteres vazias.
- Remove apenas as linhas que apresentam um valor nulo em todas as colunas do conjunto.
- Uma mensagem é exibida na janela Resultados com o número de linhas que foram removidas.
- Remover colunas nulas
- Remove todas as colunas que apresentam um valor nulo em todas as linhas.
- Remove colunas com valores nulos - não remove colunas com cadeias de caracteres vazias.
- Remove apenas as colunas que apresentam um valor nulo em todas as linhas do conjunto.
- Uma mensagem é exibida na janela Resultados com o número de colunas que foram removidas.
Selecionar campos para limpar
Marque as colunas para limpar. Marque Selecionar tudo para selecionar todas as colunas e desmarque para desmarcar todas as colunas.
Dados do tipo cadeia de caracteres
Todas as opções, exceto a de Substituir nulos por 0, se aplicam a dados do tipo cadeia de caracteres. Para especificar opções diferentes para colunas diferentes, use múltiplas ferramentas Limpeza de Dados em seu fluxo de trabalho.
Substituir nulos
- Substituir por espaços vazios (colunas de cadeia de caracteres): substitui valores nulos por cadeias de caracteres vazias. Um espaço vazio é registrado como
" "
em vez de[Null]
. Essa opção vem selecionada por padrão. - Substituir por 0 (colunas numéricas): substitua valores nulos por
0
(zero). Essa opção vem selecionada por padrão.
Remover caracteres indesejados
- Espaços em branco à esquerda e à direita: remove os espaços em branco à esquerda e à direita. Essa opção vem selecionada por padrão.
- Tabulações, quebras de linha e espaços em branco duplicados: substitui qualquer ocorrência de espaços em branco por um só espaço, incluindo terminações de linha, tabulações, espaços múltiplos e outros espaços em branco consecutivos.
- Todos os espaços em branco: remove qualquer ocorrência de espaços em branco.
- Letras: remove todas as letras, inclusive as que não estão no alfabeto latino, como A b Z À é ö.
- Números: remove todos os números.
- Pontuação: remove os seguintes caracteres: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Modificar maiúsculas/minúsculas
Selecione Modificar maiúsculas/minúsculas para alterar o uso de maiúsculas em dados do tipo cadeia de caracteres:
- Maiúscula: coloca em maiúsculo todas as letras de uma cadeia de caracteres.
- Minúsculas: convertem todas as letras em uma cadeia de caracteres em minúsculas.
- Cada palavra iniciada por maiúscula: coloca em maiúsculo a primeira letra de todas as palavras em uma cadeia de caracteres.