Ferramenta Limpeza de Dados
Fluxo de trabalho de exemplo
A ferramenta Limpeza de dados tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais!
Limitações conhecidas
A ferramenta Limpeza de Dados não é dinâmica. Se usada em ambientes dinâmicos, como em uma macro destinada a trabalhar com nomes de campos recém-criados, a ferramenta não interage com os campos mesmo que todas as opções estejam selecionadas. Considere substituir a ferramenta Limpeza de Dados pela ferramenta Fórmula de Múltiplos Campos .
Visite a série Domínio de Ferramentas da Comunidade Alteryx para aprender ainda mais sobre essa e outras ferramentas.
Componentes da ferramenta
A ferramenta Limpeza de Dados tem duas âncoras.
Âncora de entrada: use a âncora de entrada para conectar os dados que deseja limpar.
Âncora de saída: a âncora de saída faz a saída dos dados limpos.
Configurar a ferramenta
Use a guia Opções para determinar como os problemas de qualidade dos dados devem ser tratados.
Remover dados nulos
Use estas opções para remover linhas e colunas inteiras de dados nulos.
Remover linhas nulas
Remova todas as linhas que apresentam um valor nulo em todas as colunas.
Remova linhas com valores nulos (a ferramenta não remove linhas com cadeias de caracteres vazias).
Remova apenas as linhas que apresentam um valor nulo em todas as colunas do conjunto.
Uma mensagem é exibida na janela Resultados com o número de linhas que foram removidas.
Remover colunas nulas
Remova todas as colunas que apresentam um valor nulo em todas as linhas.
Remova colunas com valores nulos (a ferramenta não remove colunas com cadeias de caracteres vazias).
Remova apenas as colunas que apresentam um valor nulo em todas as linhas do conjunto.
Uma mensagem é exibida na janela Resultados com o número de colunas que foram removidas
Selecionar campos para limpar
Selecione os campos a serem limpos usando as opções de configuração a seguir. Use o link Tudo para selecionar todos os campos e o link Nenhum para desmarcar todos os campos.
Dados do tipo cadeia de caracteres
Todas as opções, exceto a de substituir nulos por 0, se aplicam a dados de cadeia de caracteres. Para especificar opções diferentes para campos diferentes, use múltiplas ferramentas Limpeza de Dados em seu fluxo de trabalho.
Substituir nulos
Para substituir nulos por valores que não sejam 0 ou vazio, use a ferramenta Imputação .
Substituir por espaços vazios (campos de cadeia de caracteres) : substitui valores nulos por cadeias de caracteres vazias. Um espaço vazio é registrado como " " em vez de [Null]. Essa opção vem selecionada por padrão.
Substituir por 0 (campos numéricos) : substitui valores nulos por 0 (zero). Essa opção vem selecionada por padrão.
Remover caracteres indesejados
Espaços em branco à esquerda e à direita : remove os espaços em branco à esquerda e à direita. Essa opção vem selecionada por padrão.
Tabulações, quebras de linha e espaços em branco duplicados : substitui qualquer ocorrência de espaços em branco por um só espaço, incluindo terminações de linha, tabulações, espaços múltiplos e outros espaços em branco consecutivos.
Todos os espaços em branco : remove qualquer ocorrência de espaços em branco.
Letras : remove todas as letras, inclusive as que não estão no alfabeto latino, como A b Z À é ö .
Números : remove todos os números.
Pontuação : remove estes caracteres:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Modificar maiúsculas/minúsculas
Selecione Modificar maiúsculas/minúsculas para alterar o uso de maiúsculas em dados de cadeia de caracteres:
Maiúscula : coloca em maiúsculo todas as letras de uma cadeia de caracteres.
Minúscula : coloca em minúsculo todas as letras de uma cadeia de caracteres.
Cada palavra iniciada por maiúscula : coloca em maiúsculo a primeira letra de todas as palavras em uma cadeia de caracteres.