Data Cleansing tool icon

Ferramenta Limpeza de Dados

Last modified: February 02, 2022

A documentação de ajuda está disponível antes do lançamento do Designer Cloud para que você possa dar uma olhadinha. O conteúdo pode mudar até o lançamento oficial.

Exemplo de cada ferramenta

A ferramenta Limpeza de dados tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer Cloud.

Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.

Limitações conhecidas

A ferramenta Limpeza de Dados não é dinâmica. Se usada em ambientes dinâmicos, como em uma macro destinada a trabalhar com nomes de colunas recém-criadas, a ferramenta não interage com colunas, mesmo que todas as opções estejam selecionadas. Considere substituir a ferramenta Limpeza de Dados pela ferramenta Fórmula de Múltiplos Campos.

Números com mais de 15 dígitos precisam ser tratados como cadeias de caracteres para que não se perca precisão. Defina o tipo de coluna como uma cadeia de caracteres usando a ferramenta Selecionar.

Componentes da ferramenta

Thumbnail

A ferramenta Limpeza de Dados tem duas âncoras.

  • Âncora de entrada: use a âncora de entrada para conectar os dados que deseja limpar.
  • Âncora de saída: a âncora de saída exibe os dados limpos.

Configurar a ferramenta

Use a guia Opções para determinar como os problemas de qualidade dos dados devem ser tratados.

 Remover dados nulos

Use estas opções para remover linhas e colunas inteiras de dados nulos:

  • Remover linhas nulas
    • Remove todas as linhas que apresentam um valor nulo em todas as colunas.
    • Remove linhas com valores nulos – não remove linhas com cadeias de caracteres vazias.
    • Remove apenas as linhas que apresentam um valor nulo em todas as colunas do conjunto.
    • Uma mensagem é exibida na janela Resultados com o número de linhas que foram removidas.
  • Remover colunas nulas
    • Remove todas as colunas que apresentam um valor nulo em todas as linhas.
    • Remove colunas com valores nulos - não remove colunas com cadeias de caracteres vazias.
    • Remove apenas as colunas que apresentam um valor nulo em todas as linhas do conjunto.
    • Uma mensagem é exibida na janela Resultados com o número de colunas que foram removidas.

Selecionar campos para limpar

Marque as colunas para limpar. Marque Selecionar tudo para selecionar todas as colunas e desmarque para desmarcar todas as colunas.

Dados do tipo cadeia de caracteres

Todas as opções, exceto a de Substituir nulos por 0, se aplicam a dados do tipo cadeia de caracteres. Para especificar opções diferentes para colunas diferentes, use múltiplas ferramentas Limpeza de Dados em seu fluxo de trabalho.

Substituir nulos

  • Substituir por espaços vazios (colunas de cadeia de caracteres): substitui valores nulos por cadeias de caracteres vazias. Um espaço vazio é registrado como " " em vez de [Null]. Essa opção vem selecionada por padrão.
  • Substituir por 0 (colunas numéricas): substitua valores nulos por 0 (zero). Essa opção vem selecionada por padrão.

Remover caracteres indesejados

  • Espaços em branco à esquerda e à direita: remove os espaços em branco à esquerda e à direita. Essa opção vem selecionada por padrão.
  • Tabulações, quebras de linha e espaços em branco duplicados: substitui qualquer ocorrência de espaços em branco por um só espaço, incluindo terminações de linha, tabulações, espaços múltiplos e outros espaços em branco consecutivos.
  • Todos os espaços em branco: remove qualquer ocorrência de espaços em branco.
  • Letras: remove todas as letras, inclusive as que não estão no alfabeto latino, como A b Z À é ö.
  • Números: remove todos os números.
  • Pontuação: remove os seguintes caracteres: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~

Modificar maiúsculas/minúsculas

Selecione Modificar maiúsculas/minúsculas para alterar o uso de maiúsculas em dados do tipo cadeia de caracteres:

  • Maiúscula: coloca em maiúsculo todas as letras de uma cadeia de caracteres.
  • Minúsculas: convertem todas as letras em uma cadeia de caracteres em minúsculas.
  • Cada palavra iniciada por maiúscula: coloca em maiúsculo a primeira letra de todas as palavras em uma cadeia de caracteres.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.