Ferramenta Limpeza de dados
A ferramenta Limpeza de dados corrige problemas comuns de qualidade de dados usando uma variedade de parâmetros.
Limitação conhecida: fluxos de trabalho dinâmicos
A ferramenta Limpeza de dados não é dinâmica. Se usada em ambientes dinâmicos, como o de uma macro destinada a trabalhar com nomes de campos recém-criados, a ferramenta não interage com os campos, mesmo se a opção Tudo estiver selecionada. Considere substituir a ferramenta Limpeza de dados pela Ferramenta Fórmula de múltiplos campos.
Visite a série Domínio de Ferramentas do Alteryx Community para aprender ainda mais sobre essa e outras ferramentas.
Configurar a ferramenta
Limitação conhecida: manipulação de números grandes
Números com mais de 15 dígitos precisam ser tratados como cadeias de caracteres para que não se perca precisão. Defina o tipo de campo como uma cadeia de caracteres usando a Ferramenta Selecionar.
Use os seguintes campos para determinar como os problemas de qualidade dos dados são tratados.
Selecionar campos para limpar: selecione os campos a serem limpos usando as opções de configuração abaixo. Todas as opções, exceto a de substituir nulos por 0, se aplicam a tipos de dados de cadeias de caracteres. Para especificar opções diferentes para campos diferentes, use múltiplas ferramentas Limpeza de dados em seu fluxo de trabalho.
Substituir nulos: para substituir nulos com valores que não sejam branco ou 0, use a Ferramenta Imputação.
- Substituir por espaços em branco (campos de cadeia de caracteres): um espaço em branco é registrado como "" em vez de [Null]. Está selecionado por padrão.
- Substituir por 0 (campos numéricos): está selecionado por padrão.
- Espaços em branco à esquerda e à direita está selecionado por padrão.
- Tabulações, quebras de linha e espaços em branco duplicados substituem qualquer ocorrência de espaços em branco por um só espaço, incluindo terminações de linha, tabulações, espaços múltiplos e outros espaços em branco consecutivos.
- Todos os espaços em branco remove qualquer ocorrência de espaços em branco.
- Letras remove todas as letras. Isso inclui letras fora do alfabeto latino.
A b Z À é ö
- Números remove todos os números.
- Pontuação remove os seguintes caracteres:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Selecione uma opção para alterar o uso de maiúsculas nos tipos de dados de cadeia de caracteres:
- Maiúsculas coloca em maiúsculo todas as letras de uma cadeia de caracteres.
- Minúsculas coloca em minúsculo todas as letras de uma cadeia de caracteres.
- Cada palavra iniciada por maiúscula coloca em maiúsculo a primeira letra de todas as palavras em uma cadeia de caracteres.