Preparação
Defina o tipo de campo para o menor tamanho possível em relação aos dados contidos na coluna.
Divida os registros de entrada em duas ou três amostras aleatórias.
Corrija problemas comuns de qualidade dos dados, incluindo valores nulos e caracteres indesejados. Modifique maiúsculas/minúsculas.
Use a ferramenta Filtrar para selecionar dados usando uma condição. As linhas de dados que atendem à condição são enviadas para a âncora Verdadeiro (T).
A ferramenta Fórmula usa expressões para criar e atualizar colunas.
A ferramenta Gerar Linhas cria novas linhas de dados no nível de registro.
A ferramenta Imputação permite ao usuário substituir valores em campos de dados numéricos.
Essa ferramenta permite que um usuário crie blocos ou compartimentos (bins) com base em múltiplos campos.
A ferramenta Fórmula de Múltiplos Campos cria ou atualiza vários campos usando uma única expressão.
Essa ferramenta usa dados de linha em expressões para criar e atualizar colunas.
Essa ferramenta permite que dados com alta porcentagem de respostas negativas sejam normalizados.
Retorna uma amostra aleatória do fluxo de dados de entrada.
Use a ferramenta ID de Registro para criar uma nova coluna e atribuir um identificador exclusivo, que aumenta sequencialmente, para cada registro nos dados.
Essa ferramenta limita o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado.
Essa ferramenta retorna registros e intervalos de registros especificados,
A ferramenta Selecionar inclui, exclui e reordena as colunas de dados que passam por um fluxo de trabalho.
Use a ferramenta Ordenar para organizar os registros de uma tabela em ordem alfanumérica com base nos valores dos campos de dados especificados.
Essa ferramenta usa métodos especificados pelo usuário para atribuir um valor (bloco) com base em intervalos nos dados.
Essa ferramenta distingue se um registro de dados é único ou uma duplicata com base em campos especificados.