Skip to main content

Preparação

Prepare os dados para análise posterior.

Item

Descrição

Ferramenta Criar Amostras

Use a ferramenta Criar Amostra para dividir os registros de entrada em duas ou três amostras aleatórias.

Ferramenta Limpeza de Dados

Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.

Ferramenta Filtrar

Use a ferramenta Filtrar para selecionar dados usando uma condição.

Ferramenta Fórmula

Use a ferramenta Fórmula para criar uma nova coluna ou atualizar uma coluna existente utilizando uma ou mais expressões para executar uma variedade de cálculos e operações.

Imputation Tool

Use a ferramenta Imputação para limpar valores ausentes de seus dados.

Multi-Column Binning Tool

Use a ferramenta Agrupamento de Múltiplas Colunas para organizar blocos ou compartimentos em múltiplas colunas.

Ferramenta Fórmula de Múltiplas Colunas

Use a ferramenta Fórmula de Múltiplas Colunas para criar ou atualizar várias colunas usando uma única expressão.

Oversample Column Tool

Use a ferramenta Coluna de Superamostragem para criar amostras equilibradas automaticamente a partir de dados desequilibrados para uso em modelagem estatística.

Ferramenta Amostra em % Aleatória

Use a ferramenta Amostra em % Aleatória para retornar um número esperado de linhas que resultam em uma amostra aleatória do fluxo de dados de entrada.

Ferramenta ID de Linha

Use a ferramenta ID de Linha para criar uma nova coluna e atribuir um identificador exclusivo que aumenta sequencialmente para cada linha nos dados.

Ferramenta Amostra

Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.

Ferramenta Selecionar

Use a ferramenta Selecionar para incluir, excluir e reordenar as colunas de dados que passam pelo fluxo de trabalho.

Ferramenta Selecionar Linhas

Use a ferramenta Selecionar Linhas para retornar linhas e intervalos de linhas especificados, incluindo intervalos descontínuos. Essa ferramenta é útil para solução de problemas e amostragem.

Ferramenta Ordenar

Use a ferramenta Ordenar para organizar as linhas de uma tabela em ordem alfanumérica com base nos valores dos campos de dados especificados.

Ferramenta Bloco

Use a ferramenta Bloco para atribuir um valor (bloco) com base em intervalos nos dados. A ferramenta faz isso com base na escolha do usuário, que especifica um de três métodos.

Ferramenta Exclusivo

Use a ferramenta Exclusivo para distinguir se uma linha é única ou uma duplicata agrupando uma ou mais colunas especificadas e, depois, classificando essas colunas.