Skip to main content

Preparação

Prepare os dados para análise posterior.

Item

Descrição

Ferramenta Coluna Automática

Use a ferramenta Coluna Automática para alterar automaticamente o tipo e o tamanho das colunas para armazenar dados de cadeia de caracteres de maneira eficiente.

Ferramenta Criar Amostras

Use a ferramenta Criar Amostra para dividir os registros de entrada em duas ou três amostras aleatórias.

Ferramenta Limpeza de Dados Pro

Use a ferramenta Limpeza de Dados Pro para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação e tags HTML, modificar o uso de maiúsculas e muito mais.

Ferramenta Limpeza de Dados

Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.

Ferramenta Filtrar

Use a ferramenta Filtrar para selecionar dados usando uma condição.

Ferramenta Fórmula

Use a ferramenta Fórmula para criar uma nova coluna ou atualizar uma coluna existente utilizando uma ou mais expressões para executar uma variedade de cálculos e operações.

Ferramenta Gerar Linhas

Use a ferramenta Gerar Linhas para criar novas linhas de dados usando uma expressão.

Imputation Tool

Use a ferramenta Imputação para limpar valores ausentes de seus dados.

Multi-Column Binning Tool

Use a ferramenta Agrupamento de Múltiplas Colunas para organizar blocos ou compartimentos em múltiplas colunas.

Ferramenta Fórmula de Múltiplas Colunas

Use a ferramenta Fórmula de Múltiplas Colunas para criar ou atualizar várias colunas usando uma única expressão.

Multi-Row Formula Tool

Use a ferramenta Fórmula de Múltiplas Linhas para criar e atualizar colunas usando dados da linha para criar fórmulas.

Oversample Column Tool

Use a ferramenta Coluna de Superamostragem para criar amostras equilibradas automaticamente a partir de dados desequilibrados para uso em modelagem estatística.

Ferramenta Amostra em % Aleatória

Use a ferramenta Amostra em % Aleatória para retornar um número esperado de linhas que resultam em uma amostra aleatória do fluxo de dados de entrada.

Ferramenta RankearThis document has been filtered out. Following attributes were used for filtering: <strong>audience</strong> (<i>Standard Mode</i>).

Use a ferramenta Ranquear para ranquear seus dados para processamento ou para saída.

Ferramenta ID de Linha

Use a ferramenta ID de Linha para criar uma nova coluna e atribuir um identificador exclusivo que aumenta sequencialmente para cada linha nos dados.

Ferramenta Amostra

Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.

Ferramenta Selecionar

Use a ferramenta Selecionar para incluir, excluir e reordenar as colunas de dados que passam pelo fluxo de trabalho.

Ferramenta Selecionar Linhas

Use a ferramenta Selecionar Linhas para retornar linhas e intervalos de linhas especificados, incluindo intervalos descontínuos. Essa ferramenta é útil para solução de problemas e amostragem.

Ferramenta Ordenar

Use a ferramenta Ordenar para organizar as linhas de uma tabela em ordem alfanumérica com base nos valores dos campos de dados especificados.

Ferramenta Bloco

Use a ferramenta Bloco para atribuir um valor (bloco) com base em intervalos nos dados. A ferramenta faz isso com base na escolha do usuário, que especifica um de três métodos.

Ferramenta Exclusivo

Use a ferramenta Exclusivo para distinguir se uma linha é única ou uma duplicata agrupando uma ou mais colunas especificadas e, depois, classificando essas colunas.