Skip to main content

Ferramentas de preparação de dados do fluxo de trabalho

As ferramentas de preparação de dados do fluxo de trabalho oferecem suporte à amostragem, limpeza e filtragem dos seus dados no Designer Cloud.

Ferramentas de preparação de dados do fluxo de trabalho

Item

Descrição

Auto Column Tool

Use Auto Column to automatically change the column type and size for efficient storage of string data.

Create Samples Tool

Use Create Sample to split the input records into 2 or 3 random samples.

Ferramenta Limpeza de Dados

Use a ferramenta Limpeza de Dados para corrigir problemas comuns de qualidade dos dados. Você pode substituir valores nulos, remover pontuação, modificar o uso de maiúsculas e muito mais.

Ferramenta Filtrar

Use a ferramenta Filtrar para selecionar dados usando uma condição.

Ferramenta Fórmula

Use a ferramenta Fórmula para criar uma nova coluna ou atualizar uma coluna existente utilizando uma ou mais expressões para executar uma variedade de cálculos e operações.

Generate Rows Tool

Use Generate Rows to create new rows of data with an expression.

Imputation Tool

Use Imputation to clean up missing values in your data.

Multi-Column Binning Tool

Use Multi-Column Binning to tile or bin on multiple columns.

Ferramenta Fórmula de Múltiplas Colunas

Use a ferramenta Fórmula de Múltiplas Colunas para criar ou atualizar várias colunas usando uma única expressão.

Multi-Row Formula Tool

Use Multi-Row Formula to create and update columns by using row data to create formulas.

Oversample Column Tool

Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling.

Ferramenta Amostra em % Aleatória

Use a ferramenta Amostra em % Aleatória para retornar um número esperado de linhas que resultam em uma amostra aleatória do fluxo de dados de entrada.

Ferramenta ID de Linha

Use a ferramenta ID de Linha para criar uma nova coluna e atribuir um identificador exclusivo que aumenta sequencialmente para cada linha nos dados.

Ferramenta Amostra

Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.

Ferramenta Amostra

Use a ferramenta Selecionar para incluir, excluir e reordenar as colunas de dados que passam pelo fluxo de trabalho.

Ferramenta Selecionar Linhas

Use a ferramenta Selecionar Linhas para retornar linhas e intervalos de linhas especificados, incluindo intervalos descontínuos. Essa ferramenta é útil para solução de problemas e amostragem.

Ferramenta Ordenar

Use a ferramenta Ordenar para organizar as linhas de uma tabela em ordem alfanumérica com base nos valores dos campos de dados especificados.

Ferramenta Bloco

Use a ferramenta Bloco para atribuir um valor (bloco) com base em intervalos nos dados. A ferramenta faz isso com base na escolha do usuário, que especifica um de três métodos.

Ferramenta Exclusivo

Use a ferramenta Exclusivo para distinguir se uma linha é única ou uma duplicata agrupando uma ou mais colunas especificadas e, depois, classificando essas colunas.