Ferramenta De Transformação

Last modified: June 02, 2020

Use a ferramenta Transformação para executar essas tarefas de preparação de dados:

  • Defina os tipos de dados.
  • Limpe os valores perdidos.
  • Selecione recursos.
  • Dados de codificação.

Você pode executar cada uma dessas tarefas em qualquer ordem. A ordem depende de como você quer preparar os dados.

Você tem que colocar ferramentas de transformação entre uma ferramenta de Modelagem Assistida e uma ferramenta de Classificação ou Regressão.

Definir tipos de dados

  1. Selecione Definir tipos de dados a partir do dropdown na seção Transformer.
  2. Na seção Parâmetros, os nomes dos recursos estão listados na coluna Recurso. Você pode selecionar qual tipo de dados um recurso deve ser a partir do dropdown na coluna Set Data Types. As opções atuais são Numérica, Categórica, Booleanee ID.

Limpar valores ausentes

  1. Selecione Limpar valores ausentes da queda na seção Transformer.
  2. Verifique as caixas ao lado de recursos com valores perdidos que deseja limpar.
  3. Selecione um método que deseja usar para limpar os valores perdidos:
Substituir pela média

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pela soma de todas as linhas de um recurso dividida pelo número total de linhas. Utilize esse método somente para dados numéricos. Essa opção é recomendada quando seus dados têm distribuição normal e não apresentam outliers.

Substituir pela mediana

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pelo número que representa o ponto médio na distribuição do seu recurso. Essa opção é recomendada quando seus dados são assimétricos ou apresentam outliers.

Substituir pela moda

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pelo número que ocorre com mais frequência. Essa opção é recomendada quando um recurso contém valores categóricos e você não deseja descartá-lo. Você também pode utilizar a moda para preencher valores numéricos ausentes.

Substituir pela constante

Se você selecionar essa opção, a Modelagem Assistida lê campos vazios como valores ausentes. Selecione essa opção se você acredita que o algoritmo de modelagem pode encontrar significado nos próprios valores ausentes, já que às vezes é possível encontrar padrões na ausência de dados. Você também pode selecionar essa opção se acredita que outros métodos de tratamento de dados ausentes poderiam causar um viés no seu modelo.

A ferramenta não limpará valores perdidos para recursos com caixas não marcadas. Se um recurso contém valores ausentes e você não escolher um método de limpeza, um erro ocorre a jusante no pipeline de aprendizagem de máquina.

Selecionar recursos

  1. Selecione Selecionar recursos da seção Desestateiro na seção Transformer.
  2. Se você não quiser incluir um recurso no modelo, desverifique a caixa ao lado do seu nome.

 

Codificação one-hot

  1. Selecione uma codificação quente a partir do dropdown na seção Transformer.
  2. Use o alternador para esconder características não codificadas.
  3. Verifique a caixa ao lado de recursos que deseja codificar em formato legível para máquina.
  4. Use o dropdown para selecionar como você deseja que a ferramenta para tratar os recursos codificados:
    • Ignore permite que a ferramenta Transformer marque os dados, tratando valores desconhecidos como constantes.
    • O erro diz à ferramenta Transformer para devolver um erro se encontrar valores desconhecidos.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.