Transformation Tool icon

Ferramenta Transformação

Versão:
2022.3
Last modified: January 21, 2022

Use a ferramenta Transformação para executar estas tarefas de preparação de dados:

  • Definir tipos de dados.
  • Limpar valores ausentes.
  • Selecionar recursos.
  • Codificar dados.

Você pode executar essas tarefas na ordem que desejar. Isso depende de como você quer preparar os dados.

As ferramentas Transformação devem ser colocadas entre a ferramenta Modelagem Assistida e a ferramenta Classificação ou Regressão.

Definir tipos de dados

  1. No menu suspenso da seção Transformador, selecione Definir tipos de dados.
  2. Na seção Parâmetros, os nomes dos recursos (variáveis independentes) estão listados na coluna Recurso. Você pode selecionar o tipo de dados para um recurso a partir do menu suspenso na coluna Definir tipos de dados. As opções são Numérico, Categórico, Booleano e ID.

Limpar valores ausentes

  1. No menu suspenso da seção Transformador, selecione Limpar valores ausentes.
  2. Marque a caixa de seleção ao lado dos recursos com valores ausentes que você deseja limpar.
  3. Selecione um dos métodos para remover os valores ausentes:

 

Substituir pela média

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pela soma de todas as linhas de um recurso dividida pelo número total de linhas. Utilize esse método somente para dados numéricos. Essa opção é recomendada quando seus dados têm distribuição normal e não apresentam outliers.

Substituir pela mediana

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pelo número que representa o ponto médio na distribuição do seu recurso. Essa opção é recomendada quando seus dados são assimétricos ou apresentam outliers.

Substituir pela moda

Se você selecionar essa opção, a Modelagem Assistida substitui os valores ausentes pelo número que ocorre com mais frequência. Essa opção é recomendada quando um recurso contém valores categóricos e você não deseja descartá-lo. Você também pode utilizar a moda para preencher valores numéricos ausentes.

Substituir pela constante

Se você selecionar essa opção, a Modelagem Assistida lê campos vazios como valores ausentes. Selecione essa opção se você acredita que o algoritmo de modelagem pode encontrar significado nos próprios valores ausentes, já que às vezes é possível encontrar padrões na ausência de dados. Você também pode selecionar essa opção se acredita que outros métodos de tratamento de dados ausentes poderiam causar um viés no seu modelo.

Se a caixa de seleção ao lado de um recurso não estiver marcada, a ferramenta não remove os valores ausentes para aquele recurso. Se um recurso contém valores ausentes, mas você não escolhe um método de limpeza para ele, um erro é gerado no pipeline de machine learning.

Selecionar recursos

  1. No menu suspenso da seção Transformador, selecione Selecionar recursos.
  2. Se você não quiser incluir um recurso no modelo, desmarque a caixa de seleção ao lado do respectivo nome.

Codificação one-hot

  1. No menu suspenso da seção Transformador, selecione Codificação one-hot.
  2. Use o botão de alternância para Ocultar recursos não codificáveis.
  3. Marque a caixa de seleção ao lado dos recursos que você desejar codificar em um formato legível por máquina.
  4. Use o menu suspenso para selecionar como a ferramenta deve tratar os recursos codificados:
    • Selecionar a opção Ignorar permite que a ferramenta Transformação pontue os dados, tratando valores desconhecidos como constantes.
    • Selecionar a opção Erro diz à ferramenta Transformação para gerar um erro caso encontre valores desconhecidos.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.