Skip to main content

AutoML Tool Icon AutoML

Atenção

A ferramenta AutoML foi descontinuada no Intelligence Suite a partir da versão 2022.1. Recursos semelhantes de machine learning automatizado ainda estão disponíveis com o Alteryx Machine Learning .

Use a ferramenta AutoML como parte de um pipeline de machine learning para criar automaticamente um modelo a partir dos seus dados. A ferramenta fornece vários algoritmos para métodos de classificação e regressão e compara os algoritmos entre si antes de gerar um modelo treinado.

Requer o Alteryx Intelligence Suite

Esta ferramenta faz parte do Alteryx Intelligence Suite . O Intelligence Suite exige uma licença separada e um instalador complementar para o Designer. Depois de instalar o Designer, instale o Intelligence Suite e inicie sua avaliação gratuita .

Componentes da ferramenta

A ferramenta AutoML tem duas âncoras.

  1. Âncora de entrada: conecta-se aos dados que você deseja modelar por meio da ferramenta AutoML.

  2. Âncora de saída: transmite o objeto do modelo com as métricas de desempenho associadas para as etapas seguintes.

Configurar a ferramenta

Para usar a ferramenta AutoML, é necessário configurar opções para selecionar a variável-alvo que você deseja prever e o método de machine learning que deseja usar.

1. Alvo

Selecione uma opção na lista suspensa. As opções incluem todas as colunas presentes nos dados que você inseriu. O tipo de dados de cada coluna é exibido ao lado do nome.

2. Método de machine learning

A ferramenta AutoML seleciona automaticamente o melhor método de machine learning com base na variável-alvo selecionada. Os métodos de machine learning disponíveis são regressão e classificação. Você também tem a opção de selecionar manualmente qual método utilizar.

O método de regressão resolve problemas cujo objetivo é encontrar uma linha de tendência nos dados, como prever o crescimento do PIB. Você também pode usar algoritmos de regressão para descrever associações entre eventos. Por exemplo, você pode usar esse método para descobrir se as vendas de uma empresa sobem em relação ao número de vendedores contratados.

O método de classificação resolve problemas cujo objetivo é descobrir a que categoria um dado pertence, como prever de que espécie é uma flor. Os problemas de classificação são binários, com duas categorias, ou multiclasse, com mais de duas categorias. Muitas vezes, algoritmos diferentes são usados para resolver cada tipo de problema de classificação.

Configurar parâmetros avançados

A ferramenta AutoML apresenta diferentes opções que podem ser configuradas para alterar como a ferramenta avalia os algoritmos e seleciona um deles para criar o melhor modelo de machine learning.

1. Função-objetivo

Selecione uma função-objetivo para otimizar o desempenho do modelo. No menu suspenso, selecione para qual medida você deseja que a ferramenta otimize o modelo.

A função-objetivo é o que você deseja usar para determinar o ranking dos modelos que a ferramenta avalia. Funções-objetivo são medidas que você pode usar para determinar o quão adequado um modelo é para seu caso de uso.

2. Algoritmos

Selecione os tipos de algoritmos que você deseja avaliar como parte do processo de modelagem automática. Você pode selecionar mais de uma opção. Quanto mais tipos você seleciona, mais tempo o fluxo de trabalho leva para ser executado. Marque a caixa ao lado de cada algoritmo que deseja avaliar.

Floresta aleatória : esses algoritmos treinam modelos usando os resultados de um conjunto de árvores de decisão geradas aleatoriamente. O algoritmo tem melhor desempenho ao modelar associações não lineares entre classes. Esse método ajuda a evitar problemas de sobreajuste e subajuste, mas é computacionalmente caro.

XGBoost : esses algoritmos treinam modelos usando os resultados de um conjunto de árvores de decisão geradas aleatoriamente. Como resultado da capacidade de boosting desse algoritmo — um método pelo qual as árvores de decisão otimizam umas às outras —, ele é menos suscetível a sobreajuste e subajuste. O algoritmo XGBoost é mais útil quando você deseja usar muitos recursos diferentes para treinar o modelo.

Linear : esses algoritmos treinam o modelo traçando linhas através dos dados e encontrando o melhor ajuste ou dividindo-os em grupos. Esses algoritmos apresentam melhor desempenho ao modelar associações lineares ou tendências. Eles são computacionalmente eficientes, mas estão sujeitos a subajuste.

CatBoost : esse algoritmo treina um modelo usando os resultados de um conjunto de árvores de decisão. Esse algoritmo usa métodos de boosting similares ao XGBoost, mas tende a ser ainda menos propenso a sobreajuste. Em termos computacionais, o algoritmo é ainda mais caro que o XGBoost.

3. Máximo de pipelines de modelo para avaliação

Insira o número de pipelines que você deseja que a ferramenta AutoML construa, usando os algoritmos escolhidos, e avalie, com base na função-objetivo. Podem ser avaliados de 1 a 50 pipelines.

4. Habilitar verificações de dados

Para habilitar as verificações de dados, marque a caixa nesta seção. Usamos as verificações de dados padrão do EvalML .