Skip to main content

AutoML Tool Icon AutoML

Avvertimento

Lo strumento AutoML in Intelligence Suite è stato deprecato a partire dalla versione 2022.1. Funzionalità di Machine Learning simili sono ancora disponibili con Alteryx Machine Learning .

Utilizza AutoML come parte di una pipeline di Machine Learning per creare automaticamente un modello dei dati. Lo strumento fornisce diversi algoritmi sia per i metodi di classificazione che per i metodi di regressione, quindi valuta gli algoritmi l'uno rispetto all'altro prima di emettere un modello preparato.

Alteryx Intelligence Suite necessario

Questo strumento fa parte di Alteryx Intelligence Suite . Intelligence Suite richiede una licenza separata e un ulteriore programma di installazione per Designer. Dopo aver installato Designer, installa Intelligence Suite e avvia la versione di prova gratuita .

Componenti dello strumento

Lo strumento AutoML ha 2 ancoraggi:

  1. Ancoraggio di input: l'ancoraggio di input si connette ai dati che desideri modellare tramite lo strumento AutoML.

  2. Ancoraggio di output: l'ancoraggio di output passa l'oggetto modello con metriche di prestazione associate a valle.

Configura lo strumento

Per utilizzare lo strumento AutoML, devi configurare le opzioni per il target da prevedere e il metodo di Machine Learning da utilizzare.

1. Target

Seleziona un'opzione dal menu a discesa. Le opzioni includono tutte le colonne dei dati immessi. Il tipo di dati di ciascuna colonna viene visualizzato accanto al nome.

2. Metodo di Machine Learning

Lo strumento AutoML seleziona automaticamente il metodo di Machine Learning migliore in base al target selezionato. I metodi di Machine Learning disponibili sono la regressione e la classificazione. È possibile selezionare manualmente il metodo di Machine Learning.

Il metodo di regressione risolve i problemi in cui l'obiettivo è trovare una linea di tendenza nei dati, ad esempio prevedere la crescita del PIL. È inoltre possibile utilizzare algoritmi di regressione per descrivere le associazioni tra eventi. Ad esempio, è possibile utilizzare questo metodo per scoprire se le vendite di un'azienda sono in aumento rispetto al numero di addetti alle vendite dell'azienda.

Il metodo di classificazione risolve i problemi in cui l'obiettivo è capire a quale categoria appartiene un dato, ad esempio a quale specie appartiene un fiore. I problemi di classificazione sono binari, con 2 categorie, o multiclasse, con più di 2 categorie. Spesso, vengono utilizzati algoritmi diversi per risolvere ciascun tipo di problema di classificazione.

Configurazione di parametri avanzati

Lo strumento AutoML dispone di diverse opzioni che è possibile configurare per modificare il modo in cui lo strumento valuta gli algoritmi e quindi ne seleziona uno per creare il miglior modello di Machine Learning.

1. Funzione obiettivo

Seleziona una funzione obiettivo per ottimizzare le prestazioni del modello. Nel menu a discesa, seleziona la misura per cui desideri ottimizzare lo strumento.

La funzione obiettivo è l'opzione da utilizzare per determinare la classificazione dei modelli valutati dallo strumento. Le funzioni obiettivo sono misure che è possibile utilizzare per determinare quanto è ottimale un modello per il caso di utilizzo.

2. Algoritmi

Seleziona quali tipi di algoritmi valutare come parte del processo di modellazione automatica. È possibile selezionare più di un'opzione. Più tipi si selezionano, maggiore sarà il tempo per l'esecuzione del flusso di lavoro. Seleziona la casella accanto a ciascun algoritmo che desideri valutare.

Foresta casuale : gli algoritmi a foresta casuale preparano i modelli utilizzando i risultati di un insieme di alberi decisionali generati casualmente. L'algoritmo offre le prestazioni migliori durante la modellazione di associazioni non lineari tra classi. Il metodo ensemble è utile per evitare problemi di overfitting e underfitting, ma è costoso a livello computazionale.

XGBoost : gli algoritmi XGBoost preparano i modelli utilizzando i risultati di un insieme di alberi decisionali generati casualmente. Grazie alla capacità d'incremento dell'algoritmo (un metodo per cui gli alberi decisionali migliorano l'uno con l'altro) è meno suscettibile all'overfitting e all'underfitting. L'algoritmo XGBoost è più utile quando si utilizzano molte funzionalità differenti per formare il modello.

Lineare : gli algoritmi lineari preparano il modello disegnando linee attraverso i dati, trovando la migliore misura o dividendolo in gruppi. Questi algoritmi offrono le prestazioni migliori durante la modellazione di associazioni lineari o tendenze. Tendono ad essere efficienti a livello computazionale, ma sono soggetti all'underfitting.

CatBoost : gli algoritmi CatBoost preparano il modello utilizzando i risultati di un insieme di alberi decisionali. Questo algoritmo utilizza metodi di incremento simili a quelli di XGBoost, ma tende ad essere meno soggetto all'overfitting. Questo algoritmo è ancora più costoso a livello computazionale rispetto a XGBoost.

3. Numero massimo pipeline del modello da valutare

Immetti il numero di pipeline che desideri creare con lo strumento AutoML, utilizzando gli algoritmi scelti, quindi valutarle in base alla funzione obiettivo. È possibile valutare 1–50 pipeline.

4. Abilita controlli sui dati

Per attivare i controlli dei dati, seleziona la casella in questa sezione. Utilizziamo i controlli sui dati predefiniti da EvalML .