AutoML

Warnung

Das AutoML-Tool in der Intelligence Suite wurde mit der Version 2022.1 als veraltet eingestuft. Ähnliche Funktionen für Machine Learning sind mit Alteryx Machine Learning weiterhin verfügbar.

Verwenden Sie das AutoML-Tool als Bestandteil einer Machine Learning-Pipeline, um automatisch ein Modell Ihrer Daten zu erstellen. Das Tool stellt mehrere Algorithmen für Klassifizierungs- und Regressionsmethoden zur Verfügung und wertet die Algorithmen dann gegeneinander aus, bevor es ein trainiertes Modell ausgibt.

Alteryx Intelligence Suite - Überblick

Dieses Tool ist Teil der Alteryx Intelligence Suite. Alteryx Intelligence Suite erfordert eine separate Lizenz und ein Add-on-Installationsprogramm für Designer. Nachdem Sie Designer installiert haben, installieren Sie Intelligence Suite und starten Sie Ihre kostenlose Testversion.

Tool-Komponenten

Das AutoML-Tool hat zwei Anker.

Eingabeanker: Der Eingabeanker stellt mit dem AutoML-Tool eine Verbindung zu den Daten her, die Sie modellieren möchten.
Ausgabeanker: Der Ausgabeanker leitet das Modellobjekt mit zugehörigen Leistungsmetriken nachgeschaltet weiter.

Tool-Konfiguration

Um das AutoML-Tool verwenden zu können, müssen Sie Optionen für das Ziel konfigurieren, das Sie vorhersagen möchten und welche Machine Learning-Methode Sie nutzen möchten.

1. Ziel

Wählen Sie eine Option aus dem Auswahlmenü aus. Die Auswahlmöglichkeiten umfassen alle Spalten aus den von Ihnen eingegebenen Daten. Der Datentyp jeder Spalte wird neben dem Spaltennamen angezeigt.

2. Machine Learning-Methode

Das AutoML-Tool wählt automatisch die beste Machine-Learning Methode auf Grundlage Ihres ausgewählten Ziels aus. Regression und Klassifizierung stehen als Machine Learning-Methoden zur Verfügung. Sie haben die Option, die Machine Learning-Methode manuell auszuwählen.

Die Regressionsmethode löst Probleme, bei denen das Ziel darin besteht, eine Trendlinie in den Daten zu finden, beispielsweise die Prognose des BIP-Wachstums. Sie können auch Regressionsalgorithmen verwenden, um Zusammenhänge (Assoziationen) zwischen Ereignissen zu beschreiben. Mit dieser Methode können Sie beispielsweise herausfinden, ob der Umsatz eines Unternehmens im Verhältnis zur Anzahl der vom Unternehmen beschäftigten Vertriebsmitarbeiter steigt.

Die Klassifizierungsmethode löst Probleme, bei denen das Ziel darin besteht, herauszufinden, zu welcher Kategorie ein Datenelement gehört, wie zum Beispiel welcher Spezies eine Blume angehört. Klassifizierungsprobleme sind entweder binär mit zwei Kategorien oder fallen in die Multiklasse mit mehr als zwei Kategorien. Oft werden verschiedene Algorithmen verwendet, um jede Art von Klassifizierungsproblem zu lösen.

Erweiterte Parameter konfigurieren

Das AutoML-Tool verfügt über verschiedene Optionen, die Sie konfigurieren können, um zu ändern, wie das Tool Algorithmen bewertet, und wählt dann eine aus, um das beste Machine Learning-Modell zu erstellen.

1. Zielfunktion

Wählen Sie eine Zielfunktion aus, um die Leistung des Modells zu optimieren. Wählen Sie aus dem Auswahlmenü aus, für welches Maß Sie das Tool optimieren möchten.

Die Zielfunktion bestimmt die Rangfolge der Modelle, die das Tool auswertet. Zielfunktionen sind Maße, mit denen Sie bestimmen können, wie optimal ein Modell für Ihren Anwendungsfall ist.

2. Algorithmen

Wählen Sie aus, welche Algorithmen Sie für die Automodellierung auswerten möchten. Sie können mehr als eine Option auswählen. Je mehr Typen Sie auswählen, um so länger dauert die Ausführung des Workflows. Aktivieren Sie das Kontrollkästchen neben jedem Algorithmus, den Sie auswerten möchten.

Forest-Zufallsfunktion: Algorithmen der Forest-Zufallsfunktion trainieren Modelle mit den Ergebnissen eines Ensembles aus zufällig generierten Entscheidungsbäumen. Der Algorithmus erzielt die beste Leistung bei der Modellierung nicht-linearer Assoziationen zwischen Klassen. Die Ensemble-Methode hilft, Probleme der Über- und Unteranpassung zu vermeiden, ist aber rechnerisch anspruchsvoll.

XGBoost: XGBoost-Algorithmen trainieren Modelle mit den Ergebnissen eines Ensembles aus zufällig generierten Entscheidungsbäumen. Dank der Boost-Funktion des Algorithmus, eine Methode, durch die sich Entscheidungsbäume gegenseitig verbessern, ist er weniger anfällig für Über- und Unteranpassung. Der XGBoost-Algorithmus ist am hilfreichsten, wenn Sie viele verschiedene Eigenschaften zum Trainieren des Modells verwenden möchten.

Linear: Lineare Algorithmen trainieren Modelle, indem sie Linien durch die Daten ziehen, die beste Anpassung finden oder die Daten in Gruppen unterteilen. Diese Algorithmen erzielen die beste Leistung bei der Modellierung von linearen Assoziationen oder Trends. Sie sind zwar in der Regel rechnerisch effizient, neigen aber zur Unteranpassung.

CatBoost: CatBoost-Algorithmen trainieren Modelle mit den Ergebnissen eines Ensembles aus Entscheidungsbäumen. Dieser Algorithmus verwendet ähnliche Boosting-Methoden wie XGBoost, neigt aber noch weniger zur Überanpassung. Dieser Algorithmus ist sogar noch rechenintensiver als XGBoost.

3. Maximal zu bewertende Modellpipelines

Geben Sie die Anzahl der Pipelines ein, die das AutoML-Tool unter Verwendung der gewählten Algorithmen erstellen und anschließend anhand der Zielfunktion bewerten soll. Sie können 1 - 50 Pipelines auswerten.

4. Datenprüfungen aktivieren

Aktivieren Sie das Kontrollkästchen in diesem Abschnitt, um Datenprüfungen zu aktivieren. Wir verwenden die Standard-Datenprüfungen von EvalML.