Assistierte Modellierung

Verwenden Sie die Option Mit Assistenz, um Hilfe beim Erstellen von Machine Learning-Modellen zu erhalten. Diese führt Sie Schritt für Schritt durch einen Prozess, der die Auswahl eines Ziels und einer Machine Learning-Methode, die Einstellung von Datentypen, Bereinigung fehlender Werte, Auswahl von Features und die Ermittlung des besten Algorithmus umfasst. Wenn Sie sich nicht sicher sind, welcher Algorithmus der beste ist, können Sie mit der Assistierten Modellierung die Algorithmen in der Rangliste vergleichen. Danach können Sie dem Designer-Canvas eine Pipeline hinzufügen, die alle Machine Learning-Tools enthält, die Sie zum Trainieren des Modells verwendet haben.

Wichtig

Bevor Sie die Assistierte Modellierung verwenden können, müssen Sie Ihre Daten mit dem Eingabedaten-Tool in Designer einlesen und sie dann mit dem Assistierte-Modellierung-Tool verbinden. Nachdem Sie Ausführen ausgewählt haben, können Sie im Konfigurationsfenster die Option Assistierte Modellierung starten auswählen.

1. Ziel und Machine Learning-Methode auswählen

Wählen Sie ein Ziel aus und lassen Sie die Assistierte Modellierung die Machine Learning-Methode auswählen, die Sie zur Prognose des Ziels verwenden möchten.

Im Abschnitt Verfügbare Ziele werden die Namen von Eigenschaften im Datensatz aufgelistet. Wählen Sie die Eigenschaft aus, die Sie als Ziel festlegen möchten.
Die Assistierte Modellierung erkennt automatisch, ob das Ziel kategoriale oder numerische Daten enthält, und wählt die entsprechende Machine Learning-Methode aus.
Wählen Sie Weiter, um zu Schritt 2: Automatisierungsstufe auswählen zu gehen.

Wichtig

Die Assistierte Modellierung stellt sicher, dass Sie das richtige Ziel ausgewählt haben, bevor Sie zum nächsten Schritt wechseln. Danach können Sie das Ziel nicht mehr ändern, ohne den gesamten Prozess neu zu starten. Wählen Sie Weiter, wenn Sie das richtige Ziel ausgewählt haben.

2. Automatisierungsstufe auswählen

Wählen Sie aus, ob das Tool die Machine Learning-Pipeline für Sie aufbauen oder die Assistierte Modellierung Sie Schritt für Schritt durch den Prozess führen soll.

Wählen Sie die Option Schritt für Schritt oder Automatisch aus.
Wählen Sie Weiter.

Wenn Sie Schritt für Schritt wählen, fährt die Assistierte Modellierung fort mit Schritt 3: Datentypen festlegen.

Wenn Sie die Option Automatisch wählen, durchläuft die Assistierte Modellierung automatisch die Schritte zum Aufbau der Machine Learning-Pipeline: Sie legt Datentypen fest, bereinigt fehlende Werte, wählt Features und Algorithmen aus. Wenn das Tool die Erstellung der Modelle abgeschlossen hat, können Sie die Ausgabe in der Rangliste sehen.

3. Datentypen festlegen

Die Assistierte Modellierung legt den Datentyp für jede Eigenschaft fest. Es wird ein empfohlener Datentyp in der Datentyp-Spalte angezeigt. Die empfohlene Option ist beschriftet (z. B. Numerisch (empfohlen)).

Wählen Sie eine Eigenschaft aus, um Informationen dazu im Abschnitt Spaltendetails anzuzeigen. Dort können Sie Datentyp-Wahrscheinlichkeiten sehen, die anzeigen, wie sicher die Assistierte Modellierung ist, dass es sich bei einer Eigenschaft um einen bestimmten Datentyp handelt. Sie können auch eine Vorschau sehen, die ein Beispiel der Daten enthält. Verwenden Sie diese Informationen, um sicherzustellen, dass die Datentypen richtig eingestellt sind.
Wenn es sich bei einer Eigenschaft um den falschen Datentyp handelt, verwenden Sie das Auswahlmenü in der Spalte Datentyp, um den richtigen Datentyp auszuwählen.
Wählen Sie Weiter, um zu Schritt 4: Bereinigen fehlender Werte zu gehen.

Tipp

Wenn Sie sich nicht sicher sind, was ein Begriff bedeutet, überprüfen Sie ihn im Glossarabschnitt der Assistierten Modellierung. Der Abschnitt enthält hilfreiche Informationen über viele der gängigen Begriffe, die von Datenwissenschaftlern verwendet werden.

4. Bereinigen fehlender Werte

Die Assistierte Modellierung bereinigt die fehlenden Werte in den Daten. Für alle Eigenschaften, die fehlende Werte enthalten, wird in der Spalte Methode eine empfohlene Methode zur Bereinigung fehlender Werte angezeigt. Die empfohlene Option ist beschriftet (z. B. Ersetzen mit Medianwert (empfohlen)).

Wählen Sie eine Eigenschaft aus, um Informationen dazu im Abschnitt Spaltendetails anzuzeigen. Dort sehen Sie die Bereinigungsmethode, die erläutert, wie die Assistierte Modellierung die Methode zum Bereinigen der fehlenden Daten auswählt. Sie können auch eine Vorschau sehen, die ein Beispiel der Daten enthält. Verwenden Sie diese Informationen, um sicherzustellen, dass Sie die richtige Methode verwenden, um fehlende Werte zu behandeln.
Wenn Sie eine andere Bereinigungsmethode verwenden möchten, verwenden Sie das Auswahlmenü in der Spalte Methode, um die richtige Bereinigungsmethode auszuwählen.
Wählen Sie Weiter, um zu Schritt 5: Features auswählen zu gehen.

5. Eigenschaften auswählen

Die Assistierte Modellierung wählt aus, welche Eigenschaften zum besten Modell führen. Für jede Eigenschaft wird ausgewertet, ob es sich um einen guten Prädiktor in der Spalte Eigenschaftsinfo handelt.

Wählen Sie eine Eigenschaft aus, um Informationen dazu im Abschnitt Spaltendetails anzuzeigen. Dort können Sie Prädiktor-Details sehen, die zwei Messgrößen für die Leistung der Eigenschaft bereitstellt: Gini und GKT. Bei der Assistierten Modellierung werden beide Maße verwendet, um festzustellen, ob die Eigenschaft zu stark oder zu schwach mit dem Ziel verbunden ist. Sie können auch eine Vorschau sehen, die ein Beispiel der Daten enthält. Verwenden Sie diese Informationen, um sicherzustellen, dass Eigenschaften gute Prädiktoren sind.
Wenn Sie eine Eigenschaft nicht verwenden möchten, deaktivieren Sie das Kontrollkästchen neben dem Namen dieser Eigenschaft.
Wählen Sie Weiter, um zu Schritt 6: Algorithmen auswählen zu gehen.

6. Algorithmen auswählen

Assistierte Modellierung bietet Ihnen eine Reihe von Algorithmen zur Auswahl. Sie empfiehlt verschiedene Algorithmen, je nachdem, welche Art von Problem Sie lösen möchten. In diesem Schritt wählen Sie aus, welche Algorithmen Sie in der Rangliste bewerten möchten.

Die Karte für jeden Algorithmus zeigt dessen Vor- und Nachteile, eine Beschreibung und einige Anwendungsfälle. Verwenden Sie diese Informationen, um sicherzustellen, dass Sie den Algorithmus auswerten möchten.
1. Für kategoriale Variablen stellt das Tool vier Algorithmen zur Verfügung:
  1. Logistische Regression
  2. Entscheidungsbaum
  3. Forest-Zufallsfunktion
  4. XGBoost
2. Für kontinuierliche Variablen (numerisch) stellt das Tool drei Algorithmen zur Verfügung:
  1. Lineare Regression
  2. Entscheidungsbaum
  3. Forest-Zufallsfunktion
Um einen Algorithmus auszuwerten, aktivieren Sie das Kontrollkästchen neben dessen Namen. Wenn Sie einen Algorithmus nicht auswerten möchten, deaktivieren Sie das Kontrollkästchen.
Wählen Sie Ausführen ausgewählter Algorithmen aus.

Die Rangliste

Die Assistierte Modellierung generiert die Rangliste, mit der Sie die Leistung der ausgewählten Algorithmen vergleichen können.

Die Ausgabe in der Rangliste ist unterschiedlich, je nachdem, welche Art von Problem Sie lösen, aber hier sind die Grundlagen für die Navigation in der Benutzeroberfläche:

Um spezifische Informationen zu einem Algorithmus anzuzeigen, wählen Sie dessen Karte im Ranglisten-Abschnitt aus.
Um Informationen darüber anzuzeigen, wie ein Algorithmus im Vergleich zu den anderen Algorithmen abgeschnitten hat, wählen Sie die Registerkarte Vergleich aus.
Um Informationen zur individuellen Leistung eines Algorithmus anzuzeigen, wählen Sie die Registerkarte Überblick aus.
Um zu sehen, welche Eigenschaften von einem Algorithmus am meisten beachtet werden, wählen Sie die Registerkarte Interpretation.
Um sich an die Entscheidungen zu erinnern, die Sie während des gesamten Prozesses der Assistierten Modellierung getroffen haben, wählen Sie die Registerkarte Konfiguration.
Um mit der Assistierten Modellierung von vorne zu beginnen, aber die Informationen in der Rangliste beizubehalten, wählen Sie Neues Modell erstellen.
Um die Rangliste ein- oder auszublenden, wählen Sie Rangliste anzeigen oder Rangliste ausblenden aus.

Nachdem Sie ermittelt haben, welche Algorithmen die beste Leistung erbringen, können Sie auswählen, welche Sie als Teil einer Machine Learning-Pipeline, die das Modell trainiert, dem Designer-Canvas hinzufügen möchten:

Aktivieren Sie das Kontrollkästchen neben dem Namen des Algorithmus, den Sie dem Canvas hinzufügen möchten. Sie sollten die Anzahl der Algorithmen sehen, die Sie ausgewählt haben.
Wählen Sie Modelle hinzufügen und mit dem Workflow fortfahren.

Sie können einen Bericht exportieren, der die Ergebnisse des Modells enthält.

Wählen Sie das Dreipunktmenü aus.
Wählen Sie im Auswahlmenü HTML-Bericht exportieren.
Wählen Sie mit dem Datei-Explorer aus, wo Sie den Bericht speichern möchten.

Sie können den Code für die Machine Learning-Pipeline in ein Jupyter Notebook in ein Python Tool exportieren.

Wählen Sie das Dreipunktsymbol aus.
Wählen Sie im Auswahlmenü Modell nach Python exportieren.
Wenn Sie das Fenster für die Assistierte Modellierung verlassen, erscheint ein Python-Tool im Workflow. Es enthält ein mit Anmerkungen versehenes Jupyter Notebook mit dem vollständigen Code für die Machine Learning-Pipeline.