One-Tool-Beispiel
Für das Prognosegütediagramm gibt es ein One-Tool-Beispiel. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Das Prognosegütediagramm-Tool erzeugt ein kumulativ erfasstes Antwortdiagramm (auch bekannt als „Zuwachsdiagramm“) und ein inkrementelles Antwortratendiagramm, die für die visuelle Bewertung der Vergleichsgenauigkeit verschiedener binärer (d. h. ja/nein) Klassifizierungsmodelle zum Prognostizieren neuer Daten oder zum Bewerten der erwarteten wirtschaftlichen Auswirkungen durch die Verwendung eines Prognosemodells in einem Geschäftsprozess verwendet werden.
Beide Diagramme basieren auf der Aggregation von Daten in 10 Gruppen (Dezile), die auf Grundlage der vorhergesagten Wahrscheinlichkeit einer positiven Antwort für die einzelnen Modelle geordnet werden. Anschließend wird diese Antwort mit dem erwarteten Ergebnis einer zufälligen Auswahl von Interessenten verglichen. Im Falle des kumulativen Antwortdiagramms untersucht das Diagramm, welcher Prozentsatz der Gesamtantwort, die beim Kontaktieren aller Kunden in der Datenbank einer Organisation erreicht werden würde, erreicht wird, wenn basierend auf Modellprognosen die besten 10 Prozent, 20 Prozent usw. kontaktiert werden. Die x-Achse (horizontal) des Diagramms entspricht dem Prozentsatz der kontaktierten Datenbank, während die y-Achse (vertikal) dem Prozentsatz der Gesamtantwort entspricht, die erfasst wird, indem die Datenbank basierend auf dem Modell bis zum „besten“ Dezil durchlaufen wird.
Beispielsweise können die besten 20 Prozent der Interessenten basierend auf dem Modell 50 Prozent der positiven Antwort darstellen, die beim Kontaktieren aller Interessenten erreicht werden würde. Das inkrementelle Antwortratendiagramm liefert die positive Antwortrate für alle modellbasierten, geordneten Dezilgruppen in der Datenbank. Zudem erzeugt das Tool eine Zuwachstabelle und Kennzahlen für den Bereich unterhalb der Kurve sowie den Gini-Koeffizienten, um bei Auswahl der Option für das kumulativ erfasste Antwortdiagramm vergleichende Gesamtmetriken zur Leistung verschiedener Modelle bereitzustellen und um bei Auswahl der Option für die inkrementelle Antwortrate für jedes Modell eine Tabelle mit Antwortraten bei unterschiedlichen Dezilen bereitzustellen.
Dieses Tool verwendet das R-Tool. Navigieren Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Siehe Prognose-Tools herunterladen und verwenden.
Das Tool erfordert ...
Binäre Klassifizierungsmodelle, wie das Neuronales-Netzwerk-Tool, dasEntscheidungsbaum-Modell-Tool, #forest-modell-tooldas Forest-Modell-Tool, das Boosting-Modell-Tool, das Spline-Modell-Tooloder das Schrittweise-Tool, wurden in einem einzelnen Datenstrom vereint.
Ein Alteryx-Datenstrom oder ein XDF-Metadatenstrom, der mit dem Modellobjekt konsistent ist (bezüglich Feldnamen und Feldtypen). Alle haben dieselbe binäre Zielvariable.
Prognosegütediagramm-Typ: Wählen Sie das gesamt kumulative Antwortdiagramm oder das inkrementelle Antwortratendiagramm aus.
Wahre Antwortrate (sollte zwischen 0 und 1 liegen): Die zum Erstellen eines Prognosemodells verwendete Datenbank ist oftmals „überrepräsentiert“, um den Prozentsatz der Beobachtungen mit einer der beiden Zielantwortkategorien zu erhöhen. Bei Angabe der wahren (originalen) Antwortrate der Zielvariablen berücksichtigt das erstellte Prognosegütediagramm die Überquotierung einer Ebene des Ziels. Wenn es kein Oversampling gibt, sollte der Wert dieser Option der Antwortrate der zum Entwickeln der Modelle verwendeten Datenbank entsprechen.
Zielebene (Beschriftung für die gewünschte Antwort der Zielvariablen): Diese Option ermöglicht die Erstellung eines mit dem Entscheidungskontext konsistenten Prognosegütediagramms und die Fehlerprüfung, um sicherzustellen, dass das erstellte Diagramm relevant ist.
Stichprobenname (optional): Diese Option ermöglicht dem Benutzer das Platzieren einer Beschriftung auf dem erstellten Diagramm, die angibt, welche Stichprobe innerhalb des Datenstroms zum Erstellen des Diagramms verwendet wurde, oder die andere Informationen bereitstellt, die der Daten-Creator als für das Diagramm relevant erachtet.
Die Anzahl der gleichzeitig gelesenen Datensätze: Verwenden Sie sie, um einzuschränken, wie viele Datensätze auf einmal aus dem Datenstrom abgerufen werden.
Diagrammgröße: Konfigurieren Sie die Diagrammgröße entweder in Zoll oder in Zentimetern.
Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).
Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.
Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.
Größe der Basisschriftart (Punkte): Konfigurieren Sie die Schriftgröße.
Die Ausgabe für das Tool ist ein Alteryx-Berichtsfeld, das aus einem R-Diagramm und aus einer Prognosegüte-/Zuwachstabelle besteht. Diese Elemente können beim Erstellen benutzerdefinierter Berichte hilfreich sein.