Skip to main content

Predictive Analytics

Designer enthält eine Reihe von Prognose-Tools, die R verwenden, eine Open-Source-Codebasis, die für statistische und prädiktive Analysen verwendet wird.

Die Tools umfassen Datenexploration, spezielle Elemente der Datenvorbereitung für Predictive Analytics, Predictive Modelling, Tools zum Vergleich und zur Bewertung der Effizienz verschiedener Modelle, Tools zur systematischen Gruppierung von Datensätzen und Feldern sowie Tools zur Unterstützung bei der Implementierung von Predictive Analytics-Lösungen.

Die Prognose-Tools verwenden die R-Programmiersprache. Navigieren Sie zu Optionen  > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren.

In-DB-Unterstützung

Es gibt sechs Prognose-Tools mit In-Database-Unterstützung.

Wenn ein Prognose-Tool mit In-Database-Unterstützung mit einem anderen In-DB-Tool im Arbeitsbereich platziert wird, wechselt das Tool automatisch zu der In-DB-Version. Wenn Sie die Version des Tools ändern möchten, klicken Sie mit der rechten Maustaste auf das Tool, zeigen Sie auf „Tool-Version auswählen“ und wählen Sie eine andere Version des Tools aus. Weitere Informationen zu In-DB-Support und Tools finden Sie unter In-Datenbank – Übersicht .

Prädiktive Analyse-Tools

Diese Tool-Kategorie enthält sowohl Tools zum besseren Verständnis der Daten, die in einem Predictive Analytics-Projekt verwendet werden sollen, als auch Tools zur Durchführung spezieller Daten-Sampling-Aufgaben für Predictive Analytics. Zur besseren Veranschaulichung der in einem Predictive Analytics-Projekt verwendeten Daten stehen sowohl Visualisierungs-Tools als auch Tools zur Verfügung, die Tabellen mit deskriptiven Statistiken liefern.

Die Tools, die dem Benutzer über visuelle Methoden ein besseres Verständnis der zu analysierenden Daten ermöglichen, lauten wie folgt:

Field Summary Tool Icon
Heat Plot Tool Icon
Histogram Tool Icon
Plot of Means Tool Icon
Scatterplot Tool Icon
Violin Plot Tool Icon

Mit den folgenden Tools lassen sich nützliche zusammenfassende Statistiken erstellen, die dem Benutzer helfen, die analysierten Daten besser zu verstehen:

Magnifying glass over a rain drop and umbrella symbol
Basic Data Profile Tool Icon
Contingency Table Tool Icon
Distribution Analysis Tool Icon
Frequency Table Tool Icon
Importance Weights Tool Icon
Pearson Correlation Tool Icon
Spearman Correlation Tool Icon

Diese Kategorie umfasst Tools für die allgemeine prädiktive Modellierung für Klassifizierungs- (Feld „Kategoriales Ziel“) und Regressionsmodelle (Feld „Numerisches Ziel“) sowie Tools für den Modellvergleich und die für prädiktive Modelle relevante Hypothesenprüfung. Für die allgemeine prädiktive Modellierung gibt es eine Reihe von Tools, die sich weiter in traditionelle statistische Modelle und modernere statistische Lernmethoden unterteilen lassen. Ein einziges Bewertung-Tool bietet einen Mechanismus, der Modellprognosen aus beiden Typen der allgemeinen Tools für die prädiktive Modellierung liefert.

Einen wichtigen Unterschied zwischen den traditionellen statistischen Modellen und den moderneren statistischen Lernmethoden bildet der Grad der direkten Benutzerintervention im Modellierungsprozess. Traditionelle statistische Modelle erfordern einen weitaus höheren Grad an Benutzerintervention und weitaus mehr Fachwissen, um ein Modell mit einer ausreichenden Vorhersagekraft zu entwickeln. Der Benutzer muss die wichtigen Prädiktorfelder gezielt vorab auswählen und muss wahrscheinlich geeignete Transformationen der numerischen Felder durchführen, um nichtlineare Effekte zwischen dem Zielfeld und den kontinuierlichen Prädiktoren zu erfassen. Die Auswahl der wichtigen Prädiktoren (ohne Berücksichtigung möglicher Probleme aufgrund nichtlinearer Beziehungen) kann für die traditionellen Modelle durch eine schrittweise Regression unterstützt werden. Im Gegensatz dazu nutzen die modernen statistischen Lernmethoden Algorithmen, die intern sowohl die Prädiktorauswahl als auch mögliche nichtlineare Beziehungen zwischen dem Ziel und den numerischen Prädiktoren behandeln.

Die traditionellen statistischen Modelle unterscheiden sich voneinander hinsichtlich der Art des Zielfelds, das vorhergesagt wird. Alle basieren auf der Schätzung (generalisierter) linearer Modelle. Während alle statistischen Lernalgorithmen die Prädiktorauswahl und nichtlineare Effekte intern behandeln, unterscheiden sie sich in ihren Ansätzen. Daraus folgt, dass keine einzelne Methode alle anderen in allen Problembereichen, auf die ein Benutzer treffen kann, übertrifft.

Tools für traditionelle statistische Modelle

Count Regression Tool Icon
Gamma Regression Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Naive Bayes Classifier Tool Icon
Neural Network Tool Icon
Stepwise Tool Icon
Support Vector Machine Tool Icon

Tools für die moderne statistische Lernmethode

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Spline Model Tool Icon

Tools für den Vergleich von Prognosemodellen und Hypothesentests

Cross-Validation Tool Icon
Lift Chair Tool Icon
Model Coefficients Tool Icon
Model Comparison Tool Icon
Nested Test Tool Icon
Test of Means Tool Icon
Variance Inflation Factors Tool Icon

Tool zur Prognose von Werten für alle generellen prädiktiven Modellierungs-Tools

Score Tool

Tool zum Erstellen interaktiver Netzwerkvisualisierungen und Zusammenfassungen der wichtigsten Statistiken

Network Analysis Tool Icon

Tools zum Generieren von Ereigniszeitmodellen und zum Schätzen relativer Risiken und der eingeschränkten mittleren Ereigniszeit

Survival Analysis Tool Icon
Survival Score Tool Icon

Die „A/B-Test“-Tools unterstützen den Benutzer bei der Durchführung von A/B-Tests (auch als Testen und Lernen bezeichnet), wie die Untersuchung der Auswirkung einer neuen Marketingkommunikationskampagne auf den Verkauf oder der Auswirkung einer Veränderung der Mitarbeiterzahl eines Geschäfts. Die Tools unterstützen das Ermitteln von Marktgebieten für einen Test (in der Regel einen, der sich auf Werbung in den Massenmedien bezieht, die potenziell jeden, der in dem Gebiet wohnt, erreichen kann), die Zuordnung von einer oder mehreren Kontrolleinheiten zu den einzelnen Behandlungseinheiten, das Entwickeln von Trend- und Saisonalitätsmaßnahmen, auf denen die Zuordnung von Kontrollen zu Behandlungen häufig basiert, und die Durchführung der eigentlichen Analyse der experimentellen Ergebnisse. Die Tools in dieser Unterkategorie:

AB Analysis Tool Icon
AB Controls Tool Icon
AB Treatments Tool Icon
AB Trend Tool Icon

Diese Kategorie enthält verschiedene Tools für das Erstellen regulärer (im Hinblick auf das Datenzeitintervall, z. B. monatlich), eindimensionaler Zeitreihendiagramme und -prognosen. Die zentralen Tools dienen zum Erstellen von ARIMA-Modellen und Prognosemodellen mit erweiterter exponentieller Glättung, die zum Erstellen von Elementen wie wöchentlichen Verkaufsprognosemodellen verwendet werden können. Beide Verfahren entwickeln Prognosen, die auf systematischen, zeitbezogenen Elementen in den Werten der Zielvariablen basieren. Sie erkennen insbesondere Elemente von Trends (langfristige, recht konstante Auf- oder Abwärtsbewegungen in der Zielvariable) und Saisonalitäten (zyklische Muster, die sich im Lauf der Zeit wiederholen).

Ein Beispiel für solche Elemente wäre ein Zeitreihenmodell für den Verkauf von Tablets, das einen positiven Trend des Absatzes zusammen mit einem starken saisonalen Muster höherer Absatzzahlen vor Weihnachten und vor Beginn des Schuljahres aufzeigt. Falls in der Zielvariablen weder ein Trend noch eine Saisonalität vorliegt, fallen die Prognosewerte der Zielvariablen für die aktuellen Werte des Ziels wahrscheinlich auf eine Gerade, die auf dem gewichteten Mittelwert des Ziels basiert. Dies stellt für den Benutzer wahrscheinlich keine zufriedenstellenden Erkenntnisse dar, zeigt aber, dass in den Daten keine reale Struktur im Hinblick auf ausschließlich zeitbezogene Elemente (Trend und Saisonalität) vorhanden ist. In diesen Fällen können allgemeinere prädiktive Modellierungsmethoden für die Prognoseentwicklung nützlicher sein als die Zeitreihen-Tools.

Neben den Tools für das Erstellen von Prognosen gibt es Tools, die den Benutzer beim Vergleich der relativen Effizienz verschiedener Zeitreihen-Prognosemodelle unterstützen. Dies sind folgende Zeitreihen-Tools:

ARIMA Tool Icon
ETS Tool Icon
TS Compare Tool Icon
TS Covariate Forecast Tool Icon
TS Filler Tool Icon
TS Forecast Tool Icon
TS Forecast Factory Tool Icon
TS Model Factory Tool Icon
TS Plot Tool Icon

Diese Kategorie umfasst Tools für die Gruppierung von Datensätzen oder Feldern in einer kleineren Anzahl von Gruppen. Zu den gängigen Anwendungen für das Gruppieren von Datensätzen gehören das Erstellen von Kundensegmenten auf der Grundlage des Kaufverhaltens oder das Erstellen eines Satzes von Filialgruppen. Das finale Ziel der Gruppierung besteht in diesen beiden Bereichen darin, eine kleinere Anzahl von Gruppen zu erstellen, die eine Anpassung von Programmen und Aktivitäten ermöglichen, die aus einer Unternehmensperspektive durchführbar ist.

Beispiel: Ein Einzelhändler, dessen Netzwerk 500 Verkaufsstellen umfasst, würde es wahrscheinlich zu aufwändig finden, für jede der 500 Verkaufsstellen ein spezifisches Preis- und Sortimentprogramm zu entwickeln. Wenn die Verkaufsstellen jedoch aufgrund von Ähnlichkeiten der Verkaufsstelle im Hinblick auf die Verkaufsmuster in einen kleineren Satz von Ladengruppen (etwa 10) gruppiert werden, kann der Einzelhändler 10 verschiedene Preis- und Sortimentprogramme entwickeln und erfolgreich implementieren. So möchten viele Organisationen auch Datenbanktabellen analysieren, die sehr groß sind und viele hochgradig miteinander in Beziehung stehende Felder enthalten. In diesen Fällen gestalten sich Analysen dieser Daten mit einer großen Anzahl hochgradig korrelierter Kennzahlen sehr kompliziert. Daher ist es sinnvoll, den Originalsatz der Felder auf einen kleineren Satz zusammengefasster Felder zu verringern, die sich leichter analysieren lassen. In beiden Fällen ist es erforderlich, die Dimensionalität der Daten zu verringern, um damit arbeiten zu können.

Das gängigste Verfahren, nach dem Datensätze miteinander gruppiert werden, ist die Clusteranalyse. Es gibt viele verschiedene Typen von Clusteranalysen. Die in Geschäftsanwendungen jedoch mit Abstand am häufigsten angewendeten Clusteringverfahren basieren jedoch auf K-Centroids-Algorithmen. Alteryx bietet Tools, um die passende Anzahl der Cluster (Gruppen) zu ermitteln, die gebildet werden, um den endgültigen Clustersatz zu erstellen und an den Cluster einen bestimmten Datensatz anzufügen, der zu den Daten gehört (unabhängig davon, ob der Datensatz beim Ermitteln des Clustersatzes verwendet wurde). Ein zugehöriges Tool (Nächste Nachbarn suchen) bietet dem Benutzer die Möglichkeit, ad hoc Gruppen einer bestimmten Größe um einen oder mehrere bestimmte Datensätze zu bilden. Das Tool bietet z. B. die Möglichkeit die fünf Kunden zu finden, die dem Kunden „X“ auf der Grundlage des zurückliegenden Kaufverhaltens am ähnlichsten sind. Das für das Gruppieren der Felder verfügbare Verfahren ist das Hauptkomponentenverfahren.

Die Warenkorbanalyse-Tools helfen zu ermitteln, welche Artikel in den Verkaufsstellendaten zusammen vorkommen oder welche Kombination von Problemen in Fehlermeldungen und Arbeitsauftragssystemen dazu tendieren, gemeinsam aufzutreten. Die Tools in der Kategorie ermitteln die in den Daten vorhandenen Regelsätze (z. B. „Produktdefekt A ist wahrscheinlicher vorhanden, wenn auch die Produktdefekte B und C festgestellt werden“) und bieten Filtertools, mit denen die Liste der möglichen Regeln auf der Grundlage eines Satzes von Kriterien eingegrenzt werden kann, die mit Regeln verbunden sind, die wahrscheinlicher sind, was sie praktisch wichtiger macht.

Die Tools in dieser Kategorie beinhalten:

Append Cluster Tool Icon
Find Nearest Neighbors Tool Icon
K-Centroids Cluster Analysis Tool Icon
K-Centroids Diagnostics Tool Icon
MB Affinity Tool Icon
MB Inspect Tool Icon
MB Rules Tool
Multidimensional Scaling Tool Icon
Principal Components Tool Icon

Diese Kategorie umfasst Tools, die bei der Ermittlung der besten Vorgehensweise oder des Resultats einer bestimmten Situation oder Reihe von Szenarien hilfreich sein können. Dies kann helfen, die Ausgabe von Prognosemodellen zu verbessern, indem eine optimale Vorgehensweise verordnet wird.

Optimization Tool Icon
Simulation Sampling Tool Icon
Simulation Scoring Tool Icon
Simulation Summary Tool Icon