One-Tool-Beispiel
Es gibt ein One-Tool-Beispiel für ZR-Vergleich. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Verwenden Sie das ZR-Vergleich-Tool, um ein oder mehrere Zeitreihenmodelle zu vergleichen, die mit dem ARIMA-Tool oder dem ETS-Tool erstellt wurden, einschließlich ARIMA-Modellen, die Kovariaten verwenden.
Dieses Tool liefert einige häufig genutzte Kennzahlen für die Modellgenauigkeit, indem es die Punktprognosen der einzelnen Modelle mit den Ist-Werten des prognostizierten Felds für ein zurückgehaltenes Dataset vergleicht. Darüber hinaus werden ein Diagramm und eine Tabelle der Ist- und der Prognosewerte erstellt. Eingaben für das Makro sind eines oder mehrere Zeitreihenmodelle (die miteinander vereint wurden), die auf demselben Feld und demselben SchätzDataset basieren, sowie ein Alteryx-Datenstrom, der die Ist-Werte für den zurückgehaltenen Zeitraum zusammen mit Werten beliebiger Kovariaten enthält, die gegebenenfalls bei der Modellerstellung verwendet wurden. Die Ist-Werte müssen für Zeiträume vorliegen, die direkt auf die Zeiträume folgen, mit denen die Modelle erstellt wurden.
Kapitel 2, Abschnitt 5 des Online-Buches Forecasting: Principals and Practice von Hyndman und Athanasopoulos bietet eine gute Diskussion der Maßnahmen zur Bewertung der Genauigkeit von Prognosemodellen.
Anmerkung
Dieses Tool verwendet das R-Tool. Gehen Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Gehen Sie zu Prognose-Tools herunterladen und verwenden.
Für das ZR-Vergleich-Tool ist ein Designer-Datenstrom erforderlich, der entweder beinhaltet:
Ein Satz Zeitreihenmodelle, die dasselbe Feld prognostizieren, die idealerweise in denselben Zeiträumen schätzen und miteinander vereint wurden.
Ein Alteryx-Datenstrom, der dasselbe Feld enthält, das durch die Zeitreihenmodelle des ARIMA- oder ETS-Tools prognostiziert wurde, jedoch Zeiträume betrifft, die direkt auf die Zeiträume folgen, mit denen die Modelle geschätzt wurden. Wenn eines der zu vergleichenden Modelle ein ARIMA-Modell mit Kovariaten ist, müssen auch alle verwendeten Kovariatenfelder in diesem Datenstrom enthalten sein. Die Größe der zurückgehaltenen Sets muss mindestens so groß sein wie die Anzahl der Zeiträume, die in der Produktion im Modell für die Prognose in der Zukunft verwendet werden. Falls die insgesamt verfügbare Stichprobe groß ist, liegt die Größe des zurückgehaltenen Sets häufig über der Anzahl der zu prognostizierenden Zeiträume und beläuft sich auf 10 bis 20 Prozent der verfügbaren Daten.
Auf der Registerkarte Diagrammoptionen können Sie die Steuerelemente für das Ausgabediagramm einstellen.
Diagrammgröße: Wählen Sie Inch oder Zentimeter für die Diagrammgröße aus.
Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).
Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.
Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.
Größe der Basisschriftart (Punkte): Wählen Sie die Größe der Schrift im Diagramm aus.
Verbinden Sie ein Durchsuchen-Tool mit den einzelnen Ausgabeankern, um Ergebnisse anzuzeigen.
O-Anker: Enthält einen Datenstrom mit den Namen der einzelnen untersuchten Modelle und deren Genauigkeitsstatistik. Die Genauigkeitsstatistik umfasst den mittleren Prognosefehler (ME), die Quadratwurzel der mittleren quadratischen Prognosefehler (RMSE), die mittleren absoluten Prognosefehler (MAE), den mittleren prozentualen Prognosefehler (MPE), den mittleren absoluten prozentualen Prognosefehler (MAPE) und den mittleren absoluten skalierten Fehler (MASE). Die hiervon am häufigsten herangezogene Kennzahl ist MAPE, wobei der MASE-Wert jedoch einige Schwächen von MAPE behebt. Bei allen Kennzahlen erhalten Modelle mit kleineren Werten für diese Kennzahlen den Vorzug vor solchen mit größeren Werten.
R-Anker: Besteht aus den Berichtausschnitten einer Tabelle mit den Ist- und den Prognosewerten, einer Tabelle mit der Genauigkeitsstatistik der einzelnen Modelle und einem Diagramm mit allen Werten der Zeitreihen und den Prognosewerten für alle verglichenen Modelle.
I-Anker: Ein interaktives HTML-Dashboard, das aus Diagrammen und Metriken besteht. Wählen Sie verschiedene grafische Elemente aus, um mit den Visualisierungen zu interagieren und weitere Informationen, Werte, Metriken und Analysen anzuzeigen.
*Hyndman, R.J. und Athanasopoulos, G. (2012) Forecasting: Principles and Practice.