Exemple d'outil unique
Il existe un exemple d'outil unique pour l'outil ARIMA. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
L’outil ARIMA estime un modèle de prévision des séries temporelles, soit de type univarié soit avec des covariables (prédicteurs) à l’aide d’une méthode à moyenne mobile intégrée autorégressive (ARIMA). ARIMA est la méthode de prévision la plus couramment utilisée. Elle est considérée comme la classe de modèles la plus générale pour prévoir un champ de série temporelle. Les méthodes ARIMA mises en œuvre dans cet outil peuvent utiliser une approche automatisée pour développer un modèle basé sur des critères statistiques. Sinon, vous pouvez spécifier directement les paramètres sous-jacents d'un modèle ARIMA. Une explication détaillée du modèle ARIMA, avec une description des méthodes automatisées utilisées dans cet outil, est disponible dans le Chapitre 8 de l'ouvrage en ligne Forecasting : Principals and Practice d'Hyndman et Athanasopoulos.
Note
Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Consultez la page Télécharger et utiliser les outils prédictifs.
Connectez un flux de données Alteryx qui contient les informations d'historique sur la série temporelle à prévoir et (éventuellement) un jeu de covariables. Les champs non utilisés pendant la création des modèles peuvent aussi être présents dans le flux de données.
Utilisez l'onglet Paramètres requis pour définir les contrôles de base requis pour la création d'un modèle ARIMA.
Nom de modèle : vous devez attribuer un nom à chaque modèle afin de pouvoir les identifier ultérieurement. Les noms de modèles doivent commencer par une lettre et peuvent contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »). Aucun autre caractère spécial n'est autorisé et R est sensible à la casse.
Sélectionner le champ cible : sélectionnez le champ du flux de données à prédire. Pour ce champ, les mesures doivent être effectuées à intervalle régulier (par exemple, chaque jour, chaque mois, chaque trimestre, etc.). Les colonnes contenant des identifiants uniques, tels que les clés primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l'exécution.
Utiliser des covariables dans l'estimation du modèle ? : si vous cochez cette option, une liste de cases à cocher s'affiche pour sélectionner les champs à utiliser comme covariables dans le modèle ARIMA.
Fréquence du champ cible : sélectionnez l'intervalle des observations du champ cible.
L'onglet Personnalisation du modèle (facultatif) permet de définir les contrôles qui ajustent la façon dont le modèle traite les données.
Personnaliser les paramètres utilisés pour la création automatique du modèle : sélectionnez cette option pour exposer un ensemble de paramètres qui influencent la création automatique du modèle. Grâce à ces paramètres, vous avez la possibilité de…
Ajuster les composants non saisonniers, notamment le degré de la première différenciation, l'ordre maximum du composant autorégressif et l'ordre maximum du composant de moyenne mobile.
Ajuster les composants saisonniers, notamment le niveau de différenciation saisonnière, l'ordre maximum du composant autorégressif saisonnier et l'ordre maximum du composant de moyenne mobile saisonnière.
Sélectionnez les critères d'information permettant de choisir entre les différents modèles candidats. La valeur par défaut est le critère d'information Akaike corrigé (AICc), mais le critère d'information Akaike non corrigé (AIC) et le critère d'information bayésien (BIC) sont également disponibles.
Vous pouvez aussi déterminer si tous les modèles possibles sont estimés et comparés (énumération complète) au lieu d'utiliser l'algorithme pas à pas par défaut. Il est avéré que l'algorithme pas à pas possède de bonnes caractéristiques de performances, et il consomme beaucoup moins de ressources informatiques. Néanmoins, il ne garantit pas de trouver le meilleur modèle unique. L’estimation de tous les modèles ARIMA possibles permet de déterminer le meilleur modèle unique, mais le temps d’exécution est alors considérablement accru. Si vous choisissez l'énumération complète, vous pouvez placer certaines limites à l'espace balayé par la recherche en définissant l'ordre maximum autorisé du modèle. En outre, vous pouvez utiliser plusieurs cœurs de processeur sur l'ordinateur exécutant Alteryx.
D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).
Modèle complètement spécifié par l'utilisateur : sélectionnez cette option pour spécifier manuellement un modèle ARIMA. Les paramètres obligatoires sont…
Les composants non saisonniers de l'ordre du composant autorégressif (p), le degré de la première différenciation (d) et l'ordre de la moyenne mobile (q).
Les composants saisonniers de l'ordre du composant autorégressif saisonnier (P), le degré de différenciation saisonnière (D) et l'ordre du composant à moyenne mobile saisonnier (Q).
D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).
Les options de l'onglet Autres options vous permettent de définir des paramètres supplémentaires pour les périodes.
Période de début de la série (facultatif) : cette option vous permet de spécifier la période de début de la série chronologique, qui est reflétée dans le graphique de prévision. Si l'option Fréquence du champ cible est définie sur Horaire, Quotidien (tous les jours) ou Quotidien (lundi-vendredi), cette option n'est pas disponible.
Nombre de périodes à inclure dans le tracé de la prévision : ce tracé contient les données d'origine et un certain nombre de points de prévision futurs (avec intervalles de confiance à 80 % et 95 % autour des points de prévision). Vous pouvez spécifier le nombre de périodes couvertes par la prévision pour le tracé.
Sélectionner le format de semaine : permet de choisir une méthode pour spécifier les semaines de travail. Ces options portent sur les éléments qui constituent la première semaine de l’année et le premier jour de la semaine.
États-Unis : dimanche est le premier jour de la semaine
Royaume-Uni : lundi est le premier jour de la semaine
ISO8601 : lundi est le premier jour de la semaine
Dans l'onglet Options des graphiques, définissez les contrôles de la sortie graphique.
Taille du tracé : sélectionnez « pouces » ou « centimètres » pour indiquer la taille du graphique.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ; ou 3x (288 dpi).
Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.
Taille de la police de base (points) : sélectionnez la taille de la police dans le graphique.
Ancrage O : comprend un flux de sortie contenant l'objet modèle ARIMA utilisable pour les prévisions point par point et un intervalle de confiance de centile spécifié par l'utilisateur qui vient borner ces prévisions.
Ancrage R : comprend les snippets de rapports générés par l'outil ARIMA : un résumé statistique, des tracés de diagnostic de l'autocorrélation et des tracés prévisionnels.
Ancrage I : tableau de bord HTML interactif comprenant des diagrammes et des métriques. Sélectionnez les différents éléments graphiques pour interagir avec les visualisations afin d'afficher plus d'informations, de valeurs, de métriques et d'analyses.
Comportement attendu : calculs de tracé
Le tracé de prévision utilise une date par défaut pour les calculs si l'un des paramètres de configuration suivants est utilisé :
L'option Fréquence du champ cible est définie sur Horaire, Quotidien (tous les jours) ou Quotidien (lundi-vendredi).
L'option Fréquence du champ cible est définie sur Hebdomadaire, Mensuel, Trimestriel ou Annuel, et l'option Période de début de la série n'est pas définie.
La date par défaut utilisée peut varier, ce qui rend le calcul aléatoire.