Outil ARIMA

L’outil ARIMA estime un modèle de prévision des séries temporelles, soit de type univarié soit avec des covariables (prédicteurs) à l’aide d’une méthode à moyenne mobile intégrée autorégressive (ARIMA). ARIMA est la méthode de prévision la plus couramment utilisée. Elle est considérée comme la classe de modèles la plus générale pour prévoir un champ de série temporelle. Les méthodes ARIMA implémentées dans cet outil peuvent utiliser une approche automatisée pour développer un modèle basé sur des critères statistiques, ou vous pouvez spécifier directement les paramètres sous-jacents d'un modèle ARIMA. Une discussion détaillée du modèle ARIMA, ainsi qu'une description des méthodes automatisées utilisées dans cet outil, peuvent être trouvées dans le chapitre 8 du livre en ligne de Hyndman et de Athanasopoulos : principes et pratiques.

Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.

Connecter une entrée

Un flux de données Alteryx contenant les informations d’historique sur la série temporelle à prévoir et (éventuellement) un jeu de covariables. Les champs non utilisés pendant la création des modèles peuvent aussi être présents dans le flux de données.

Configurer l’outil

Utilisez l' onglet Paramètres requis pour définir les contrôles de base requis pour qu'un modèle ARIMA soit créé.

  • Nomdu modèle: chaque modèle doit être donné un nom afin qu'il puisse être identifié ultérieurement. Les noms de modèles doivent commencer par une lettre et peuvent contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »). Aucun autre caractère spécial n’est autorisé et R est sensible à la casse.
  • Sélectionnez le champ cible: sélectionnez le champ dans le flux de données que vous souhaitez prévoir. Pour ce champ, les mesures doivent être effectuées à intervalle régulier (par exemple, chaque jour, chaque mois, chaque trimestre, etc.).
  • Les colonnes contenant des identifiants uniques, tels que les clés primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l’exécution.

  • Utiliser des covariables dans l'estimation du modèle? : Si cette option est cochée, l'utilisateur sera présenté avec une liste de cases à cocher pour sélectionner les champs à utiliser comme covariables dans le modèle ARIMA.
  • Fréquence du champ cible: choisissez l'intervalle de temps pour les observations du champ cible.

Utilisez l' onglet personnalisation du modèle (facultatif) pour définir les contrôles qui ajustent la façon dont le modèle traite les données.

  • Personnaliser les paramètres utilisés pour la création automatique du modèle...: cliquer sur cette option expose un ensemble de paramètres qui influent sur la création automatique du modèle. Grâce à ces paramètres, vous avez la possibilité de :
    • Ajustez les composants non saisonniers, y compris le niveau de première différenciation, l'ordre maximal du composant autorégresseur et l'ordre maximal de la composante moyenne mobile.
    • Ajuster les composantes saisonnières , y compris le niveau de différenciation saisonnière, l'ordre maximal du composant autorégresseur saisonnier et l'ordre maximal de la composante moyenne mobile saisonnière.
    • Sélectionnez les critères d'information utilisés pour sélectionner les différents modèles candidats. La valeur par défaut est le critère d’information Akaike corrigé (AICc), mais le critère d’information Akaike non corrigé (AIC) et le critère d’information bayésien (BIC) sont également disponibles.
    • Vous pouvez également déterminer si tous les modèles possibles sont estimés et comparés (énumération complète) au lieu d'utiliser l'algorithme par étapes par défaut. Il est avéré que l’algorithme pas à pas possède de bonnes caractéristiques de performances, et il consomme beaucoup moins de ressources informatiques. Néanmoins, il ne garantit pas de trouver le meilleur modèle unique. L’estimation de tous les modèles ARIMA possibles permet de déterminer le meilleur modèle unique, mais le temps d’exécution est alors considérablement accru. Si l'énumération complète est sélectionnée, vous pouvez placer certaines limites sur l'espace recherché en définissant l'ordre maximal autorisé du modèle. En outre, vous avez la possibilité d'utiliser plusieurs cœurs de la machine sur laquelle Alteryx est exécuté.
    • D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).
  • Modèle complètement spécifié par l'utilisateur...: cliquer sur cette option vous permet de spécifier manuellement un modèle ARIMA. Les paramètres obligatoires sont :
    • Les composantes non saisonnières de l'ordre de la composante autorégresseuse (p), le degré de première différenciation (d) et l'ordre de la moyenne mobile (q).
    • Les composantes saisonnières de l'ordre du composant autorégresseur saisonnier (P), le degré de différenciation saisonnière (D) et l'ordre de la composante moyenne mobile saisonnière (Q).
    • D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).

Utilisez l' onglet autres options pour définir des paramètres supplémentaires pour les périodes.

  • Période de début de série (optionnel): cette option vous permet de spécifier la période de début de la série chronologique, qui est reflétée dans la parcelle de prévision.
  • Si la fréquence du champ cible est réglée à l'heure, quotidiennement (tous les jours)ou quotidiennement (en semaine seulement), cette option n'est pas disponible.

  • Nombre de périodes à inclure dans le tracé prévisionnel: ce tracé qui contient les données originales et un certain nombre de points futurs prévisionnels (avec des intervalles de confiance de 80% et de 95% autour des points de prévision). Vous pouvez spécifier le nombre de périodes à prévoir dans l'avenir pour le tracé.
  • Sélectionner un format de semaine: cela vous permet de choisir une méthode pour spécifier des semaines de travail. Ces options portent sur les éléments qui constituent la première semaine de l’année et le premier jour de la semaine.
    • États-Unis – Dimanche est le premier jour de la semaine
    • Royaume-Uni – Lundi est le premier jour de la semaine
    • ISO8601 – Lundi est le premier jour de la semaine

Utilisez l' onglet options graphiques pour définir les commandes de la sortie graphique.

  • Tailledu tracé: sélectionnez pouces ou centimètres pour la taille du graphique.
  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 ppp) ; 2x (192 PPP) ; ou 3x (288 PPP). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.

  • Taille de police de base (points): sélectionnez la taille de la police dans le graphique.

Afficher la sortie

  1. O ancre: se compose d'un flux de sortie contenant l'objet modèle ARIMA qui peut être utilisé pour les prévisions de point et un intervalle de confiance percentile spécifié par l'utilisateur entourant ces prévisions.
  2. R ancre: comprend les extraits de rapport générés par l'outil ARIMA: un résumé statistique, des parcelles diagnostiques d'autocorrélation et des placettes prévisionnelles.
  3. I ancre: un tableau de bord interactif HTML composé de tracés et de métriques. Vous pouvez interagir avec les visualisations en cliquant sur les différents éléments graphiques pour afficher davantage d’informations, de valeurs, de métriques et d’analyses.
  4. Comportement attendu: calculs de traçage

    Le tracé prévisionnel utilise une date par défaut pour les calculs si l'un des paramètres de configuration suivants est utilisé:

    • La fréquence du champ cible est réglée à l' heure, quotidiennement (tous les jours)ou quotidiennement (en semaine seulement).
    • La fréquence du champ cible est réglée sur hebdomadaire, mensuelle, trimestrielleou annuelle et la période de départ de la série n' est pas réglée.

    La date par défaut utilisée peut varier, ce qui fait apparaître un calcul aléatoire.