ARIMA Tool Icon

Outil ARIMA

Version:
2022.3
Last modified: September 25, 2020

L’outil ARIMA estime un modèle de prévision des séries temporelles, soit de type univarié soit avec des covariables (prédicteurs) à l’aide d’une méthode à moyenne mobile intégrée autorégressive (ARIMA). ARIMA est l’approche de prévision la plus couramment utilisée et est considérée comme la classe la plus générale de modèles pour la prévision d’un champ de séries temporelles. Les méthodes ARIMA implémentées dans cet outil peuvent utiliser une approche automatisée pour développer un modèle basé sur des critères statistiques, ou vous pouvez spécifier directement les paramètres sous-jacents d'un modèle ARIMA. Une discussion détaillée du modèle ARIMA, ainsi qu’une description des méthodes automatisées utilisées dans cet outil, se trouvent au chapitre 8 du livre en ligne d’Hyndman et Athanasopoulos Forecasting: Principals and Practice.

Cet outil utilise l’outil R. Accédez à Options > Téléchargez des outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les packages utilisés par l’outil R. Voir Télécharger et utiliser des outils prédictifs.

Connecter une entrée

Un flux de données Alteryx contenant les informations d’historique sur la série temporelle à prévoir et (éventuellement) un jeu de covariables. Les champs non utilisés pendant la création des modèles peuvent aussi être présents dans le flux de données.

Configurer l'outil

Utilisez l’onglet Paramètres requis pour définir les contrôles de base requis pour la création d’un modèle ARIMA.

  • Nom du modèle: Chaque modèle doit recevoir un nom afin qu’il puisse être identifié ultérieurement. Les noms de modèles doivent commencer par une lettre et peuvent contenir des lettres, des chiffres et la période des caractères spéciaux (« ») et souligner (« »). Aucun autre caractère spécial n’est autorisé et R est sensible à la casse.
  • Sélectionnez le champ cible: sélectionnez le champ dans le flux de données à prévoir. Les mesures pour ce domaine doivent être effectuées à intervalles réguliers (par exemple, tous les jours, mensuels, trimestriels, etc.). Les colonnes contenant des identificateurs uniques, comme les touches primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l’exécution.
  • Utiliser des covariables dans l’estimation du modèle?: Si cette option est cochée, vous disposez d’une liste de cases à cocher pour sélectionner les champs à utiliser comme covariés dans le modèle ARIMA.
  • Fréquence du champ cible: Choisissez l’intervalle de temps pour les observations du champ cible.

Utilisez l’onglet Personnalisation du modèle (facultatif) pour définir des contrôles qui ajustent la façon dont le modèle traite les données.

  • Personnaliser les paramètres utilisés pour la création automatique de modèles...: Sélectionnez cette option pour exposer un ensemble de paramètres qui influencent la création automatique de modèles. Les options comprennent la possibilité de ...
    • Ajuster les composants non saisonniers, y compris le niveau de première différence, l’ordre maximal du composant autorégressif et l’ordre maximal du composant moyen mobile.
    • Ajuster les composantes saisonnières, y compris le niveau de différence saisonnière, l’ordre maximal de la composante autorégressive saisonnière et l’ordre maximal de la composante moyenne mobile saisonnière.
    • Sélectionnez les critères d’information utilisés pour sélectionner entre les différents modèles de candidats. La valeur par défaut est le critère d’information Akaike corrigé (AICc), mais le critère d’information Akaike non corrigé (AIC) et le critère d’information bayésien (BIC) sont également disponibles.
    • Vous pouvez également déterminer si tous les modèles possibles sont estimés et comparés (énumération complète) au lieu d’utiliser l’algorithme par défaut dans le sens des étapes. L’algorithme stepwise a été montré pour avoir de bonnes caractéristiques de performance et est beaucoup moins intensive en informatique, cependant, il n’est pas garanti de trouver le meilleur modèle unique. L’estimation de tous les modèles ARIMA possibles permet de déterminer le meilleur modèle unique, mais le temps d’exécution est alors considérablement accru. Si l'énumération complète est sélectionnée, vous pouvez placer certaines limites sur l'espace recherché en définissant l'ordre maximal autorisé du modèle. En outre, vous avez la possibilité d’utiliser plusieurs noyaux de la machine sur laquelle Alteryx est en cours d’exécution.
    • D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).
  • Modèle entièrement spécifié par l’utilisateur...: Sélectionnez cette option pour spécifier manuellement un modèle ARIMA. Les paramètres requis incluent...
    • Les composantes non saisonnières de l’ordre du composant autorégressif (p), le degré de première différence (d) et l’ordre de la moyenne mobile (q).
    • Les composantes saisonnières de l’ordre de la composante autorégressive saisonnière (P), le degré de différence saisonnière (D) et l’ordre de la composante moyenne mobile saisonnière (Q).
    • D’autres options permettent d’autoriser une certaine « dérive » dans le modèle et d’appliquer au champ cible une transformation de Box-Cox (y compris la définition de la valeur de lambda).

Utilisez l’onglet Autres options pour définir des paramètres supplémentaires pour les périodes.

  • Période de démarrage de la série (facultatif): Cette option vous permet de spécifier la période de début de la série de temps, qui se reflète dans l’intrigue de prévision. Si la fréquence du champ cible est définie sur Heure, Quotidienne (tous les jours)ou Quotidienne (en semaine seulement),cette option n’est pas disponible.
  • Nombre de périodes à inclure dans la parcelle de prévision: Cette parcelle qui contient les données d’origine et un certain nombre de points futurs prévus (avec des intervalles de confiance de 80 % et 95 % autour des points de prévision). Vous pouvez spécifier le nombre de périodes à prévoir dans l'avenir pour le tracé.
  • Sélectionnez Format de semaine: Cela vous permet de choisir une méthode pour spécifier les semaines de travail. Ces options portent sur les éléments qui constituent la première semaine de l’année et le premier jour de la semaine.
    • Etats-Unis:   Le dimanche est le premier jour de la semaine.
    • Royaume-Uni: Le lundi est le premier jour de la semaine.
    • ISO8601: Le lundi est le premier jour de la semaine.

Utilisez l’onglet Options graphiques pour définir les contrôles de la sortie graphique.

  • Taille de la parcelle: Sélectionnez des pouces ou des centimètres pour la taille du graphique.
  • Résolution graphique: Sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi), 2x (192 dpi)ou 3x (288 dpi). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.
  • Taille de police de base (points): sélectionnez la taille de la police dans le graphique.

Afficher la sortie

  1. O ancre : se compose d’un flux de sortie qui contient l’objet du modèle ARIMA qui peut être utilisé à la fois pour les prévisions de points et un intervalle de confiance en percentile spécifié par l’utilisateur entourant ces prévisions.
  2. Ancre R : Se compose des extraits de rapport générés par l’outil ARIMA : un résumé statistique, des parcelles de diagnostic d’autocorrélation et des parcelles de prévision.
  3. J’ancre : Un tableau de bord html interactif qui se compose de parcelles et de mesures. Sélectionnez les différents éléments graphiques pour interagir avec les visualisations afin de révéler plus d’informations, de valeurs, de métriques et d’analyses.

Comportement attendu: Calculs de parcelle

L’intrigue de prévision utilise une date de défaut pour les calculs si l’un de ces paramètres de configuration sont utilisés :

  • Fréquence de champ cible est définie sur Heure, Quotidienne (tous les jours)ou Quotidienne (en semaine seulement).
  • La fréquence du champ cible est définie sur hebdomadaire, mensuel, trimestrielou annuel et la période de début de la série n’est pas définie.

La date par défaut utilisée peut varier, ce qui rend le calcul aléatoire.

Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.