
Strumento ARIMA
Lo strumento ARIMA stima un modello di previsione di serie temporali, sia come modello univariato che con covariati (predittori), utilizzando un metodo di media mobile integrata autoregressiva (o ARIMA). ARIMA è l'approccio di previsione più comunemente utilizzato ed è considerato la classe più generale di modelli per la previsione di un campo di serie a tempo. I metodi ARIMA implementati in questo strumento possono utilizzare un approccio automatizzato per sviluppare un modello basato su criteri statistici oppure è possibile specificare direttamente i parametri sottostanti di un modello ARIMA. Una discussione dettagliata del modello ARIMA, insieme a una descrizione dei metodi automatizzati utilizzati in questo strumento, può essere trovata nel capitolo 8 del libro online Di Hyndman e Athanasopoulos Forecasting: Principals and Practice.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Alteryx Downloads and Licenses per installare R e i pacchetti utilizzati dallo strumento R. Consultate Scaricare e utilizzare gli strumenti predittivi.
Collegare un ingresso
Un flusso di dati Alteryx contenente dati cronologici sulle serie temporali da prevedere e (facoltativamente) un set di covariati. I campi che non verranno utilizzati nella creazione del modello possono essere presenti anche nel flusso di dati.
Configurare lo strumento
Utilizzare la scheda Parametri obbligatori per impostare i controlli di base necessari per la creazione di un modello ARIMA.
- Nome modello: Ogni modello deve essere assegnato un nome in modo che possa essere identificato in un secondo momento. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e il punto dei caratteri speciali (".") e il carattere di sottolineatura ("_"). Non sono consentiti altri caratteri speciali e R fa distinzione tra maiuscole e minuscole.
- Selezionare il campo didestinazione: selezionare il campo dal flusso di dati che si desidera prevedere. Le misurazioni per questo campo devono essere effettuate a intervalli di tempo regolari (ad esempio, giornalieri, mensili, trimestrali, ecc.). Le colonne contenenti identificatori univoci, ad esempio le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
- Utilizzare covariate nella stima del modello?: Se questa opzione è selezionata, viene visualizzato un elenco di caselle di controllo per selezionare i campi da utilizzare come covariati nel modello ARIMA.
- Frequenza campo didestinazione : Scegliere l'intervallo di tempo per le osservazioni del campo di destinazione.
Utilizzare la scheda Personalizzazione modello (facoltativo) per impostare i controlli che regolano la modalità di elabora dei dati del modello.
- Personalizzare i parametri utilizzati per la creazione automatica del modello...: Selezionare questa opzione per esporre un insieme di parametri che influenzano la creazione automatica del modello. Le opzioni includono la possibilità di...
- Regolare i componenti non stagionali, tra cui il livello di prima differenziazione, l'ordine massimo del componente autogressivo e l'ordine massimo del componente a media mobile.
- Regolare i componenti stagionali, compreso il livello di differenziazione stagionale, l'ordine massimo della componente autogressiva stagionale e l'ordine massimo della componente stagionale della media mobile.
- Selezionare i criteri di informazione utilizzati per la selezione tra diversi modelli candidati. Per impostazione predefinita viene utilizzato il criterio di informazione Akaike corretto (AICc), ma è possibile selezionare il criterio di informazione Akaike non corretto (AiC) o il criterio delle informazioni bayesiane.
- È inoltre possibile determinare se tutti i possibili modelli vengono stimati e confrontati (enumerazione completa) anziché utilizzare l'algoritmo stepwise predefinito. L'algoritmo stepwise ha dimostrato di avere buone caratteristiche di prestazioni ed è molto meno intensivo di calcolo, tuttavia, non è garantito trovare il miglior singolo modello. Stima di tutti i possibili modelli ARIMA troverà il singolo miglior modello, ma con un runtime significativamente maggiore. Se è selezionata l'enumerazione completa, è possibile impostare alcuni limiti per lo spazio cercato impostando l'ordine massimo consentito del modello. Inoltre, è possibile utilizzare più core della macchina su cui viene eseguito Alteryx.
- È inoltre possibile impostare opzioni che consentono "drift" nel modello e se una trasformazione Box-Cox (inclusa l'impostazione del valore di lambda) viene applicata al campo di destinazione.
- Modello completamente specificato dall'utente...: Selezionare questa opzione per specificare manualmente un modello ARIMA. I parametri richiesti includono...
- I componenti non stagionali dell'ordine della componente autogressiva (p), il grado di prima differenza (d) e l'ordine della media mobile (q).
- I componenti stagionali dell'ordine della componente autogressiva stagionale (P), il grado di differenziazione stagionale (D) e l'ordine della componente stagionale della media mobile (Q).
- È inoltre possibile impostare opzioni che consentono la "deriva" all'interno del modello e se una trasformazione Box-Cox (inclusa l'impostazione del valore di lambda) viene applicata al campo di destinazione.
Utilizzare la scheda Altre opzioni per impostare parametri aggiuntivi per i periodi.
- Periodo di inizio serie (facoltativo):questa opzione consente di specificare il periodo iniziale della serie di tempo, che si riflette nel grafico previsionale. Se Target Field Frequency è impostato su Hourly, Daily (all days)o Daily (weekdays), questa opzione non è disponibile.
- Il numero di periodi da includere nel grafico previsionale: Questo grafico che contiene i dati originali e un numero di punti futuri previsti (insieme agli intervalli di confidenza dell'80% e del 95% intorno ai punti di previsione). È possibile specificare il numero di periodi da prevedere nel futuro per il grafico.
- Selezionare Formato settimana: Consente di scegliere un metodo per specificare le settimane lavorate. Queste opzioni si riferiscono a ciò che costituisce la prima settimana dell'anno e il giorno della settimana che inizia una settimana.
- STATIUniti : Domenica è il primo giorno della settimana.
- RegnoUnito : Lunedì è il primo giorno della settimana.
- ISO8601: Lunedì è il primo giorno della settimana.
Utilizzare la scheda Opzioni grafiche per impostare i controlli per l'output grafico.
- Dimensioni delgrafico : Selezionare pollici o centimetri per le dimensioni del grafico.
- Risoluzione grafico: Selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi), 2x (192 dpi)o 3x (288 dpi). La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor. Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
- Dimensione carattere di base (punti):selezionare la dimensione del carattere nel grafico.
Visualizzazione dell'output
- O ancoraggio: è costituito da un flusso di output che contiene l'oggetto modello ARIMA che può essere utilizzato sia per le previsioni di punti che per un intervallo di confidenza percentile specificato dall'utente che circonda tali previsioni.
- R ancoraggio: è costituito dai frammenti di report generati dallo strumento ARIMA: un riepilogo statistico, grafici diagnostici di correzione automatica e grafici di previsione.
- Ancorare: un dashboard html interattivo che consiste di grafici e metriche. Selezionare i diversi elementi grafici per interagire con le visualizzazioni per visualizzare ulteriori informazioni, valori, metriche e analisi.
Comportamento previsto: calcoli di stampa
Il grafico di previsione utilizza una data di default per i calcoli se viene utilizzata una di queste impostazioni di configurazione:
- La frequenza dei campi di destinazione è impostata su Orario, Giornaliero (tutti i giorni)o Giornaliero (solo giorni feriali).
- La frequenza dei campi di destinazione è impostata su Settimanale, Mensile , Trimestrale o Annuale e il periodo iniziale della serie non è impostato.
La data predefinita utilizzata può variare, rendendo il calcolo casuale.