Herramienta Arima
La herramienta Arima estima un modelo de pronóstico de series temporales, ya sea como modelo univariante o uno con covariables (predictores), utilizando un método de media móvil integrado autoregresiva (o ARIMA). Arima es el enfoque de pronóstico más comúnmente usado, y se considera la clase más general de modelos para pronosticar un campo de series temporales. Los métodos de ARIMA implementados en esta herramienta pueden utilizar un enfoque automatizado para desarrollar un modelo basado en criterios estadísticos, o puede especificar directamente los parámetros subyacentes de un modelo ARIMA. Una discusión detallada del modelo ARIMA, junto con una descripción de los métodos automatizados utilizados en esta herramienta, se puede encontrar en el capítulo 8 de Hyndman y el pronóstico de libros en línea de Athanasopoulos : directores y práctica.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.
Conectar una entrada
Una secuencia de datos Alteryx que contiene datos históricos sobre la serie de tiempo que se pronosticará y (opcionalmente) un sistema de covariables. Los campos que no se usarán en la creación de modelos también pueden estar presentes en la secuencia de datos.
Configurar la herramienta
Utilice la ficha parámetros requeridos para establecer los controles básicos necesarios para crear un modelo ARIMA.
- Nombre del modelo: cada modelo debe recibir un nombre para poder identificarlo posteriormente. Los nombres de los modelos deben comenzar con una letra y pueden contener letras, números y el período de caracteres especiales (".") y subrayado ("_"). No se permiten otros caracteres especiales, y R distingue entre mayúsculas y minúsculas.
- Seleccione el campo destino: seleccione el campo de la secuencia de datos que desea pronosticar. Las mediciones para este campo deben realizarse a intervalos regulares (por ejemplo, diariamente, mensualmente, trimestralmente, etc.).
- ¿utilizar covariables en la estimación de modelos? : Si se comprueba esta opción, se presentará al usuario una lista de casillas de verificación para seleccionar los campos que se usarán como covariables en el modelo ARIMA.
- Frecuencia de campo de destino: elija el intervalo de tiempo para las observaciones del campo de destino.
Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.
Utilice la ficha modelo de personalización (opcional) para definir los controles que ajustan el modo en que el modelo procesa los datos.
- Personalice los parámetros utilizados para la creación automática de modelos...: al hacer clic en esta opción se expone un conjunto de parámetros que influyen en la creación automática de modelos. Las opciones incluyen la posibilidad de:
- Ajuste los componentes no estacionales incluyendo el nivel de primer comparación, el orden máximo del componente autoregresiva, y el orden máximo del componente medio móvil.
- Ajuste los componentes estacionales incluyendo el nivel de comparación estacional, el orden máximo del componente autoregresiva estacional, y el orden máximo del componente estacional de la media móvil.
- Seleccione los criterios de información utilizados para seleccionar entre los diferentes modelos de candidatos. De forma predeterminada se utiliza el criterio de información corregido de Akaike (AICc), pero en su lugar se puede seleccionar el criterio de información Akaike (AIC) no corregido o el criterio de información Bayesiano.
- También puede determinar si se estiman y comparan todos los modelos posibles (enumeración completa) en lugar de utilizar el algoritmo de paso por defecto. El algoritmo de paso ha demostrado tener buenas características de rendimiento, y es mucho menos intensiva computacionalmente, sin embargo, no está garantizado para encontrar el mejor modelo único. La estimación de todos los modelos ARIMA posibles encontrará el modelo único mejor, pero con un tiempo de ejecución significativamente mayor. Si se selecciona la enumeración completa, puede colocar algunos límites en el espacio buscado estableciendo el orden máximo permitido del modelo. Además, tiene la opción de utilizar varios núcleos de la máquina en la que se ejecuta Alteryx.
- También se pueden establecer opciones que permiten "deriva" en el modelo y si se aplica una transformación de Box-Cox (incluido el valor de lambda) al campo de destino.
- Modelo completamente especificado por el usuario...: al hacer clic en esta opción le permite especificar manualmente un modelo ARIMA. Los parámetros requeridos incluyen:
- Los componentes no estacionales del orden del componente autoregresiva (p), el grado de la primera comparación (d), y el orden de la media móvil (q).
- Los componentes estacionales de la orden del componente autoregresiva estacional (p), el grado de comparación estacional (D), y el orden del componente estacional de la media móvil (Q).
- También se pueden establecer opciones que permiten "deriva" dentro del modelo y si se aplica una transformación Box-Cox (incluyendo el valor de lambda) al campo de destino.
Utilice la otra ficha Opciones para establecer parámetros adicionales para los períodos.
- Período de inicio de la serie (opcional): esta opción le permite especificar el período de inicio de la serie de tiempo, que se refleja en la trama de previsión.
- El número de períodos que se incluirán en la trama de pronósticos: esta parcela que contiene los datos originales y una serie de puntos de previsión futuros (junto con intervalos de confianza del 80% y 95% alrededor de los puntos de previsión). Puede especificar el número de períodos que se deben pronosticar en el futuro para la trama.
- Seleccionar formato de semana: permite elegir un método para especificar semanas de trabajo. Estas opciones se refieren a lo que constituye la primera semana del año, y qué día de la semana comienza la semana.
- Nosotros – domingo es el primer día de la semana
- Reino Unido – lunes es el primer día de la semana
- ISO8601 – el lunes es el primer día de la semana
Si la frecuencia de campo de destino está establecida en cada hora, diariamente (todos los días)o diariamente (sólo entre semana), esta opción no está disponible.
Utilice la ficha opciones gráficas para definir los controles de la salida gráfica.
- Tamaño de la parcela: seleccione pulgadas o centímetros para el tamaño del gráfico.
-
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi). La resolución más baja crea un archivo más pequeño y es el mejor para la visión en un monitor. Una resolución más alta crea un archivo más grande con una mejor calidad de impresión.
- Tamaño de fuente base (puntos): seleccione el tamaño de la fuente en el gráfico.
Ver la salida
- O Anchor: consiste en una secuencia de salida que contiene el objeto modelo ARIMA que se puede utilizar para las dos predicciones puntuales y un intervalo de confianza del percentil especificado por el usuario que rodea esas predicciones.
- R Anchor: consiste en los fragmentos de informe generados por la herramienta Arima: un resumen estadístico, parcelas de diagnóstico de autocorrelación y diagramas de previsión.
- I ancla: un tablero de instrumentos HTML interactivo que consiste en diagramas y métricas. Puede interactuar con las visualizaciones haciendo clic en los diferentes elementos gráficos para revelar más información, valores, métricas y análisis.
- La frecuencia de campo de destino se establece en cada hora, diariamente (todos los días)o diariamente (sólo entre semana).
- la frecuencia de campo de destino se establece en semanal, mensual, trimestralo anual y el período de inicio de la serie no está configurado.
Comportamiento esperado: cálculos de trama
La trama de previsión utiliza una fecha predeterminada para los cálculos si se utilizan cualquiera de los siguientes ajustes de configuración:
La fecha predeterminada utilizada puede variar, haciendo que el cálculo parezca aleatorio.