
Ferramenta ARIMA
A ferramenta ARIMA estima um modelo de previsão de séries de tempo, seja como um modelo univariada ou um com covariáveis (preditores), usando um método de média móvel integrado (ou ARIMA) de regressão automática. ARIMA é a abordagem de previsão mais utilizada e é considerada a classe mais geral de modelos para a previsão de um campo de séries temporizais. Os métodos ARIMA implementados nesta ferramenta podem usar uma abordagem automatizada para desenvolver um modelo com base em critérios estatísticos, ou você pode especificar diretamente os parâmetros subjacentes de um modelo ARIMA. Uma discussão detalhada do modelo ARIMA, juntamente com uma descrição dos métodos automatizados utilizados nesta ferramenta, pode ser encontrada no Capítulo 8 do livro online de Hyndman e Athanasopoulos, Forecasting: Principals and Practice.
Esta ferramenta utiliza a ferramenta R. Vá para Opções > Baixe ferramentas preditivas e faça login no portal Alteryx Downloads and Licenses para instalar R e os pacotes utilizados pela Ferramenta R. Consulte Baixar e Usar Ferramentas Preditivas.
Conectar uma entrada
Um fluxo de dados Alteryx contendo dados históricos sobre a série de tempo a ser previsão e (opcionalmente) um conjunto de covariáveis. Campos que não serão usados na criação do modelo também podem estar presentes no fluxo de dados.
Configurar a ferramenta
Use a guia parâmetros necessários para definir os controles básicos necessários para que um modelo ARIMA seja criado.
- Nome do modelo: Cada modelo precisa ser dado um nome para que ele possa ser identificado posteriormente. Os nomes dos modelos devem começar com uma letra e podem conter letras, números e o período de caracteres especiais (".") e sublinhar ("_"). Nenhum outro caractere especial é permitido, e R é diferencia maiúsculas de minúsculas.
- Selecione o campo de destino: Selecione o campo a partir do fluxo de dados que deseja prever. As medições para este campo precisam ser feitas em intervalos de tempo regulares (por exemplo, diariamente, mensal, trimestral, etc.). Colunas contendo identificadores exclusivos, como chaves primárias substitutas e chaves primárias naturais, não devem ser utilizadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.
- Usar covariáveis na estimativa do modelo? Se esta opção for verificada, você será apresentado com uma lista de caixas de seleção para selecionar os campos a serem usados como covariáveis no modelo ARIMA.
- Frequência de campo alvo: Escolha o intervalo de tempo para as observações do campo de destino.
Use a guia De personalização de modelo (opcional) para definir controles que ajustem como o modelo processa dados.
- Personalize os parâmetros utilizados para a criação automática do modelo...: Selecione esta opção para expor um conjunto de parâmetros que influenciam a criação automática do modelo. As opções incluem a capacidade de...
- Ajuste os componentes não sazonais, incluindo o nível de primeiro diferenciamento, a ordem máxima do componente autoregressivo e a ordem máxima do componente médio móvel.
- Ajuste os componentes sazonais, incluindo o nível de diferenciação sazonal, a ordem máxima do componente autoregressivo sazonal e a ordem máxima do componente médio móvel sazonal.
- Selecione os critérios de informação usados para selecionar entre diferentes modelos candidatos. Por padrão, o critério de informação Akaike corrigido (AICc) é usado, mas o critério de informação Akaike não corrigido (AIC) ou o critério de informação Bayesiana pode ser selecionado em seu lugar.
- Você também pode determinar se todos os modelos possíveis são estimados e comparados(enumeração total) em vez de usar o algoritmo de stepwise padrão. O algoritmo stepwise tem se mostrado ter boas características de desempenho e é muito menos computacionalmente intensivo, no entanto, não é garantido encontrar o melhor modelo único. Estimar todos os modelos ARIMA possíveis encontrará o melhor modelo único, mas com um tempo de execução significativamente maior. Se a enumeração completa for selecionada, você poderá colocar alguns limites no espaço pesquisado definindo a ordem máxima permitida do modelo. Além disso, você tem a opção de usar vários núcleos da máquina em que alteryx está sendo executado.
- Opções também podem ser definidas que permitem "Drift" no modelo e se uma transformação Box-Cox (incluindo a configuração do valor lambda) é aplicada ao campo de destino.
- Modelo completamente especificado pelo usuário...: Selecione esta opção para especificar manualmente um modelo ARIMA. Os parâmetros necessários incluem...
- Os componentes não sazonais da ordem do componente autoregressivo (p), o grau de primeiro diferenciamento (d) e a ordem da média móvel (q).
- Os componentes sazonais da ordem do componente autoregressivo sazonal (P), o grau de diferenciamento sazonal (D) e a ordem do componente médio móvel sazonal (Q).
- Opções também podem ser definidas que permitem "Drift" dentro do modelo e se uma transformação Box-Cox (incluindo a configuração do valor lambda) é aplicada ao campo de destino.
Use a guia Outras opções para definir parâmetros adicionais para períodos.
- Período de início da série (opcional): Esta opção permite especificar o período inicial da série temporal, o que se reflete no gráfico de previsão. Se a Frequência de Campo alvo for definida para Hora,Diária (todos os dias)ou Diariamente (somente durante a semana),esta opção não está disponível.
- O número de períodos a serem adicionados na trama de previsão: Este gráfico que contém os dados originais e uma série de pontos futuros previstos (juntamente com intervalos de confiança de 80% e 95% em torno dos pontos de previsão). É possível especificar o número de períodos que devem ser previstos no futuro para a plotagem.
- Selecione o formato da semana: Isso permite que você escolha um método para especificar semanas de trabalho. Estas opções se relacionam com o que constitui a primeira semana do ano, e que dia da semana uma semana começa.
- EUA: Domingo é o primeiro dia da semana.
- Reino Unido: Segunda-feira é o primeiro dia da semana.
- ISO8601: Segunda-feira é o primeiro dia da semana.
Use a guia Opções gráficas para definir os controles para a saída gráfica.
- Tamanho da parcela:Selecione polegadas ou centímetros para o tamanho do gráfico.
- Resolução do gráfico: Selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi)ou 3x (288 dpi). A resolução mais baixa cria um arquivo menor e é melhor para visualização em um monitor. Maior resolução cria um arquivo maior com melhor qualidade de impressão.
- Tamanho da fonte base (pontos): Selecione o tamanho da fonte no gráfico.
Ver a saída
- O âncora: Consiste em um fluxo de saída que contém o objeto modelo ARIMA que pode ser usado tanto para previsões de pontos quanto para um intervalo de confiança percentil especificado pelo usuário em torno dessas previsões.
- R âncora: Consiste nos trechos do relatório gerados pela ferramenta ARIMA: um resumo estatístico, parcelas de diagnóstico de autocorrelação e gráficos de previsão.
- Ancorar: um painel html interativo que consiste em plots e métricas. Selecione os diferentes elementos gráficos para interagir com as visualizações para revelar mais informações, valores, métricas e análises.
Comportamento esperado: Cálculos da trama
O gráfico de previsão usa uma data padrão para cálculos se alguma dessas configurações for usada:
- A frequência de campo alvo é definida para Por hora, diariamente (todos os dias)ou diariamente (somente durante a semana).
- A frequência de campo-alvo é definida para semanal, mensal, trimestralou anualmente e o período de início da série não está definido.
A data padrão utilizada pode variar, fazendo com que o cálculo pareça aleatório.