Ferramenta ARIMA

A ferramenta ARIMA estima um modelo de previsão de séries de tempo, seja como um modelo univariada ou um com covariáveis (preditores), usando um método de média móvel integrado (ou ARIMA) de regressão automática. ARIMA é a abordagem de previsão mais comumente usada e é considerada a classe mais geral de modelos para a previsão de um campo de série temporal. Os métodos ARIMA implementados nesta ferramenta podem usar uma abordagem automatizada para desenvolver um modelo com base em critérios estatísticos, ou você pode especificar diretamente os parâmetros subjacentes de um modelo ARIMA. Uma discussão detalhada do modelo ARIMA, juntamente com uma descrição dos métodos automatizados utilizados nesta ferramenta, pode ser encontrada no capítulo 8 da Hyndman e da previsão do livro online da Athanasopoulos : diretores e práticas.

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.

Conecte uma entrada

Um fluxo de dados Alteryx contendo dados históricos sobre a série de tempo a ser previsão e (opcionalmente) um conjunto de covariáveis. Campos que não serão usados na criação do modelo também podem estar presentes no fluxo de dados.

Configure a ferramenta

Use a guia parâmetros necessários para definir os controles básicos necessários para que um modelo ARIMA seja criado.

  • Nomedo modelo: cada modelo precisa ser dado um nome para que ele possa ser identificado posteriormente. Os nomes de modelo devem começar com uma letra e podem conter letras, números e o período de caracteres especiais (".") e sublinhado ("_"). Nenhum outro caractere especial é permitido, e R é diferencia maiúsculas de minúsculas.
  • Selecione o campode destino: selecione o campo do fluxo de dados que deseja prever. As medições para este campo devem ser feitas em intervalos de tempo regulares (por exemplo, diárias, mensais, trimestrais, etc.).
  • As colunas que contêm identificadores exclusivos, como chaves primárias substitutas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.

  • Use covariáveis na estimativa do modelo? : Se essa opção for marcada, o usuário será apresentado com uma lista de caixas de seleção para selecionar os campos a serem usados como covariáveis no modelo ARIMA.
  • Freqüência do campo de destino: escolha o intervalo de tempo para as observações do campo alvo.

Use a guia personalização de modelo (opcional) para definir controles que ajustam como o modelo processa dados.

  • Personalize os parâmetros usados para a criação automática do modelo...: clicando nesta opção expõe um conjunto de parâmetros que influenciam a criação automática de modelos. As opções incluem a capacidade de:
    • Ajuste os componentes não sazonais , incluindo o nível de primeira diferenciação, a ordem máxima do componente de regressão automática e a ordem máxima do componente móvel médio.
    • Ajuste os componentes sazonais, incluindo o nível de diferenciação sazonal, a ordem máxima do componente de regressão automática sazonal e a ordem máxima do componente médio móvel sazonal.
    • Selecione os critérios de informação usados para selecionar entre diferentes modelos candidatos. Por padrão, o critério de informação Akaike corrigido (AICc) é usado, mas o critério de informação Akaike não corrigido (AIC) ou o critério de informação Bayesiana pode ser selecionado em seu lugar.
    • Você também pode determinar se todos os modelos possíveis são estimados e comparados (enumeração completa) em vez de usar o algoritmo Stepwise padrão. O algoritmo gradual foi mostrado para ter boas características de desempenho, e é muito menos computacionalmente intensivo, no entanto, não é garantido para encontrar o melhor modelo único. Estimar todos os modelos ARIMA possíveis encontrará o melhor modelo único, mas com um tempo de execução significativamente maior. Se a enumeração completa for selecionada, você poderá colocar alguns limites no espaço pesquisado definindo a ordem máxima permitida do modelo. Além disso, você tem a opção de usar vários núcleos da máquina em que Alteryx está sendo executado.
    • Opções também podem ser definidas que permitem "Drift" no modelo e se uma transformação Box-Cox (incluindo a configuração do valor lambda) é aplicada ao campo de destino.
  • Completamente modelo especificado pelo usuário...: clicar nesta opção permite que você especifique manualmente um modelo ARIMA. Os parâmetros necessários incluem:
    • Os componentes não sazonais da ordem do componente de regressão automática (p), o grau de primeira diferenciação (d) e a ordem da média móvel (q).
    • Os componentes sazonais da ordem do componente de regressão automática sazonal (p), o grau de diferenciação sazonal (D), e a ordem do componente médio móvel sazonal (Q).
    • Opções também podem ser definidas que permitem "Drift" dentro do modelo e se uma transformação Box-Cox (incluindo a configuração do valor lambda) é aplicada ao campo de destino.

Use a guia outras opções para definir parâmetros adicionais para períodos.

  • Período inicial da série (opcional): esta opção permite especificar o período inicial da série temporal, que se reflete na plotagem de previsão.
  • Se a freqüência de campo de destino for definida como por hora, diariamente (todos os dias)ou diárias (somente durante a semana), essa opção não estará disponível.

  • O número de períodos a incluir na parcela de previsão: esse enredo que contém os dados originais e um número de pontos futuros de previsão (junto com intervalos de confiança de 80% e 95% em torno dos pontos de previsão). É possível especificar o número de períodos que devem ser previstos no futuro para a plotagem.
  • Selecione formato da semana: isso permite que você escolha um método para especificar semanas de trabalho. Estas opções se relacionam com o que constitui a primeira semana do ano, e que dia da semana uma semana começa.
    • EUA – domingo é o primeiro dia da semana
    • UK – segunda-feira é o primeiro dia da semana
    • ISO8601 – segunda-feira é o primeiro dia da semana

Use a guia opções de gráficos para definir os controles da saída gráfica.

  • Tamanhodo lote: selecione polegadas ou centímetros para o tamanho do gráfico.
  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi); 2x (192 dpi); ou 3x (288 dpi). A resolução mais baixa cria um arquivo menor e é melhor para visualização em um monitor. Maior resolução cria um arquivo maior com melhor qualidade de impressão.

  • Tamanho da fonte base (pontos): selecione o tamanho da fonte no gráfico.

Visualizar a saída

  1. O âncora: consiste em um fluxo de saída contendo o objeto de modelo ARIMA que pode ser usado para ambas as previsões de ponto e um intervalo de confiança do percentil especificado ao redor dessas previsões.
  2. R Anchor: consiste nos trechos de relatório gerados pela ferramenta ARIMA: um resumo estatístico, plotagens de diagnóstico de autocorrelação e parcelas de previsão.
  3. Eu âncora: um painel de HTML interativo consistindo de parcelas e métricas. Você pode interagir com as visualizações clicando nos diferentes elementos gráficos para revelar mais informações, valores, métricas e análises.
  4. Comportamento esperado: cálculos de plotagem

    A plotagem de previsão usa uma data padrão para cálculos se qualquer uma das seguintes configurações de configuração for usada:

    • a freqüência do campo de destino é definida como por hora, diariamente (todos os dias)ou diárias (somente durante a semana).
    • A freqüência de campo de destino é definida como semanal, mensal, trimestralou anual e o período de início da série não está definido.

    A data padrão usada pode variar, fazendo com que o cálculo pareça aleatório.