Fluxo de trabalho de exemplo
A ARIMA tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
A ferramenta ARIMA treina um modelo de previsão de série temporal, seja como um modelo univariado ou com covariáveis (preditores), usando um método de modelo autorregressivo integrado de médias móveis (ARIMA). ARIMA é a abordagem de previsão mais utilizada e é considerada a classe mais generalizada de modelos para prever um campo de série temporal. Os métodos ARIMA implementados nesta ferramenta podem usar uma abordagem automatizada para desenvolver um modelo baseado em critérios estatísticos, ou você pode especificar diretamente os parâmetros subjacentes de um modelo ARIMA. Uma discussão detalhada sobre o modelo ARIMA, junto com uma descrição dos métodos automatizados usados nesta ferramenta, está apresentada no capítulo 8 do livro online de Hyndman e Athanasopoulos Forecasting: Principles and Practice.
Nota
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
Conecte um fluxo de dados do Alteryx que contenha os dados históricos sobre a série temporal que será prevista e, opcionalmente, um conjunto de covariáveis. Os campos que não serão usados na criação do modelo também podem estar presentes no fluxo de dados.
Use a guia Parâmetros obrigatórios para definir os controles básicos obrigatórios para criação de um modelo ARIMA.
Nome do modelo: cada modelo precisa de um nome para que possa ser identificado mais tarde. Os nomes de modelo devem começar com uma letra e podem conter letras, números e os caracteres especiais ponto (".") e sublinhado ("_"). Nenhum outro caractere especial é permitido, e a ferramenta R diferencia maiúsculas de minúsculas.
Selecione o campo-alvo: selecione o campo do fluxo de dados que você deseja prever. As medições para este campo precisam ser feitas em intervalos regulares (por exemplo, diariamente, mensalmente, trimestralmente, etc.). As colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.
Usar covariáveis no treinamento do modelo?: se assinalar esta opção, será apresentada uma lista de caixas de verificação para selecionar os campos a utilizar como covariáveis no modelo ARIMA.
Frequência do campo-alvo: escolha o intervalo de tempo para as observações do campo-alvo.
Use a guia Personalização do modelo (opcional) para definir controles que ajustam a forma como o modelo processa os dados.
Personalizar os parâmetros usados para criação automática de modelos: selecione essa opção para exibir um conjunto de parâmetros que influenciam a criação automática de modelos. As opções incluem a capacidade de...
Ajustar os componentes não sazonais, incluindo o nível de primeira diferenciação, a ordem máxima do componente autorregressivo e a ordem máxima do componente de média móvel.
Ajustar os componentes sazonais, incluindo o nível de diferenciação sazonal, a ordem máxima do componente autorregressivo sazonal e a ordem máxima do componente de média móvel sazonal.
Selecione os critérios de informação usados para escolher entre os modelos candidatos diferentes. Por padrão, o critério de informação de Akaike corrigido (AICc) é usado, mas é possível selecionar o critério de informação de Akaike (AIC) não corrigido ou Bayesiano em vez do padrão.
Você também pode determinar se todos os modelos possíveis serão treinados e comparados (enumeração completa) em vez de usar o algoritmo stepwise (passo a passo) padrão. O algoritmo stepwise (passo a passo) tem apresentado características de bom desempenho e requer muito menos uso de computação, no entanto, não há uma garantia de encontrar um modelo melhor único. O treinamento de todos os modelos ARIMA possíveis encontra o modelo melhor único, mas com um tempo de execução significativamente maior. Se a enumeração completa foi selecionada, você pode definir alguns limites quanto ao espaço de pesquisa, especificando a ordem máxima permitida do modelo. Você também pode usar vários núcleos da máquina que executa o Alteryx.
É possível também definir opções que permitem um "desvio" no modelo e se uma transformação Box-Cox (incluindo a definição do valor de lambda) é aplicada ao campo-alvo.
Modelo completamente especificado pelo usuário...: selecione essa opção para especificar manualmente um modelo ARIMA. Os parâmetros obrigatórios incluem...
Os componentes não sazonais da ordem do componente autorregressivo (p), o grau de primeira diferenciação (d) e a ordem da média móvel (q).
Os componentes sazonais da ordem do componente autorregressivo sazonal (P), o grau de diferenciação sazonal (D) e a ordem do componente de média móvel sazonal (Q).
É possível também definir opções que permitem um "desvio" no modelo e se uma transformação Box-Cox (incluindo a definição do valor de lambda) é aplicada ao campo-alvo.
Use a guia Outras opções para definir parâmetros adicionais para os períodos.
Período inicial da série (opcional): essa opção permite especificar o período inicial da série temporal, que é refletido no gráfico de previsão. Se Frequência do campo-alvo estiver definida como A cada hora, Diariamente (todos os dias) ou Diariamente (somente dias úteis), esta opção não estará disponível.
O número de períodos a serem includos no gráfico de previsão: este gráfico que contém os dados originais e um número de pontos futuros de previsão (junto com os intervalos de confiança de 80% e 95% em torno dos pontos de previsão). Você pode especificar no gráfico o número de períodos que devem ser previstos no futuro.
Selecionar o formato de semana: permite escolher um método para especificar as semanas de trabalho. As opções indicam o que constitui a primeira semana do ano e o dia da semana em que a semana começa.
EUA: domingo é o primeiro dia da semana.
Reino Unido: segunda-feira é o primeiro dia da semana.
ISO8601: segunda-feira é o primeiro dia da semana.
Use a guia Opções de gráfico para definir os controles para o gráfico de saída.
Tamanho do gráfico: selecione polegadas ou centímetros para o tamanho do gráfico.
Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).
Resoluções mais baixas geram um arquivo menor que é melhor para visualização em um monitor.
Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.
Tamanho da fonte base (pontos): selecione o tamanho da fonte para o gráfico.
Âncora O: consiste em um fluxo de saída que contém o objeto de modelo ARIMA que pode ser usado tanto para previsões pontuais quanto para um intervalo de confiança de percentil que envolve essas previsões e que é especificado pelo usuário.
Âncora R: consiste nos fragmentos de relatório gerados pela ferramenta ARIMA: um resumo estatístico, gráficos de diagnóstico de autocorrelação e gráficos de previsão.
Âncora I: um painel HTML interativo que consiste em gráficos e métricas. Selecione os diferentes elementos gráficos para interagir com as visualizações e exibir mais informações, valores, métricas e análises.
Comportamento esperado: cálculos de gráficos
O gráfico de previsão usa uma data padrão para os cálculos se qualquer uma destas configurações é usada:
Frequência do campo-alvo está definida como A cada hora, Diariamente (todos os dias) ou Diariamente (somente dias úteis).
Frequência do campo-alvo está definida como Semanalmente, Mensalmente, Trimestralmente ou Anualmente e o Período inicial da série não está definido.
A data padrão usada pode variar, fazendo com que o cálculo pareça aleatório.