Fluxo de trabalho de exemplo
O Preenchedor TS tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use o Preenchedor TS para utilizar um fluxo de dados de série temporal e preencher quaisquer lacunas na série.
Esta ferramenta é usada principalmente como um passo de preparação para usar as ferramentas e as macros relacionadas a séries temporais em etapas posteriores. Algumas ferramentas de séries temporais retornam resultados inesperados ou erros se o fluxo de dados contém lacunas nas séries temporais. Por exemplo, você tem uma série de dados que supostamente contém medições a cada 5 minutos, mas, na verdade, você não tem medições que são feitas a cada 5 minutos. Use esta macro sempre que suspeitar que o fluxo de dados pode conter lacunas/falhas.
Nota
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
A ferramenta Preenchedor TS requer um fluxo de dados do Designer que tenha uma coluna com valores de data ou de data/hora.
Use a guia Configuração para definir os controles para o preenchimento da série temporal.
Selecionar coluna data (Date) ou data e hora (DateTime): escolha a coluna de data ou data/hora que indica quando a linha de dados foi coletada.
Intervalo: selecione o intervalo que será usado para medir a série temporal. As opções incluem Minuto, Hora, Dia, Semana, Mês e Ano.
Incremento: selecione o incremento pelo qual cada período de série temporal exclusivo deve ser separado. Você pode definir o incremento como um número inteiro de 1 a 100.
Para gerar uma série que inclua "a cada 3 semanas", defina Intervalo como "Semana" e Incremento como 3.
Todas as linhas que entram na macro aparecem na saída. Além disso, a macro avalia se faltam períodos na série temporal e, em caso afirmativo, gera uma linha para preencher a lacuna.
A ferramenta acrescenta duas colunas de dados ao fluxo de entrada:
OriginalDateTime: uma coluna de data/hora que contém o valor de data/hora original e inalterado.
FlagGeneratedRow: uma coluna de sinalizador booleano, em que "True" (verdadeiro) indica que a linha de dados foi gerada pela macro para preencher uma lacuna de série temporal e "False" (falso) indica que se trata de uma linha de dados de origem.
Para linhas de dados de origem que passam pela macro:
A coluna FlagGeneratedRow exibe "False" (falso) para indicar que se trata de uma linha de dados de origem, não uma linha gerada pela macro.
A coluna [yourDateTimeColumn] é "arredondada" para o período apropriado. Consulte a sessão Arredondamento abaixo.
Todas as outras colunas de origem se mantêm inalteradas.
No caso das linhas que foram geradas para preencher lacunas:
A coluna FlagGeneratedRow exibe "True" (verdadeiro) para indicar que a linha foi gerada pela macro e não é uma linha de dados de origem.
A coluna [yourDateTimeColumn] tem um valor de data ou data/hora preenchido que foi gerado pela macro, que "preenche" a lacuna identificada na série.
Todas as outras colunas são nulas.
De acordo com os cenários de uso de negócios mais comuns, os períodos de série temporal são tratados da seguinte forma:
"Nível de tempo": para intervalos
"Nível de data": para intervalos >= um dia, o período é "fim do período".
A única modificação que a macro faz nos dados de entrada é: um "arredondamento" aplicado a [yourDateTimeColumn]. Isso é baseado em três elementos-chave:
Intervalo
Valor de data/hora mais antigo no fluxo de dados
Incremento
Primeiro, todas as frações do intervalo escolhido são truncadas. Por exemplo, se você escolher "Hora" como o intervalo, a macro truncará os minutos e os segundos do valor de data/hora, conforme mostrado a seguir. 1:58 pm passa a ser 1:00 pm.
Depois de truncar as frações do intervalo escolhido, a macro determina quais são os períodos válidos. O valor de data/hora mais antigo inserido na macro constitui a base da série. Dando continuidade ao exemplo da "série-hora" acima, se a data/hora mais antiga em [yourDateTimeColumn] for 1:58 pm, o primeiro período será 1:00 pm. Se o incremento escolhido for 5, os períodos seguintes serão gerados com base na adição sucessiva do incremento escolhido, 5 horas, ao período anterior; o que, nesse caso, resulta em 1:00 pm, 6:00 pm, 11:00 pm etc.
Por fim, agora que todos os períodos válidos foram determinados, os valores de data/hora são ajustados para o período válido adequado. Portanto, um valor bruto de 5:59 pm em [yourDateTimeColumn] torna-se 5:00 pm, 6:02 pm torna-se 6:00 pm e assim por diante.
Depois que todos os ajustes de data/hora forem aplicados pela macro, o [yourDateTimeColumn] resultante será efetivamente um "rótulo" desse período. No entanto, o tipo de dados é uma coluna de data (date) ou de data/hora (date-time) e não de uma cadeia de caracteres (string). Dessa forma, o "rótulo" pode não ser totalmente intuitivo. O importante é reconhecer que qualquer parte do "rótulo" de data ou data/hora que seja "fracionária" no intervalo escolhido deve ser ignorada. Portanto, se o intervalo for "ano", um exemplo de período pode ser "2018-01-01", mas o ano é o que importa no rótulo, as partes fracionárias do rótulo ("01-01") devem ser ignoradas, o que significa que o período é apenas o ano 2018, ou "qualquer momento em 2018". Veja a tabela abaixo.
Além do "arredondamento" de data/hora descrito acima, observe que a macro não altera os dados de entrada. Ela não faz nenhuma combinação, sumarização, exclusivação e nem qualquer tipo de validação nos dados de entrada. No entanto, devido ao arredondamento de datas, várias medições dentro do mesmo período agora recebem o mesmo rótulo de período. Desse modo, os dados agora são mais claros e podem ser sumarizados com mais rapidez porque podem ser "agrupados" por esse rótulo de período consistente e arredondado.
Observe que a macro não considera o horário de verão, por isso, se você tiver dados de séries no nível temporal que passam pela mudança de horário de verão, é possível que a macro gere uma linha de horas (ou de minutos) para representar uma hora inválida. Por exemplo, as áreas com horário de verão que adianta em uma hora em março terão linhas geradas para as 2 horas da manhã no dia da mudança de horário, mesmo que essa hora nunca tenha de fato ocorrido (o relógio muda de 1:59:59 para 3:00:00). É possível remover essa hora com uma ferramenta de filtro após a macro.
Para esclarecer, a tabela a seguir lista as opções de intervalo disponíveis, seguidas do tipo de dado retornado e se o período para esse tipo de intervalo é "inicial" ou "final". Na sequência, a tabela exibe um exemplo de incremento e o "primeiro valor bruto" na série, para ilustrar o "rótulo" do período resultante, e uma descrição do significado real do rótulo do período. Por fim, a tabela indica a parte do rótulo do período que deve ser ignorada, como as partes que são fracionárias no intervalo.
Intervalo | Tipo de dado retornado | Início/Fim do período | Exemplo de incremento | Exemplo de primeiro valor bruto | Rótulo do primeiro período resultante | Descrição do período | Rótulo para ignorar no período |
---|---|---|---|---|---|---|---|
Minuto | Data e Hora | Iniciando | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | "O período de 2 minutos que COMEÇA às 2:16, que engloba tudo de 2:16 e 2:17" | Segundos |
Hora | Data e Hora | Iniciando | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | "O período de 4 horas que COMEÇA às 2 horas, que engloba todas as 2, 3, 4 e 5 horas." | Minutos ou menos |
Dia | Data | Final | 6 | 2015-04-09 02:16:33 | 2015-04-09 | "O período de 6 dias que TERMINA em 4/9 (mês/dia), que engloba tudo de 4/4 (mês/dia) a 4/9 (mês/dia)." | Horas ou menos |
Semana | Data | Final | 1 | 2015-04-09 02:16:33 | 2015-04-09 | "O período de 1 semana que TERMINA em 4/9 (mês/dia), que engloba tudo de 3/9 (mês/dia) a 4/9 (mês/dia)." | Horas ou menos |
Mês | Data | Final | 3 | 2015-04-09 02:16:33 | 2015-04-01 | "O período de 3 meses que TERMINA em abril, que engloba tudo de fevereiro, março e abril." | Dias ou menos |
Ano | Data | Final | 2 | 2015-04-09 02:16:33 | 2015-04-01 | "O período de 2 anos que TERMINA em 2015, que engloba tudo de 2014 e 2015." | Meses ou menos |