
Ferramenta Preenchedor TS
Use o Preenchimento da Série Time para obter um fluxo de dados de dados da série de tempo e preencher quaisquer lacunas na série.
Esta ferramenta é usada principalmente como uma etapa de preparação para usar as ferramentas e as macros relacionadas às séries de tempo downstream. Algumas ferramentas de série de tempo produzem resultados ou erros inesperados se o fluxo de dados contiver lacunas na série temporal, por exemplo, você tem uma série de dados que supostamente contêm medições a cada 5 minutos, mas você realmente não tem medidas cobrindo a cada 5 minutos. Use essa macro sempre que você suspeitar que seu fluxo de dados pode ter lacunas nele.
Esta ferramenta utiliza a ferramenta R. Vá para Opções > Baixe ferramentas preditivas e faça login no portal Alteryx Downloads and Licenses para instalar R e os pacotes utilizados pela Ferramenta R. Consulte Baixar e Usar Ferramentas Preditivas.
Conectar uma entrada
A ferramenta preenchimento TS requer um fluxo de dados Designer que tenha uma coluna contendo valores de data ou data-hora.
Configurar a ferramenta
Use a guia Configuração para definir os controles para como a série de tempo é preenchida.
- Selecione Data ou coluna DataTime: Escolha a coluna data ou data-hora que indica quando a linha de dados foi coletada.
- Intervalo: Selecione o intervalo pelo qual a série de tempo é medida. As opções incluem Minutos, Hora, Dia, Semana, Mêse Ano.
- Incremento: Selecione o incremento pelo qual cada período de série de tempo único deve ser separado. Você pode definir o incremento para qualquer número inteiro de 1 a 100.
Exemplo
Para gerar uma série cobrindo "a cada 3 semanas" você definiria intervalo para semana e incremento para 3.
Ver a saída
Cada linha que entra na macro aparece na saída. Além disso, a macro é avaliada se quaisquer períodos na série temporal estiverem ausentes e, em caso disso, gerará uma linha para preencher a lacuna.
A ferramenta anexa duas colunas de dados ao fluxo de dados de entrada:
- OriginalDateTime: Uma coluna de data-hora que contém o valor original e sem tempo de data
- FlagGeneratedRow: Uma coluna de bandeira booleana, onde "True" indica que a linha de dados foi gerada pela macro para preencher uma lacuna de séries temporais e "False" indica que é uma linha de dados de origem.
Para linhas de dados de origem passando pela macro:
- A coluna FlagGeneratedRow lê "Falso" para indicar que é uma linha de dados de origem, não uma linha gerada pela macro.
- A coluna [seuDateTimeColumn] está "arredondada" para o período apropriado. Veja a seção Rounding abaixo.
- Todas as outras colunas de origem passam sem mudanças.
Para as linhas que foram geradas para preencher lacunas:
- A coluna FlagGeneratedRow diz "True" para indicar que é uma linha gerada pela macro, não uma linha de dados de origem.
- A coluna [seuDateTimeColumn] tem um valor de data ou data-hora preenchido gerado pela macro que "preenche" a lacuna identificada na série.
- Todas as outras colunas são nulas.
Início/término do período
Por cenários de uso de negócios mais comuns, os períodos de séries de tempo são tratados da seguinte maneira:
- "Nível de tempo": Para intervalos
- "Nível de data": Para intervalos >= por dia, o período é "término do período".
DataTime "Rounding"
A única modificação que a macro faz aos dados recebidos é: um "arredondamento" é aplicado ao [seuDateTimeColumn]. Baseia-se em três elementos-chave:
- Intervalo
- Valor mais antigo da data no fluxo de dados
- Incremento
Primeiro, todas as frações do intervalo escolhido são truncadas. Por exemplo, se você escolher "Hora" como intervalo, a macro irá truncar qualquer minuto e segundos do valor da data-hora, por exemplo. 13h58 às 13h.
Depois de truncar as frações do intervalo escolhido, a macro, em seguida, determina quais são os períodos válidos. O valor mais antigo da data-hora que entra na macro forma a base da série. Continuando o exemplo acima de "série de horas", se a data mais antiga no [seuDateTimeColumn] for 1:58pm, então o primeiro período é 13:00 pm. Se o incremento escolhido for de 5, os períodos subsequentes ão gerados com base na adição sucessiva do incremento escolhido — 5 horas — ao período anterior, resultando neste caso às 13:00, 18:00, 23:00, etc.
Finalmente, agora que todos os períodos válidos foram determinados, todos os valores de data-hora são então ajustados ao período válido apropriado. Assim, um valor bruto de 5:59pm no [seuDateTimeColumn] torna-se 17:00 e 18:02pm torna-se 18:00, etc.
Período "Rótulos"
Depois que todos os ajustes de data-data foram aplicados pela macro, o resultado [seuDateTimeColumn] agora é efetivamente um "rótulo" para esse período. No entanto, o datatype é uma coluna data ou data-time (em vez de uma string), e como tal este "rótulo" pode não ser totalmente intuitivo. A chave é reconhecer que qualquer parte do "rótulo" data ou data-time que seja "fracionado" para o intervalo escolhido deve ser ignorada. Então, se você intervalo é "ano", então um período de exemplo pode ser "2018-01-01" mas é o ano que importa no rótulo, as porções fracionadas do rótulo — o "01-01"– devem ser ignoradas, o que significa que o período é simplesmente o ano de 2018, ou "qualquer momento em 2018". Veja a tabela abaixo.
Preservação de dados
Observe que, além do "arredondamento" da data descrito acima, a macro não altera nenhum dado recebido. Ele não faz nenhuma combinação, resumição, uniquing ou qualquer tipo de validação nos dados recebidos. No entanto, por causa da data de arredondamento, várias medições dentro do mesmo período vai agora levar a mesma etiqueta de período. Como tal, os dados são agora mais limpos e podem ser mais facilmente resumidos porque os dados podem ser "agrupados por" este rótulo de período consistente e arredondado.
Horário de verão
Observe que a macro não conta para o horário de verão, portanto, se você tiver dados de série de nível de tempo que cruza um horário de verão transição, é possível que a macro irá gerar uma linha de hora (ou linhas de minutos) representando uma hora inválido. Por exemplo, áreas que "Primavera para a frente" uma hora em março terão filas geradas para as 2h do dia da primavera, mesmo que essa hora nunca tenha ocorrido (o relógio muda de 1:59:59 para 3:00:00). Esta hora pode ser facilmente removida com uma ferramenta de filtro após a macro.
Exemplo de caso de uso
Para esclarecer, a tabela a seguir lista as opções de intervalo disponíveis, seguidas pelo tipo de dados devolvido e se o período para esse tipo de intervalo é um intervalo de "início de período" ou "término de período". A tabela então exibe um incremento de exemplo e "primeiro valor bruto" na série, para ilustrar qual seria o período resultante "Label" e uma descrição em inglês do que o rótulo de período realmente significa. Por fim, a tabela observa qual parte do rótulo do período deve ser essencialmente ignorada, como as porções fracionadas até o intervalo.
Intervalo | Tipo de dados retornado | Início/término do período | Incremento de exemplo | Exemplo primeiro valor bruto | Rótulo do primeiro período do resultado | Descrição do período | Ignorar na etiqueta de período |
---|---|---|---|---|---|---|---|
Minuto | Data e Hora | Começando | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | "O período de 2 minutos a partir de 2:16, cobrindo todos os 2:16 e 2:17" | Segundos |
Hora | Data e Hora | Começando | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | "O período de 4 horas a partir de 2, cobrindo todas as 2, 3, 4 e 5 horas." | Minutos ou menos |
Dia | Data (Date) | Final | 6 | 2015-04-09 02:16:33 | 2015-04-09 | "o período de 6 dias que termina em 4/9, cobrindo todos de 4/4-4/9." | Horas ou menos |
Semana | Data (Date) | Final | 1 | 2015-04-09 02:16:33 | 2015-04-09 | "o período de 1 semana que termina em 4/9, cobrindo todos de 4/3-4/9." | Horas ou menos |
Mês | Data (Date) | Final | 3 | 2015-04-09 02:16:33 | 2015-04-01 | "o período de 3 meses que termina em abril, cobrindo todos de fevereiro, março e abril." | Dias ou menos |
Ano | Data (Date) | Final | 2 | 2015-04-09 02:16:33 | 2015-04-01 | "o período de 2 anos que termina em 2015, cobrindo todos de 2014 e 2015." | Meses ou menos |