Herramienta de relleno TS
La herramienta de relleno de series temporales toma una secuencia de datos de datos de series temporales y rellena cualquier hueco de la serie.
Esta herramienta se utiliza principalmente como un paso de preparación para usar macros y herramientas relacionadas con series temporales. Algunas herramientas de series temporales producen resultados inesperados o errores si la secuencia de datos contiene brechas en la serie de tiempo, por ejemplo, usted tiene una serie de datos que se supone que contienen mediciones cada 5 minutos, pero en realidad no tiene medidas que cubren cada 5 minutos. Utilice esta macro siempre que sospeche que el flujo de datos puede tener huecos en él.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.
Conectar una entrada
La herramienta de relleno TS requiere una secuencia de datos que tenga una columna que contenga valores Date o DateTime.Designer
Configurar la herramienta
Utilice la ficha Configuración para establecer los controles de cómo se rellena la serie de tiempo.
- Seleccione la columna Date o DateTime: elija la columna Date o DateTime que indica cuándo se ha recopilado la fila de datos.
- Intervalo: seleccione el intervalo por el cual se mide la serie de tiempo. Las opciones incluyen minuto, hora, día, semana, mesy año.
- Incremento: seleccione el incremento por el cual se debe separar cada período de series temporales únicas. Puede establecer el incremento en cualquier número entero de 1 a 100.
Ver la salida
Cada fila que entra en la macro aparece en la salida. Además, la macro evalúa si falta algún período en la serie de tiempo y, de ser así, genera una fila para rellenar el espacio.
La herramienta anexa dos columnas de datos a la secuencia de datos entrante:
- OriginalDateTime: columna DateTime que contiene el valor DateTime original e inalterado
- FlagGeneratedRow: una columna de indicador booleano, con "true" que indica que la fila de datos fue generada por la macro para llenar una brecha de series temporales; "false" que indica que es una fila de datos de origen.
Para las filas de datos de origen que pasan a través de la macro:
- La columna FlagGeneratedRow leerá "false" para indicar que es una fila de datos de origen; no una fila generada por la macro.
- La columna [yourDateTimeColumn] se "redondeará" al período apropiado. Vea la sección "redondeo" abajo.
- Todas las demás columnas de origen pasarán inalteradas.
Para las filas que se generaron para rellenar brechas:
- La columna FlagGeneratedRow leerá "true" para indicar que es una fila generada por la macro, no una fila de datos de origen.
- La columna [yourDateTimeColumn] tendrá una fecha de llenado o un valor DateTime generado por la macro que "rellena" la brecha identificada en la serie.
- Todas las demás columnas serán nulas.
Por los escenarios de uso de negocios más comunes, los períodos de series temporales se manejan de la siguiente manera:
- "tiempo-nivel": para los intervalos
- "fecha-nivel": para los intervalos > = un día, el período es "final del período."
La única modificación que la macro hace a los datos entrantes es: un "redondeo" se aplica a la [yourDateTimeColumn]. Se basa en tres elementos clave:
- Intervalo
- Primer valor DateTime en secuencia de datos
- Incremento
En primer lugar, todas las fracciones del intervalo elegido se truncan. Por ejemplo, si selecciona "Hour" como intervalo, la macro truncará los minutos y segundos del valor DateTime, por lo que, por ejemplo, 1:58pm se convertirá en 1:00PM.
Después de truncar las fracciones del intervalo elegido, la macro determina cuáles son los períodos válidos. El primer valor DateTime que ingresa a la macro forma la base de la serie. Continuando el ejemplo de la "hora-serie", si el primer DateTime en el [yourDateTimeColumn] era 1:58pm, entonces el primero es 1:00PM. Si el incremento elegido es 5, los períodos subsecuentes se generan basándose en sucesivamente añadiendo el incremento seleccionado — 5 horas — al período anterior, dando como resultado este caso a 1:00PM, 6:00PM, 11:00PM etc.
Finalmente, ahora que se han determinado todos los períodos válidos, todos los valores DATETIME se ajustan al período válido apropiado. Así que un valor RAW de 5:59pm en el [yourDateTimeColumn] se convertiría en 1:00PM, 6:02pm se convertiría en 6:00PM, etc.
Una vez que la macro ha aplicado todos los ajustes DateTime, el [yourDateTimeColumn] resultante es ahora efectivamente una "etiqueta" para ese período. Sin embargo, el tipo de datos es una columna Date o DateTime (en lugar de una cadena), y como tal, esta "etiqueta" puede no ser totalmente intuitiva. La clave es reconocer que cualquier parte de la fecha o DateTime "Label" que es "fraccional" al intervalo elegido debe ignorarse. Así que si el intervalo es "año", que un período de ejemplo podría ser "2018-01-01", pero es el año que importa en la etiqueta; las porciones fraccionarias de la etiqueta — el "01-01" — deben ser ignoradas, lo que significa que el período es simplemente el año 2018, o "en cualquier momento en 2018". Vea la tabla abajo.
Tenga en cuenta que, aparte de la "redondeo" DateTime descrita anteriormente, la macro no altera los datos entrantes. No hace ninguna combinación, resumir, uniquing o cualquier tipo de validaciones en los datos entrantes. Sin embargo, debido a la fecha de redondeo, las mediciones múltiples dentro del mismo período llevarán ahora la misma etiqueta de período. Como tal, los datos son ahora más limpios y pueden ser resumidos más fácilmente porque los datos pueden ser "agrupados por" esta etiqueta consistente, de período redondeado.
Note que la macro no tiene en cuenta el horario de verano, así que si usted tiene datos de series de tiempo que atraviesan un tiempo de verano cutover, es posible que la macro genere una fila de hora (o filas de minutos) que representen una hora no válida. Por ejemplo, las áreas que "avanzan" una hora en marzo tendrán fila (s) generadas para la hora de las 2:00 en el día de avance de primavera, aunque esa hora nunca ocurrió realmente. (el reloj cambia de 1:59:59 a 3:00:00.) Esta hora se puede quitar fácilmente con una herramienta de filtrado después de la macro.
Para clarificar, en la tabla siguiente se enumeran las opciones de intervalo disponibles, seguida de qué tipo de la misma se devuelve y si el período para ese tipo de intervalo es un intervalo de "Inicio de período" o "período final". A continuación, la tabla muestra un incremento de ejemplo y un "primer valor RAW" en la serie, para ilustrar cuál sería el período resultante "Label" y una descripción en Inglés de lo que realmente significa la etiqueta del período. Finalmente, la tabla toma nota de qué parte de la etiqueta del período debe ser ignorada esencialmente, es decir, las porciones que son fraccionarias al intervalo.
Intervalo | Tipo de datos devuelto | Inicio/finalización del período | Ejemplo de incremento | Ejemplo primer valor RAW | Etiqueta del primer período del resultado | Descripción del período | Omitir en etiqueta de período |
---|---|---|---|---|---|---|---|
Minuto |
Fecha y hora | Comenzando | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | "el período de 2 minutos a partir de 2:16, cubriendo todos los 2:16 y 2:17" | Segundos |
Hora |
Fecha y hora | Comenzando | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | "el período de 4 horas a partir de las 2, cubriendo todas las 2, 3, 4 y 5 horas." | Minutos o menos |
Día |
Fecha | Final | 6 | 2015-04-09 02:16:33 | 2015-04-09 | "el período de 6 días que termina en 4/9, cubriendo todos los 4/4-4/9." | Horas o menos |
Semana |
Fecha | Final | 1 | 2015-04-09 02:16:33 | 2015-04-09 | "el período de 1 semana que termina en 4/9, cubriendo todos 4/3-4/9." | Horas o menos |
Mes |
Fecha | Final | 3 | 2015-04-09 02:16:33 | 2015-04-01 | "el período de 3 meses que termina en abril, cubriendo todo febrero, marzo y abril." | Días o menos |
Año |
Fecha | Final | 2 | 2015-04-09 02:16:33 | 2015-04-01 | "el período de 2 años que termina en 2015, cubriendo todos los 2014 y 2015." | Meses o menos |