Skip to main content

TS Filler Tool Icon Herramienta Relleno de ST

Ejemplo de cada herramienta

Relleno de ST tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.

Usa la herramienta Relleno de ST para tomar un flujo de datos de series de tiempo y rellena cualquier falta en la serie.

Esta herramienta se utiliza principalmente como un paso de preparación para el uso de herramientas y macros relacionadas con series temporales posteriores. Algunas herramientas de series temporales producen resultados o errores inesperados si el flujo de datos contiene brechas en las series temporales, por ejemplo, tienes una serie de datos que se supone que contienen mediciones cada cinco minutos, pero en realidad no tienes mediciones que cubran cada cinco minutos. Usa esta macro cada vez que sospeches que tu flujo de datos puede tener brechas.

Nota

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.

Conectar una entrada

La herramienta Relleno de ST requiere un flujo de datos de Designer que tenga una columna con valores de fecha o de fecha y hora.

Configurar la herramienta

Utiliza la pestaña Configuración para establecer los controles sobre cómo se llena la serie de tiempo.

  • Seleccionar la columna de fecha o la de fecha y hora: elige la columna de fecha o fecha y hora que indica cuándo se recopiló la fila de datos.

  • Intervalo: selecciona el intervalo por el cual se mide la serie de tiempo. Las opciones incluyen Minuto, Hora, Día, Semana, Mes y Año.

  • Incremento: selecciona el incremento por el cual cada período único de serie de tiempo debe separarse. Puedes establecer el incremento a cualquier número entero de 1 a 100.

Ejemplo

Para generar una serie que cubra “cada 3 semanas” establece un Intervalo en Semana e Incrementa a 3.

Ver la salida

Cada fila que ingresa a la macro aparece en la salida. Además, la macro evalúa si faltan períodos en la serie de tiempo y, si es así, genera una fila para llenar el espacio.

La herramienta agrega dos columnas de datos al flujo de datos entrante.

  • OriginalDateTime: una columna de fecha y hora que contiene el valor de fecha y hora original sin alterar.

  • FlagGeneratedRow: una columna de indicadores booleanos, donde “true” (verdadero) indica que la fila de datos fue generada por la macro para llenar un espacio de series de tiempo y “false” (falso) indica que es una fila de datos de origen.

Para las filas de datos de origen que pasan a través de la macro:

  • La columna FlagGeneratedRow dice “false” para indicar que es una fila de datos de origen, no una fila generada por la macro.

  • La columna [yourDateTimeColumn] está “redondeada” al período apropiado. Consulta la sección Redondeo a continuación.

  • Todas las demás columnas de origen pasan sin alteración.

Para las filas que se generaron a fin de llenar brechas:

  • La columna FlagGeneratedRow dice “true” para indicar que la fila es generada por la macro y no por una fila de datos de origen.

  • La columna [yourDateTimeColumn] tiene un valor de fecha o fecha y hora rellenado generado por la macro que “llena” la brecha identificada en la serie.

  • Todas las demás columnas son nulas.

Período de inicio/finalización

Según las situaciones de uso de negocios más comunes, los períodos de series de tiempo se manejan de la siguiente manera:

  • “Nivel de tiempo”: para intervalos

  • “Fecha-nivel”: Para intervalos >= un día, el período es “período que termina”.

“Redondeo” de fecha y hora

La única modificación que la macro hace a los datos entrantes es: se aplica un “redondeo” a [yourDateTimeColumn]. Se basa en tres elementos clave:

  • Intervalo

  • Valor de fecha-hora más temprana en el flujo de datos

  • Incremento

En primer lugar, se truncan todas las fracciones del intervalo elegido. Por ejemplo, si eliges “hora” como intervalo, la macro trunca los minutos y segundos del valor fecha-hora, por ejemplo. 1:58 p. m. se convierte en 1:00 p. m.

Después de truncar las fracciones del intervalo elegido, la macro determina cuáles son los períodos válidos. El valor de fecha y hora más temprana que ingresa la macro forma la base de la serie. Continuando con el ejemplo de “serie de horas” anterior, si la fecha-hora más temprana en [yourDateTimeColumn] es 1:58 p. m., entonces el primer período es 1:00 p. m. Si el incremento elegido es 5, los períodos siguientes se generan en base a la adición sucesiva del incremento elegido (5 horas) al período anterior, lo que da como resultado 1:00 p. m., 6:00 p. m., 11:00 p. m., etc en este caso.

Por último, ahora que se han determinado todos los períodos válidos, todos los valores de fecha y hora se ajustan al período válido apropiado. Por lo que un valor bruto de 5:59 p. m. en [yourDateTimeColumn] se convierte en 5:00 p. m. y 6:02 p. m. se convierte en 6:00 p. m., etc.

“Etiquetas” de período

Después de que todos los ajustes de fecha y hora han sido aplicados por la macro, la [yourDateTimeColumn] resultante es ahora efectivamente una “etiqueta” para ese período. Sin embargo, el tipo de dato es una columna de fecha o fecha-hora (en lugar de una cadena) y, como tal, esta “etiqueta” puede no ser del todo intuitiva. La clave es reconocer que cualquier porción de la “etiqueta” de fecha o fecha-hora que sea “fraccional” al intervalo elegido debe ser ignorada. Así que si tu intervalo es “año”, entonces un período de ejemplo podría ser “2018-01-01”, pero es el año que importa en la etiqueta, las porciones fraccionarias de la etiqueta, el “01-01”, debe ser ignorado, lo que significa que el período es simplemente el año 2018, o “en cualquier momento de 2018”. Consulta el cuadro que figura a continuación.

Conservación de datos

Ten en cuenta que, aparte del “redondeo” de fecha y hora descrito anteriormente, la macro no altera los datos entrantes. No realiza ninguna combinación, resumen, unificación ni ningún tipo de validación de los datos entrantes. Sin embargo, debido al redondeo de la fecha, las mediciones múltiples dentro del mismo período ahora llevarán la misma etiqueta de período. Como tal, los datos ahora son más limpios y pueden resumirse más fácilmente porque los datos pueden ser “agrupados por” esta etiqueta de período consistente y redondeada.

Horario de verano

Ten en cuenta que la macro no tiene en cuenta el horario de verano, por lo que si tienes datos de series de nivel de tiempo que cruzan un corte de horario de verano, es posible que la macro genere una fila de horas (o filas de minutos) que representa una hora no válida. Por ejemplo, las áreas que “adelantan” una hora en marzo tendrán filas generadas para la hora de las 2 a. m. del día del adelanto, aunque esa hora en realidad nunca ocurrió (el reloj cambia de 1:59:59 a 3:00:00). Esta hora se puede quitar fácilmente con una herramienta de filtro después de la macro.

Ejemplo de caso práctico

Para aclarar, la siguiente tabla enumera las opciones de intervalo disponibles, seguidas de qué tipo de datos se devuelve, y si el período para ese tipo de intervalo es un intervalo de “inicio de período” o “final de período”. A continuación, la tabla muestra un incremento de ejemplo y “Primer valor sin procesar” en la serie, para ilustrar lo que sería el período resultante “Etiqueta” y una descripción de lo que realmente significa la etiqueta de período. Finalmente, la tabla señala qué porción de la etiqueta de período debe ser ignorada esencialmente, como las porciones que son fraccionarias al intervalo.

Intervalo

Tipo de dato devuelto

Período de inicio/finalización

Ejemplo de incremento

Ejemplo del primer valor sin procesar

Etiqueta de resultado del primer período

Descripción del período

Ignorar en la etiqueta del período

Minuto

Fecha y hora

Iniciando

2

2015-04-09 02:16:33

2015-04-09 02:16:00

“El período de 2 minutos que COMIENZA en 2:16 y abarca todo el 2:16 y el 2:17”.

Segundos

Hora

Fecha y hora

Iniciando

4

2015-04-09 02:16:33

2015-04-09 02:00:00

“El período de 4 horas QUE COMIENZA a las 2, que abarca las horas 2, 3, 4 y 5”.

Minutos o menos

Día

Fecha

Finalizando

6

2015-04-09 02:16:33

2015-04-09

“El período de 6 días QUE TERMINA el 4/9, que abarca desde el 4/4 hasta el 4/9”.

Horas o menos

Semana

Fecha

Finalizando

1

2015-04-09 02:16:33

2015-04-09

“El período de 1 semana QUE TERMINA el 4/9, que abarca desde el 4/3 hasta el 4/9”.

Horas o menos

Mes

Fecha

Finalizando

3

2015-04-09 02:16:33

2015-04-01

“El período de 3 meses QUE TERMINA en abril, que abarca los meses de febrero, marzo y abril”.

Días o menos

Año

Fecha

Finalizando

2

2015-04-09 02:16:33

2015-04-01

“El período de dos años QUE TERMINA en 2015, que abarca todo 2014 y 2015”.

Meses o menos