
Strumento Riempimento ST
Utilizzare Time Series Filler per prendere un flusso di dati di dati di serie temporali e colmare eventuali lacune nella serie.
Questo strumento viene utilizzato principalmente come passaggio di preparazione per l'utilizzo di macro e strumenti relativi alle serie temporali a valle. Alcuni strumenti della serie temporale producono risultati imprevisti o errori se il flusso di dati contiene lacune nelle serie temporali, ad esempio, si dispone di una serie di dati che dovrebbero contenere misurazioni ogni 5 minuti, ma in realtà non si dispone di misurazioni che coprono ogni 5 minuti. Utilizzare questa macro ogni volta che si sospetta che il flusso di dati possa avere lacune.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Alteryx Downloads and Licenses per installare R e i pacchetti utilizzati dallo strumento R. Consultate Scaricare e utilizzare gli strumenti predittivi.
Collegare un ingresso
Lo strumento Dimfiller di Gestione configurazione richiede un flusso di dati della finestra di progettazione con una colonna contenente valori di data o ora.
Configurare lo strumento
Utilizzare la scheda Configurazione per impostare i controlli per la modalità di riempimento della serie di tempo.
- Seleziona colonna Data o Data/ora: scegliere la colonna data o data-ora che indica quando è stata raccolta la riga di dati.
- Intervallo: Selezionare l'intervallo in base al quale viene misurata la serie di tempo. Le opzioni includono Minuti ,Ora , Giorno , Settimana, Mese e Anno.
- Incremento: Selezionare l'incremento in base al quale ogni periodo di serie di tempo univoco deve essere separato. È possibile impostare l'incremento su qualsiasi numero intero compreso tra 1 e 100.
Esempio
Per generare una serie che copre "ogni 3 settimane" è necessario impostare Intervallo su Settimana e Incremento su 3.
Visualizzazione dell'output
Ogni riga che immette la macro viene visualizzata nell'output. Inoltre, la macro valuta se mancano dei periodi della serie temporale e, in caso affermativo, genera una riga per riempire lo spazio vuoto.
Lo strumento aggiunge due colonne di dati al flusso di dati in ingresso:The tool appends two data columns to the incoming data stream:
- OriginalDateTime: Una colonna data-ora che contiene il valore di data e ora originale non modificato
- FlagGeneratedRow: una colonna di flag booleana, dove "True" indica che la riga di dati è stata generata dalla macro per riempire un intervallo di serie di tempo e "False" indica che si tratta di una riga di dati di origine.
Per le righe di dati di origine che passano attraverso la macro:
- Il FlagGeneratedRow colonna legge "False" per indicare che si tratta di una riga di dati di origine, non una riga generata dalla macro.
- La colonna [yourDateTimeColumn] viene "arrotondata" al punto appropriato. Vedere la sezione Arrotondamento di seguito.
- Tutte le altre colonne di origine passano attraverso inalterate.
Per le righe generate per riempire gli spazi vuoti:
- Il FlagGeneratedRow colonna legge "True" per indicare che si tratta di una riga generata dalla macro, non una riga di dati di origine.
- La colonna [yourDateTimeColumn] ha un valore di data o ora popolato generato dalla macro che "riempie" il vuoto identificato nella serie.
- Tutte le altre colonne sono null.
Inizio/fine periodo
In base agli scenari di utilizzo aziendale più comuni, i periodi delle serie temporali vengono gestiti come segue:
- "Livello temporale": per gli intervalli
- "Livello di data": Per gli intervalli di un giorno, il periodo è "fine periodo".
DateTime "Arrotondamento"
L'unica modifica apportata dalla macro ai dati in ingresso è: un "rounding" viene applicato a [yourDateTimeColumn]. Si basa su tre elementi chiave:
- Intervallo
- Primo valore di data e ora nel flusso di dati
- Incremento
In primo luogo, tutte le frazioni dell'intervallo scelto vengono troncate. Ad esempio, se si sceglie "Ora" come intervallo, la macro tronca qualsiasi minuto e secondo dal valore della data e dell'ora, ad esempio. 13:58 diventa 13:00.
Dopo aver troncato le frazioni dell'intervallo scelto, la macro determina quali sono i periodi validi. Il primo valore di data e ora che entra nella macro costituisce la base della serie. Continuando l'esempio di "serie di ore" precedente, se la data e l'ora più recenti in [yourDateTimeColumn] è 1:58pm, il primo punto è 1:00pm. Se l'incremento scelto è 5, i periodi successivi vengono generati in base all'aggiunta successiva dell'incremento scelto, ovvero 5 ore, al periodo precedente, risultando in questo caso alle 13:00, alle 18:00, alle 23:00 e così via.
Infine, ora che sono stati determinati tutti i periodi validi, tutti i valori di data e ora vengono quindi adattati al periodo valido appropriato. Pertanto, un valore non elaborato di 5:59pm in [yourDateTimeColumn] diventa 5:00pm e 6:02pm diventa 6:00pm e così via.
Periodo "Etichette"
Dopo che tutte le regolazioni di data e ora sono state applicate dalla macro, il risultante [yourDateTimeColumn] è ora effettivamente un'"etichetta" per quel periodo. Tuttavia, il tipo di dati è una colonna data o data-ora (anziché una stringa) e come tale questo "etichetta" potrebbe non essere del tutto intuitivo. La chiave è riconoscere che qualsiasi parte della data o della data-ora "etichetta" che è "frazionaria" all'intervallo scelto deve essere ignorata. Pertanto, se l'intervallo è "anno", un periodo di esempio potrebbe essere "2018-01-01", ma è l'anno che conta nell'etichetta, le parti frazionarie dell'etichetta, ovvero "01-01", devono essere ignorate, il che significa che il periodo è semplicemente l'anno 2018 o "in qualsiasi momento nel 2018". Vedere la tabella seguente.
Conservazione dei dati
Si noti che, a parte il "rounding" della data e dell'ora descritto in precedenza, la macro non modifica i dati in ingresso. Non fa alcuna combinazione, riassumendo, uniquing, o qualsiasi tipo di convalide sui dati in entrata. Tuttavia, a causa dell'arrotondamento della data, più misurazioni all'interno dello stesso periodo ora porteranno la stessa etichetta periodo. Di conseguenza, i dati sono ora più puliti e possono essere più facilmente riepilogati perché i dati possono essere "raggruppati" per questa etichetta di periodo coerente e arrotondata.
Legale
Si noti che la macro non tiene conto dell'ora legale, pertanto se si dispone di dati di serie a livello di ora che attraversano un cutover dell'ora legale, è possibile che la macro generi una riga di ore (o righe di minuti) che rappresenta un'ora non valida. Ad esempio, le aree che "Spring forward" un'ora di marzo avranno righe generate per l'ora 2 am del giorno di primavera non si è mai realmente verificata (l'orologio passa da 1:59:59 a 3:00:00). Quest'ora può essere facilmente rimossa con uno strumento di filtro dopo la macro.
Esempio di caso d'uso
Per chiarire, nella tabella seguente sono elencate le opzioni di intervallo disponibili, seguite dal tipo di dati restituito e se il periodo per tale tipo di intervallo è un intervallo "inizio periodo" o "fine periodo". Nella tabella viene quindi visualizzato un incremento di esempio e "primo valore non elaborato" nella serie, per illustrare il periodo risultante "Label" e una descrizione in inglese del significato effettivo dell'etichetta del periodo. Infine, la tabella annota quale parte dell'etichetta del periodo deve essere essenzialmente ignorata, come le parti che sono frazionarie all'intervallo.
Intervallo | Tipo di dati restituito | Inizio/fine periodo | Incremento di esempio | Esempio primo valore non elaboratoExample First Raw Value | Etichetta primo periodo risultato | Periodo Descrizione | Ignora sull'etichetta periodo |
---|---|---|---|---|---|---|---|
Minuto | Data e ora | A partire | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | "Il periodo di 2 minuti STARTING alle 2:16, che copre tutti di 2:16 e 2:17" | Secondi |
Ora | Data e ora | A partire | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | "Il periodo di 4 ore STARTING a 2, che copre tutte le ore 2, 3, 4 e 5." | Minuti o meno |
Giorno | Data | Fine | 6 | 2015-04-09 02:16:33 | 2015-04-09 | "Il periodo di 6 giorni ENDING il 4/9, che copre tutti 4/4 - 4/9." | Ore o meno |
Settimana | Data | Fine | 1 | 2015-04-09 02:16:33 | 2015-04-09 | "Il periodo di 1 settimana ENDING il 4/9, che copre tutti 4/3 - 4/9." | Ore o meno |
Mese | Data | Fine | 3 | 2015-04-09 02:16:33 | 2015-04-01 | "Il periodo di 3 mesi ENDING nel mese di aprile, che copre tutti di febbraio, marzo e aprile." | Giorni o meno |
Anno | Data | Fine | 2 | 2015-04-09 02:16:33 | 2015-04-01 | "Il periodo di 2 anni ENDING nel 2015, che copre tutti i 2014 e il 2015." | Mesi o meno |