Esempio di uno strumento
Riempimento TS presenta l'opzione Esempio di uno strumento. Consulta Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Usa lo strumento Riempimento TS per acquisire un flusso di dati delle serie temporali e riempire eventuali spazi vuoti nelle serie.
Questo strumento viene utilizzato principalmente come fase di preparazione per l'utilizzo di macro e strumenti correlati alle serie temporali a valle. Alcuni strumenti per le serie temporali producono risultati inattesi o errori se il flusso di dati contiene lacune nella serie temporale, ad esempio se si dispone di una serie di dati che dovrebbe contenere misurazioni ogni 5 minuti, ma in realtà non si dispone di misurazioni che coprono ogni 5 minuti. Utilizza questa macro ogni volta che sospetti che il flusso di dati presenti delle lacune.
Nota
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Lo Strumento Riempimento TS richiede un flusso di dati Designer con una colonna con valori di data e ora.
Utilizza la scheda Configurazione per impostare i controlli per il riempimento della serie temporale.
Seleziona la colonna Data o Data e ora: scegli la colonna Data e ora che indica quando è stata raccolta la riga dati.
Intervallo: seleziona l'intervallo in base al quale viene misurata la serie temporale. Le opzioni includono Minuto, Ora, Giorno, Settimana, Mese e Anno.
Incremento: seleziona l'incremento in base al quale separare ciascun periodo di serie temporali univoco. Puoi impostare l'incremento su qualsiasi numero intero compreso tra 1 e 100.
Per generare una serie che copre "ogni 3 settimane", imposta Intervallo su Settimana e Incremento su 3.
Ogni riga che entra nella macro appare nell'output. Inoltre, la macro valuta se mancano dei periodi nelle serie temporali e, in tal caso, genera una riga per riempire il gioco.
Lo strumento allega due colonne di dati al flusso di dati in entrata.
OriginalDateTime: una colonna Data e ora che contiene il valore Data e ora originale, inalterato.
FlagGeneratedRow: una colonna di segnalazione booleana, dove "True" indica che la riga di dati è stata generata dalla macro per riempire un intervallo di serie temporali e "False" indica che si tratta di una riga di dati di origine.
Per le righe di dati di origine che passano attraverso la macro:
La colonna FlagGeneratedRow riporta "False" per indicare che si tratta di una riga di dati di origine, non di una riga generata dalla macro.
La colonna [yourDateTimeColumn] è arrotondata al periodo appropriato. Consulta la sezione Arrotondamento di seguito.
Tutte le altre colonne di origine passano inalterate.
Per le righe generate per riempire gli spazi vuoti:
La colonna FlagGeneratedRow indica "True" per indicare che la riga è generata dalla macro e non da una riga di dati di origine.
La colonna [yourDateTimeColumn] ha un valore di Data o Data e ora compilato generato dalla macro che "riempie" lo spazio vuoto identificato nella serie.
Tutte le altre colonne sono "null".
In base agli scenari di utilizzo aziendale più comuni, i periodi delle serie temporali sono gestiti come segue:
"Time-level": per gli intervalli
"Data-livello": per gli intervalli >= un giorno, il periodo è "fine periodo".
L'unica modifica che la macro apporta ai dati in entrata è: un "arrotondamento" viene applicato alla [yourDateTimeColumn]. Si basa su tre elementi chiave:
Intervallo
Primo valore di Data e ora nel flusso di dati
Incremento
Innanzitutto, tutte le frazioni dell'intervallo scelto vengono troncate. Ad esempio, se si sceglie "Ora" come intervallo, la macro tronca i minuti e i secondi dal valore Data e ora, ad esempio. Le 13:58 diventano le 13:00.
Dopo aver troncato le frazioni dell'intervallo scelto, la macro determina quali sono i periodi validi. Il primo valore Data e ora che inserisce la macro costituisce la base della serie. Continuando con l'esempio di "Serie di ore" sopra riportato, se il primo valore Data e ora in [yourDateTimeColumn] è 13:58, allora il primo periodo è 13:00. Se l'incremento scelto è 5, i periodi successivi vengono generati in base all'aggiunta successiva dell'incremento scelto (5 ore) al periodo precedente, con il risultato in questo caso alle 13:00, 18:00, 11:00, ecc.
Infine, ora che tutti i periodi validi sono stati determinati, tutti i valori di Data e ora vengono regolati in base al periodo valido appropriato. Quindi un valore grezzo di 17:59 in [yourDateTimeColumn] diventa 17:00 e 18:02 diventa 18:00, ecc.
Dopo che tutte le regolazioni di Data e ora sono state applicate dalla macro, la [yourDateTimeColumn] risultante è ora effettivamente un'etichetta per quel periodo. Tuttavia, il tipo di dati è una colonna Data o Data e ora (piuttosto che una stringa) e, come tale, questa "etichetta" potrebbe non essere del tutto intuitiva. La chiave consiste nel riconoscere che qualsiasi parte dell'etichetta Data e ora che sia "frazionata" rispetto all'intervallo scelto deve essere ignorata. Quindi, se il tuo intervallo è "anno", allora un periodo di esempio potrebbe essere "2018-01-01", ma è l'anno che conta nell'etichetta, le porzioni frazionarie dell'etichetta - la parte "01-01" - dovrebbero essere ignorate, il che significa che il periodo è semplicemente l'anno 2018, o "qualsiasi momento nel 2018". Vedi la tabella riportata di seguito.
A parte l'arrotondamento della data descritto sopra, la macro non altera i dati in entrata. Non esegue alcuna combinazione, riepilogo, univocità o qualsiasi tipo di convalida dei dati in entrata. Tuttavia, a causa dell'arrotondamento della data, più misurazioni all'interno dello stesso periodo avranno la stessa etichetta di periodo. In questo modo, i dati sono ora più puliti e più facilmente riassumibili perché possono essere "raggruppati" da questa etichetta coerente e arrotondata.
La macro non tiene conto dell'ora legale; pertanto, se i dati delle serie a livello temporale attraversano un periodo di transizione dell'ora legale, è possibile che la macro generi una riga di ore (o di minuti) che rappresenta un'ora non valida. Ad esempio, le aree che “anticipano la primavera” di un'ora a marzo avranno righe generate per l'ora delle 2 del giorno di anticipo, anche se quell'ora non si è mai verificata (l'orologio passa dalle 1:59:59 alle 3:00:00). Questa ora può essere facilmente rimossa con un Strumento Filtro dopo la macro.
Per chiarire, la tabella seguente elenca le opzioni di intervallo disponibili, seguite dal tipo di dati restituito e se il periodo per quel tipo di intervallo è un intervallo di "inizio periodo" o "fine periodo". La tabella visualizza quindi un esempio di incremento e il “primo valore grezzo” della serie, per illustrare quale sarebbe l'“etichetta” del periodo risultante e una descrizione in inglese del significato effettivo dell'etichetta del periodo. Infine, la tabella indica quali parti dell'etichetta del periodo devono essere essenzialmente ignorate, come le parti frazionarie rispetto all'intervallo.
Intervallo | Tipo di dati restituito | Inizio/fine periodo | Esempio di incremento | Esempio di primo valore grezzo | Etichetta del primo periodo del risultato | Descrizione periodo | Ignora etichetta periodo |
---|---|---|---|---|---|---|---|
Minuto | Data e ora | Inizio | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | "Il periodo di 2 minuti che inizia a 2:16 e che copre interamente 2:16 e 2:17". | Secondi |
Ora | Data e ora | Inizio | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | "Il periodo di 4 ore CHE INIZIA alle 2 e che copre interamente le ore 2, 3, 4 e 5". | Minuti o meno |
Giorno | Data | Fine | 6 | 2015-04-09 02:16:33 | 2015-04-09 | "Il periodo di 6 giorni CHE TERMINA il 4/9 e che copre interamente il periodo 4/4 - 4/9." | Ore o meno |
Settimana | Data | Fine | 1 | 2015-04-09 02:16:33 | 2015-04-09 | "Il periodo di 1 settimana CHE TERMINA il 4/9 e che copre interamente il periodo il 4/3 - 4/9." | Ore o meno |
Mese | Data | Fine | 3 | 2015-04-09 02:16:33 | 2015-04-01 | "Il periodo di 3 mesi CHE TERMINA ad aprile e che copre interamente i mesi di febbraio, marzo e aprile." | Giorni o meno |
Anno | Data | Fine | 2 | 2015-04-09 02:16:33 | 2015-04-01 | "Il periodo di 2 anni CHE TERMINA nel 2015 e che copre interamente gli anni 2014 e 2015." | Mesi o meno |