Strumenti di preparazione dei dati del flusso di lavoro supporta il campionamento, la pulizia e il filtraggio dei dati in Designer Cloud.
Elemento | Descrizione |
---|---|
Use Auto Column to automatically change the column type and size for efficient storage of string data. | |
Use Create Sample to split the input records into 2 or 3 random samples. | |
Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro. | |
Usa lo strumento Filtro per selezionare i dati utilizzando una condizione. | |
Usa Formula per creare nuove colonne, aggiornare colonne e utilizzare una o più espressioni per eseguire una serie di calcoli e operazioni. | |
Use Generate Rows to create new rows of data with an expression. | |
Use Imputation to clean up missing values in your data. | |
Use Multi-Column Binning to tile or bin on multiple columns. | |
Utilizza Formula con più colonne per creare o aggiornare più colonne utilizzando un'unica espressione. | |
Use Multi-Row Formula to create and update columns by using row data to create formulas. | |
Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling. | |
Utilizza Campione percentuale casuale per restituire un numero previsto di righe che producono un campione casuale del flusso di dati in entrata. | |
Lo strumento ID riga crea una nuova colonna nei dati e assegna un identificatore univoco, che aumenta in sequenza, per ogni riga nei dati. | |
Utilizza lo strumento Campione per limitare il flusso di dati a un numero o a una percentuale specificati oppure a un set casuale di righe. Inoltre, lo strumento Campione applica la configurazione selezionata alle colonne scelte per il raggruppamento. | |
Utilizza lo strumento Seleziona per includere, escludere e riordinare le colonne di dati che passano attraverso il flusso di lavoro. | |
Utilizza Seleziona righe per restituire le righe e gli intervalli di righe specificati, compresi gli intervalli discontinui di righe. Questo strumento è utile per la risoluzione dei problemi e il campionamento. | |
Utilizza lo strumento Ordina per disporre le righe di una tabella in ordine alfanumerico in base ai valori dei campi dati specificati. | |
Utilizza lo strumento Riquadro per assegnare un valore (riquadro) in base agli intervalli nei dati. Lo strumento esegue questa operazione in base all'utente che specifica 1 dei 3 metodi. | |
Utilizza Unico per distinguere le righe uniche da quelle duplicate eseguendo il raggruppamento in base a una o più colonne specificate, quindi eseguendo l'ordinamento in base a tali colonne. |