Skip to main content

Strumenti di preparazione dei dati del flusso di lavoro

Strumenti di preparazione dei dati del flusso di lavoro supporta il campionamento, la pulizia e il filtraggio dei dati in Designer Cloud.

Strumenti di preparazione dei dati del flusso di lavoro

Elemento

Descrizione

Auto Column Tool

Use Auto Column to automatically change the column type and size for efficient storage of string data.

Create Samples Tool

Use Create Sample to split the input records into 2 or 3 random samples.

Strumento Pulizia dei dati

Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro.

Strumento Filtro

Usa lo strumento Filtro per selezionare i dati utilizzando una condizione.

Strumento Formula

Usa Formula per creare nuove colonne, aggiornare colonne e utilizzare una o più espressioni per eseguire una serie di calcoli e operazioni.

Generate Rows Tool

Use Generate Rows to create new rows of data with an expression.

Imputation Tool

Use Imputation to clean up missing values in your data.

Multi-Column Binning Tool

Use Multi-Column Binning to tile or bin on multiple columns.

Strumento Formula con più colonne

Utilizza Formula con più colonne per creare o aggiornare più colonne utilizzando un'unica espressione.

Multi-Row Formula Tool

Use Multi-Row Formula to create and update columns by using row data to create formulas.

Oversample Column Tool

Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling.

Strumento Campione percentuale casuale

Utilizza Campione percentuale casuale per restituire un numero previsto di righe che producono un campione casuale del flusso di dati in entrata.

Strumento ID riga

Lo strumento ID riga crea una nuova colonna nei dati e assegna un identificatore univoco, che aumenta in sequenza, per ogni riga nei dati.

Strumento Campione

Utilizza lo strumento Campione per limitare il flusso di dati a un numero o a una percentuale specificati oppure a un set casuale di righe. Inoltre, lo strumento Campione applica la configurazione selezionata alle colonne scelte per il raggruppamento.

Strumento Campione

Utilizza lo strumento Seleziona per includere, escludere e riordinare le colonne di dati che passano attraverso il flusso di lavoro.

Strumento Seleziona righe

Utilizza Seleziona righe per restituire le righe e gli intervalli di righe specificati, compresi gli intervalli discontinui di righe. Questo strumento è utile per la risoluzione dei problemi e il campionamento.

Strumento Ordina

Utilizza lo strumento Ordina per disporre le righe di una tabella in ordine alfanumerico in base ai valori dei campi dati specificati.

Strumento Riquadro

Utilizza lo strumento Riquadro per assegnare un valore (riquadro) in base agli intervalli nei dati. Lo strumento esegue questa operazione in base all'utente che specifica 1 dei 3 metodi.

Strumento Unico

Utilizza Unico per distinguere le righe uniche da quelle duplicate eseguendo il raggruppamento in base a una o più colonne specificate, quindi eseguendo l'ordinamento in base a tali colonne.