Preparazione
Prepara i dati per l'analisi a valle.
Elemento | Descrizione |
|---|---|
Usa Colonna automatica per modificare automaticamente il tipo e la dimensione della colonna per archiviare in modo efficiente i dati stringa. | |
Lo strumento Campionatore consente di suddividere i record di input in 2 o 3 campioni casuali. | |
Utilizza lo strumento Pulizia dei dati avanzata per risolvere i problemi comuni di qualità dei dati. Puoi sostituire i valori null, rimuovere i segni di punteggiatura e i tag HTML, modificare la combinazione di maiuscole e minuscole, oltre a eseguire molte altre operazioni. | |
Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro. | |
Usa lo strumento Filtro per selezionare i dati utilizzando una condizione. | |
Usa Formula per creare nuove colonne, aggiornare colonne e utilizzare una o più espressioni per eseguire una serie di calcoli e operazioni. | |
Utilizza Genera righe per creare nuove righe di dati con un'espressione. | |
Lo strumento Imputazione consente di cancellare i valori mancanti nel dataset. | |
Lo strumento Binning di colonne multiple consente di raggruppare i dati in riquadri o bin (contenitori) su più colonne. | |
Strumento Formula con più colonneStrumento Formula con più colonne | Utilizza Formula con più colonne per creare o aggiornare più colonne utilizzando un'unica espressione. |
Lo strumento Formula con più colonne permette di creare e aggiornare le colonne utilizzando i dati delle righe per creare le formule. | |
Utilizza Colonna sovracampionamento per creare automaticamente campioni bilanciati da dati non bilanciati da utilizzare nella modellazione statistica. | |
Strumento Campione percentuale casualeStrumento Campione percentuale casuale | Utilizza Campione percentuale casuale per restituire un numero previsto di righe che producono un campione casuale del flusso di dati in entrata. |
Lo strumento Ranking consente di classificare i tuoi dati, per procedere con l'elaborazione successiva o generare l'output. | |
Lo strumento ID riga crea una nuova colonna nei dati e assegna un identificatore univoco, che aumenta in sequenza, per ogni riga nei dati. | |
Utilizza lo strumento Campione per limitare il flusso di dati a un numero o a una percentuale specificati oppure a un set casuale di righe. Inoltre, lo strumento Campione applica la configurazione selezionata alle colonne scelte per il raggruppamento. | |
Utilizza lo strumento Seleziona per includere, escludere e riordinare le colonne di dati che passano attraverso il flusso di lavoro. | |
Utilizza Seleziona righe per restituire le righe e gli intervalli di righe specificati, compresi gli intervalli discontinui di righe. Questo strumento è utile per la risoluzione dei problemi e il campionamento. | |
Utilizza lo strumento Ordina per disporre le righe di una tabella in ordine alfanumerico in base ai valori dei campi dati specificati. | |
Utilizza lo strumento Riquadro per assegnare un valore (riquadro) in base agli intervalli nei dati. Lo strumento esegue questa operazione in base all'utente che specifica 1 dei 3 metodi. | |
Utilizza Unico per distinguere le righe uniche da quelle duplicate eseguendo il raggruppamento in base a una o più colonne specificate, quindi eseguendo l'ordinamento in base a tali colonne. |