Skip to main content

Preparazione

Prepara i dati per l'analisi a valle.

Elemento

Descrizione

Strumento Colonna automatica

Usa Colonna automatica per modificare automaticamente il tipo e la dimensione della colonna per archiviare in modo efficiente i dati stringa.

Strumento CampionatoreStrumento Campionatore

Lo strumento Campionatore consente di suddividere i record di input in 2 o 3 campioni casuali.

Data Cleanse Pro Tool

Utilizza lo strumento Pulizia dei dati avanzata per risolvere i problemi comuni di qualità dei dati. Puoi sostituire i valori null, rimuovere i segni di punteggiatura e i tag HTML, modificare la combinazione di maiuscole e minuscole, oltre a eseguire molte altre operazioni.

Strumento Pulizia dei datiStrumento Pulizia dei dati

Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro.

Strumento FiltroStrumento Filtro

Usa lo strumento Filtro per selezionare i dati utilizzando una condizione.

Strumento FormulaStrumento Formula

Usa Formula per creare nuove colonne, aggiornare colonne e utilizzare una o più espressioni per eseguire una serie di calcoli e operazioni.

Strumento Genera righe

Utilizza Genera righe per creare nuove righe di dati con un'espressione.

Imputation Tool Imputation Tool

Lo strumento Imputazione consente di cancellare i valori mancanti nel dataset.

Multi-Column Binning Tool Multi-Column Binning Tool

Lo strumento Binning di colonne multiple consente di raggruppare i dati in riquadri o bin (contenitori) su più colonne.

Strumento Formula con più colonneStrumento Formula con più colonne

Utilizza Formula con più colonne per creare o aggiornare più colonne utilizzando un'unica espressione.

Multi-Row Formula Tool

Lo strumento Formula con più colonne permette di creare e aggiornare le colonne utilizzando i dati delle righe per creare le formule.

Oversample Column Tool Oversample Column Tool

Utilizza Colonna sovracampionamento per creare automaticamente campioni bilanciati da dati non bilanciati da utilizzare nella modellazione statistica.

Strumento Campione percentuale casualeStrumento Campione percentuale casuale

Utilizza Campione percentuale casuale per restituire un numero previsto di righe che producono un campione casuale del flusso di dati in entrata.

Strumento Classifica

Lo strumento Ranking consente di classificare i tuoi dati, per procedere con l'elaborazione successiva o generare l'output.

Strumento ID rigaStrumento ID riga

Lo strumento ID riga crea una nuova colonna nei dati e assegna un identificatore univoco, che aumenta in sequenza, per ogni riga nei dati.

Strumento CampioneStrumento Campione

Utilizza lo strumento Campione per limitare il flusso di dati a un numero o a una percentuale specificati oppure a un set casuale di righe. Inoltre, lo strumento Campione applica la configurazione selezionata alle colonne scelte per il raggruppamento.

Strumento SelezionaStrumento Seleziona

Utilizza lo strumento Seleziona per includere, escludere e riordinare le colonne di dati che passano attraverso il flusso di lavoro.

Strumento Seleziona righeStrumento Seleziona righe

Utilizza Seleziona righe per restituire le righe e gli intervalli di righe specificati, compresi gli intervalli discontinui di righe. Questo strumento è utile per la risoluzione dei problemi e il campionamento.

Strumento OrdinaStrumento Ordina

Utilizza lo strumento Ordina per disporre le righe di una tabella in ordine alfanumerico in base ai valori dei campi dati specificati.

Strumento RiquadroStrumento Riquadro

Utilizza lo strumento Riquadro per assegnare un valore (riquadro) in base agli intervalli nei dati. Lo strumento esegue questa operazione in base all'utente che specifica 1 dei 3 metodi.

Strumento UnicoStrumento Unico

Utilizza Unico per distinguere le righe uniche da quelle duplicate eseguendo il raggruppamento in base a una o più colonne specificate, quindi eseguendo l'ordinamento in base a tali colonne.