Strumento Pulizia dei dati
Esempio di uno strumento
Pulizia dei dati presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro.
Limitazioni conosciute
Lo strumento Pulizia dei dati non è dinamico. Se utilizzato in un'impostazione dinamica, ad esempio, una macro destinata a funzionare con i nomi dei campi appena generati, lo strumento non interagirà con i campi, anche se tutte le opzioni sono selezionate. Valuta la possibilità di sostituire lo strumento Pulizia dei dati con uno strumento Formula con più campi .
Visita Padronanza dello strumento della serie di ALteryx per saperne di più su questo e altri strumenti.
Componenti dello strumento
Lo strumento Pulizia dei dati ha 2 ancoraggi.
Ancoraggio di input: utilizza l'ancoraggio di input per collegare i dati che desideri pulire.
Ancoraggio di output: l'ancoraggio di output restituisce i dati puliti.
Configurazione dello strumento
Utilizza la scheda Opzioni per determinare come vengono gestiti i problemi di qualità dei dati.
Rimozione dei dati null
Utilizza queste opzioni per rimuovere intere righe e colonne di dati null.
Rimozione di righe null
Rimuovi tutte le righe con un valore null in ogni colonna.
Rimuovi le righe con valori null: non rimuove le righe con valori di stringa vuoti.
Rimuovi solo le righe che hanno un valore null in ogni colonna.
Viene visualizzato un messaggio nella finestra Risultati con il numero di righe rimosse.
Rimozione di colonne null
Rimuove tutte le colonne con un valore null in ogni riga.
Rimuove le colonne con valori null ma non le colonne con valori di stringa vuoti.
Rimuove solo le colonne che hanno un valore null in ogni riga.
Viene visualizzato un messaggio nella finestra Risultati con il numero di colonne rimosse.
Selezione dei campi da pulire
Seleziona i campi da pulire con le opzioni di configurazione seguenti. Utilizza il link Tutti per selezionare tutti i campi e il link Nessuno per deselezionare tutti i campi.
Tipi di dati stringa
Tutte le opzioni, ad eccezione di Sostituisci valori null con 0, si applicano ai tipi di dati stringa. Per specificare opzioni diverse per campi diversi, utilizza più strumenti Pulizia dei dati nel flusso di lavoro.
Sostituzione dei valori null
Per sostituire i valori null con valori diversi da spazi o 0, utilizza strumento Imputazione .
Sostituisci con spazi bianchi (campi stringa) : sostitusci i valori null con un valore stringa vuoto. Uno spazio vuoto viene registrato come " " anziché come [Null]. Questa opzione è selezionata per impostazione predefinita.
Sostituisci con 0 (campi numerici) : sostituisci i valori null con uno 0 (zero). Questa opzione è selezionata per impostazione predefinita.
Rimozione di caratteri non desiderati
Spazio vuoto iniziale e finale : rimuove gli spazi vuoti iniziali e finali. Questa opzione è selezionata per impostazione predefinita.
Tabulazioni, interruzioni di riga e spazio vuoto duplicato : sostituisce tutti gli spazi vuoti con uno spazio singolo, inclusi terminazioni di riga, tabulazioni, più spazi e altri spazi vuoti consecutivi.
Tutti gli spazi vuoti : rimuove tutte le occorrenze di spazi vuoti.
Lettere : rimuove tutte le lettere, comprese quelle dell'alfabeto non latino come A b Z À é ö .
Numeri : rimuove tutti i numeri.
Punteggiatura : rimuove i seguenti caratteri:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Modifica di maiuscole/minuscole
Seleziona Modifica maiuscole/minuscole e scegli un'opzione nel menu a discesa per modificare le lettere maiuscole/minuscole dei tipi di dati stringa:
Maiuscolo : converte in maiuscolo tutte le lettere in una stringa.
Minuscolo : converte tutte le lettere di una stringa in lettere minuscole.
Iniziali maiuscole : rende maiuscola la prima lettera di tutte le parole in una stringa.