Strumento Pulizia dei dati
Esempio di uno strumento
Pulizia dei dati presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Utilizza Pulizia dei dati per risolvere i problemi comuni di qualità dei dati. Puoi sostituire valori null, rimuovere la punteggiatura, modificare le maiuscole e molto altro!
Limitazioni conosciute
Lo strumento Pulizia dei dati non è dinamico. Se utilizzato in un'impostazione dinamica, ad esempio, una macro destinata a funzionare con i nomi dei campi appena generati, lo strumento non interagirà con i campi, anche se tutte le opzioni sono selezionate. Valuta la possibilità di sostituire lo strumento Pulizia dei dati con uno strumento Formula con più campi .
Visita Padronanza dello strumento della serie di ALteryx per saperne di più su questo e altri strumenti.
Componenti dello strumento
Lo strumento Pulizia dei dati ha 2 ancoraggi.
Ancoraggio di input: utilizza l'ancoraggio di input per collegare i dati che desideri pulire.
Ancoraggio di output: l'ancoraggio di output restituisce i dati puliti.
Configura lo strumento
Utilizza la scheda Opzioni per determinare come vengono gestiti i problemi di qualità dei dati.
Rimozione dei dati null
Utilizza queste opzioni per rimuovere intere righe e colonne di dati null.
Rimozione di righe null
Rimuovi tutte le righe con un valore null in ogni colonna.
Rimuovi le righe con valori null: non rimuove le righe con valori di stringa vuoti.
Rimuovi solo le righe che hanno un valore null in ogni colonna.
Viene visualizzato un messaggio nella finestra Risultati con il numero di righe rimosse.
Rimozione di colonne null
Rimuovi tutte le colonne con un valore null in ogni riga.
Rimuovi le colonne con valori null ma non le colonne con valori di stringa vuoti.
Rimuovi solo le colonne che hanno un valore null in ogni riga.
Viene visualizzato un messaggio nella finistra Risultati con il numero di colonne rimosse
Selezione dei campi da pulire
Seleziona i campi da pulire con le opzioni di configurazione seguenti. Utilizza il link Tutti per selezionare tutti i campi e utilizza il link Nessuno per deselezionare tutti i campi.
Tipi di dati stringa
Tutte le opzioni, ad eccezione di Sostituisci valori null con 0, si applicano ai tipi di dati stringa. Per specificare opzioni diverse per campi diversi, utilizza più strumenti Pulizia dei dati nel flusso di lavoro.
Sostituzione dei valori null
Per sostituire i valori null con valori diversi da spazi o 0, utilizza strumento Imputazione .
Sostituisci con spazi bianchi (campi stringa) : sostitusci i valori null con un valore stringa vuoto. Uno spazio vuoto viene registrato come " " anziché come [Null]. Questa opzione è selezionata per impostazione predefinita.
Sostituisci con 0 (campi numerici) : sostituisci i valori null con uno 0 (zero). Questa opzione è selezionata per impostazione predefinita.
Rimozione di caratteri non desiderati
Spazio bianco iniziale e finale : rimuove gli spazi bianchi iniziali e finali. Questa opzione è selezionata per impostazione predefinita.
Tabulazioni, interruzioni di riga e spazi vuoti duplicati : sostituisce qualsiasi occorrenza di spazi bianchi con un singolo spazio, comprese le terminazioni di riga, tabulazioni, spazi multipli e altri spazi bianchi consecutivi.
Tutti gli spazi bianchi : rimuove qualsiasi occorrenza di spazi bianchi.
Lettere : rimuove tutte le lettere, comprese quelle dell'alfabeto non latino come A b Z À é ö .
Numeri : rimuove tutti i numeri.
Punteggiatura : rimuove questi caratteri:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Modifica di maiuscole/minuscole
Seleziona Modifica maiuscole/minuscole e quindi scegli un'opzione dal menu a discesa per modificare le maiuscole dei tipi di dati stringa:
Maiuscolo : converte in maiuscolo tutte le lettere in una stringa.
Minuscolo : converte tutte le lettere di una stringa in lettere minuscole.
Iniziali maiuscole : rende maiuscola la prima lettera di tutte le parole in una stringa.