Outil Nettoyage des données
L’outil Nettoyage des données corrige les problèmes courants de qualité des données à l’aide de divers paramètres.
Limitation connue : workflows dynamiques
L’outil Nettoyage des données n’est pas dynamique. Par exemple, il n’est pas capable d’interagir avec les champs dont le nom est modifié de manière dynamique par une macro, et ce même si toutes les options sont sélectionnées. Envisagez de remplacer l'outil Nettoyage des données par un Outil de formule à plusieurs champs.
Visitez la série de Maîtrise des outils de la communauté Alteryx pour en savoir plus sur cet outil et les autres.
Configurer l’outil
Limitation connue : manipulation de grand nombre
Les nombres comportant plus de 15 chiffres doivent être traités comme des chaînes. Sinon, ils perdent leur précision. Définissez le type de champ sur une chaîne à l'aide de l' Outil Sélectionner.
Utilisez les champs suivants pour déterminer la gestion des problèmes de qualité des données.
Sélectionner les champs à nettoyer: sélectionnez les champs à nettoyer à l'aide des options de configuration ci-dessous. Toutes les options, à l’exception de Remplacer les valeurs Null par 0, s’appliquent aux types de données Chaîne. Pour définir différentes options pour différents champs, utilisez plusieurs outils Nettoyage des données dans votre workflow.
Remplacer les valeurs nulles : pour remplacer les valeurs nulles des valeurs autres que des espaces ou 0, utilisez l' Outil Imputation.
- Remplacer par des espaces (champs de chaîne) : un registre vide en tant que "" plutôt que [Null]. Sélectionnée par défaut
- Remplacer par 0 (champs numériques): sélectionné par défaut.
- Les espaces de tête et de fin sont sélectionnés par défaut.
- Tabulations, sauts de ligne et espaces dupliqués remplace toute occurrence d'espaces par un espace unique, y compris les terminaisons de ligne, les tabulations, les espaces multiples et d'autres espaces consécutifs.
- Tous les espaces supprime toute occurrence d'espace.
- Lettres supprime toutes les lettres. y compris celles qui ne font pas partie de l’alphabet latin.
A b Z À é ö
- Nombres supprime tous les nombres.
- Ponctuation supprime les caractères suivants:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Sélectionnez une option pour modifier la casse des types de données Chaîne :
- Majuscules capitalise toutes les lettres dans une chaîne.
- Minuscules convertit toutes les lettres d'une chaîne en minuscules.
- Casse de titre met en majuscules la première lettre de tous les mots d'une chaîne.