Utilisez l'outil Nettoyage des données pour corriger les problèmes courants de qualité des données. Vous pouvez remplacer les valeurs nulles, supprimer la ponctuation, modifier la mise en majuscules et bien plus encore.
Astuce
Cet outil dispose d'un exemple d'outil unique. Consultez la page Accéder aux exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Designer Cloud.
Numbers with more than 15 digits need to be treated as strings, or they lose precision. Set the column type to a string with the Select tool.
![]() |
Figure : Outil Nettoyage des données avec ancrages.
L’outil Nettoyage des données dispose de 2 ancrages :
Ancrage d'entrée : utilisez l'ancrage d'entrée pour connecter les données que vous souhaitez nettoyer.
Ancrage de sortie : l'ancrage de sortie génère les données nettoyées.
Utilisez ces options pour supprimer des lignes et des colonnes entières de données nulles :
Supprimer les lignes nulles
Supprime toutes les lignes avec une valeur nulle dans toutes les colonnes.
Supprime les lignes avec des valeurs nulles ; ne supprime pas les lignes avec des valeurs de chaîne vides.
Supprime uniquement les lignes qui ont une valeur nulle dans toutes les colonnes.
Vérifiez les colonnes à nettoyer. Cochez la case Tout cocher pour sélectionner toutes les colonnes et décochez la case pour les désélectionner.
Toutes les options, à l'exception de Remplacer les valeurs nulles par 0, s'appliquent aux types de données Chaîne. Pour définir différentes options pour différentes colonnes, utilisez plusieurs outils Nettoyage des données dans votre workflow.
Remplacer par des vides (colonnes de chaîne) : remplace les valeurs nulles par des chaînes vides. Une chaîne vide apparaît comme
« »
plutôt que[Null]
. Cette option est activée par défaut.Remplacer par 0 (colonnes numériques) : remplace les valeurs nulles par
0
(zéro). Cette option est activée par défaut.
Espace blanc de début et de fin : supprime les espaces blancs de début et de fin. Cette option est activée par défaut.
Tabulations, sauts de ligne et espaces vides dupliqués : remplace toute occurrence d'espaces blancs par un seul espace, y compris les fins de ligne, les tabulations, les espaces multiples et d'autres espaces consécutifs.
Tous les espaces vides : supprime toute occurrence d'espaces blancs.
Lettres : supprime toutes les lettres, y compris les lettres de l'alphabet non latines telles que A b Z À é ö.
Nombres : supprime tous les nombres.
Ponctuation : supprime les caractères suivants : ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Sélectionnez Modifier la casse, puis choisissez une option dans la liste déroulante pour modifier la mise en majuscules des données de type chaîne :
Majuscule : met en majuscules toutes les lettres dans une chaîne.
Minuscules : convertit toutes les lettres d'une chaîne en minuscules.
Casse du titre : met en majuscules la première lettre de tous les mots d'une chaîne.