Skip to main content

Data Cleansing Tool Icon Outil Nettoyage des données

Exemple d'outil unique

L'outil Nettoyage des données a un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Nettoyage des données pour corriger les problèmes courants de qualité des données. Vous pouvez remplacer les valeurs nulles, supprimer la ponctuation, modifier la mise en majuscules et bien plus encore !

Limitations connues

L’outil Nettoyage des données n’est pas dynamique. S'il est utilisé dans une configuration dynamique, par exemple, une macro destinée à fonctionner avec des noms de champ nouvellement générés, l'outil n'interagit pas avec les champs, même si toutes les options sont sélectionnées. Envisagez de remplacer l'outil Nettoyage des données par un outil Formule à plusieurs champs .

Consultez la série Maîtrise de l'outil de la communauté Alteryx pour en savoir plus sur cet outil et d'autres outils.

Composants de l'outil

Thumbnail

L’outil Nettoyage des données dispose de 2 ancrages :

  • Ancrage d’entrée : utilisez l’ancrage d’entrée pour connecter les données que vous souhaitez nettoyer.

  • Ancrage de sortie : l’ancrage de sortie génère les données nettoyées.

Configuration de l'outil

Utilisez l'onglet Options pour déterminer comment traiter les problèmes de qualité des données.

Enlever les données nulles

Utilisez ces options pour supprimer des lignes et des colonnes entières de données nulles.

  • Supprimer les lignes nulles

    • Supprime toutes les lignes avec une valeur nulle dans toutes les colonnes.

    • Supprime les lignes avec des valeurs nulles ; ne supprime pas les lignes avec des valeurs de chaîne vides.

    • Supprime uniquement les lignes qui ont une valeur nulle dans toutes les colonnes.

    • Un message s'affiche dans la fenêtre Résultats avec le nombre de lignes supprimées.

  • Supprimer les colonnes nulles

    • Supprime toutes les colonnes avec une valeur nulle dans toutes les lignes.

    • Supprime les colonnes avec des valeurs nulles ; ne supprime pas les colonnes avec des valeurs de chaîne vides.

    • Supprime uniquement les colonnes qui ont une valeur nulle dans toutes les lignes.

    • Un message s'affiche dans la fenêtre Résultats avec le nombre de colonnes supprimées.

Sélectionner les champs à nettoyer

Sélectionnez les champs à nettoyer en utilisant les options de configuration ci-dessous. Utilisez le lien Tout pour sélectionner tous les champs et utiliser le lien Aucun(e) pour désélectionner tous les champs.

Types de données String (chaîne)

Toutes les options, à l’exception de Remplacer les valeurs Null par 0, s’appliquent aux types de données Chaîne. Pour définir différentes options pour différents champs, utilisez plusieurs outils Nettoyage des données dans votre workflow.

Remplacer les valeurs nulles

Pour remplacer les valeurs nulles par des valeurs autres que des vides ou 0, utilisez l’ outil Imputation .

  • Remplacer par des vides (champs de chaîne) : remplace les valeurs nulles par des chaînes vides. Un espace vide s'inscrit comme plutôt que [Null]. Cette option est activée par défaut.

  • Remplacer par 0 (champs numériques) : remplace les valeurs nulles par 0 (zéro). Cette option est activée par défaut.

Supprimer les caractères indésirables

  • Espace blanc de début et de fin : supprime les espaces blancs de début et de fin. Cette option est activée par défaut.

  • Onglets, sauts de ligne et espaces vides dupliqués : remplace toute occurrence d'espaces blancs par un seul espace, y compris les fins de ligne, les tabulations, les espaces multiples et d'autres espaces consécutifs.

  • Tous les espaces vides : supprime toute occurrence d'espaces blancs.

  • Lettres  : supprime toutes les lettres, y compris les lettres de l'alphabet non latines, telles que A b Z À é ö .

  • Nombres  : supprime tous les nombres.

  • Ponctuation : supprime les caractères suivants :

    ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~

Modifier la casse

Sélectionner Changer la casse puis choisissez une option dans la liste déroulante pour modifier la mise en majuscules des données de type chaîne :

  • Majuscule  : capitalise toutes les lettres dans une chaîne.

  • Minuscules  : convertit toutes les lettres d'une chaîne en minuscules.

  • Casse de titre  : met en majuscules la première lettre de tous les mots d'une chaîne.