Outil Unique
Utilisez l'outil Unique pour distinguer si une ligne est unique ou un doublon en regroupant une ou plusieurs colonnes spécifiées, puis en triant ces colonnes.
Configuration de l'outil
Colonnes pour rechercher des valeurs uniques : sélectionnez les colonnes dont vous voulez vérifier les valeurs uniques. Utilisez la case à cocher Tout sélectionner pour comparer des lignes entières.
Ancrages de sortie
![]() |
Figure : Outil Unique avec ancrages de sortie.
L'outil Unique possède 2 ancrages de sortie :
Ancrage U : contient les lignes uniques du jeu de données. La première ligne de chaque groupe est affichée.
Ancrage D : contient les lignes en double du jeu de données. Les lignes restantes de chaque groupe sont affichées.
Avertissement
Il est nécessaire d'effectuer une inspection manuelle des résultats pour s'assurer que les lignes indiquées en double sont réellement dupliquées. Par exemple, vous pouvez avoir 2 clients qui portent le même nom mais qui habitent à des adresses différentes. Si vous pensez que votre jeu de données peut inclure ces types de valeurs aberrantes, vous pouvez sélectionner des colonnes supplémentaires lorsque vous configurez cet outil.
Exemple de sortie
Voici un exemple de sortie de l'outil Unique basé sur un échantillon de jeu de données.
Flux de données d'entrée
Dans la fenêtre Configuration de l'outil Unique, nous sélectionnons à la fois les colonnes Prénom et Nom dans notre flux de données entrant pour nous assurer que nous n'incluons pas les entrées en double de la même combinaison Prénom-Nom.
Prénom | Nom |
|---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
Sortie de l'ancrage U
L'ancrage de sortie U renvoie toutes les lignes uniques du flux de données entrant ci-dessus.
Prénom | Nom |
|---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
Sortie de l'ancrage D
L'ancrage de sortie D renvoie toutes les lignes en double du flux de données entrant ci-dessus.
Prénom | Nom |
|---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |
