Outil Explorateur
L’outil Explorateur affiche les données à partir d’un outil connecté, ainsi que les informations de profil des données, les cartes, les snippets de génération de rapports et les informations d’analyse comportementale contenus dans les données.
Utilisez un outil Explorateur lors de la construction d’un workflow pour obtenir des informations qui vous aident à préparer, nettoyer et analyser les données. Vous pouvez également utiliser un outil Explorateur pour afficher toutes les données provenant d’un outil connecté dans la fenêtre Résultats. Sans un outil Explorateur, la fenêtre Résultats affiche jusqu’à 1 Mo de données à partir d’un outil. Voir Fenêtre Résultats.
Connectez un outil Explorateur à l’ancrage de sortie de l’outil contenant les données à afficher en détail.
Pour ajouter un outil Explorateur à un workflow, vous pouvez procéder de trois manières différentes :
- Faites glisser un outil Explorateur dans le canevas, puis connectez-le à un outil.
- Cliquez avec le bouton droit sur un outil et cliquez sur Ajouter un explorateur après.
- Appuyez sur Maj+Ctrl+B, puis cliquez sur les outils dans un workflow.
L’outil Explorateur nécessite temporairement de la mémoire et de l’espace sur votre ordinateur, ce qui augmente le volume des données et peut avoir un impact sur les performances. Après la construction d’un workflow et lorsque vous êtes prêt à sortir les résultats, vous pouvez désactiver les outils Explorateur dans le workflow.
Pour désactiver les outils Explorateur dans un workflow :
- Cliquez sur le canevas pour afficher la fenêtre Configuration du workflow.
- Dans la fenêtre Configuration, cliquez sur Exécution.
- Sélectionnez Désactiver tous les outils Explorateur. Les outils Explorateur dans le workflow sont grisés.
Pour activer les outils Explorateur, désélectionnez Désactiver tous les outils Explorateur dans la fenêtre Configuration du workflow de l'onglet Exécution.
Affichez les données dans les fenêtres Configuration et Résultats. La fenêtre Configuration affiche différents graphiques et métadonnées selon le type de données contenues dans la colonne sélectionnée dans la fenêtre Résultats.
Une barre de couleur indiquant la qualité des données s’affiche en haut de chaque colonne de données dans la fenêtre Résultats.
- Rouge (pas OK) : la colonne contient des valeurs précédées ou suivies d'espaces vides.
- Jaune (Null) : la colonne ne contient aucune valeur.
- Gris (vide) : la colonne contient des chaînes sans valeur.
- Vert (OK) : la colonne contient des valeurs sans les espaces vides de début ou de fin.
Par défaut, la première colonne de données de la fenêtre Résultats apparaît dans la fenêtre Configuration. Cliquez sur une autre colonne pour afficher les données correspondantes dans la fenêtre Configuration. Voir Fenêtre Résultats, pour en savoir plus sur la fenêtre Résultats.
Les options suivantes sont disponibles dans la fenêtre Configuration :
- Vues : selon le type de données que vous visualisez, jusqu'à quatre onglets peuvent s'afficher : Profil, Carte, Rapport, Analyse comportementale. Il est possible d’afficher deux onglets à la fois.
- Vue unique : cliquez pour afficher tous les onglets dans une seule fenêtre.
Gauche, vue de droite : cliquez pour afficher tous les onglets dans les volets gauche et droit de la fenêtre. Cliquez sur les différents onglets de chaque fenêtre pour comparer les données.
- Haut, vue du bas : cliquez pour afficher tous les onglets dans les volets supérieur et inférieur de la fenêtre. Cliquez sur les différents onglets de chaque fenêtre pour comparer les données.
- Détails des données : affiche le nombre d'enregistrements, le nombre de champs et la taille du fichier.
- Nombre d'enregistrements sélectionnés : affiche le nombre d'enregistrements sélectionnés. Cliquez sur pour effacer la sélection.
-
Nouvelle fenêtre: cliquez pour ouvrir les données dans une nouvelle fenêtre non-ancrée. Les données contenues dans la fenêtre ne changent pas ; cette option vous permet de comparer les vues et d’évaluer les données après la modification et l’exécution d’un workflow. Par défaut, le nom de la fenêtre est constitué du nom et de l’ID de l’outil Explorateur.
Renommer une fenêtre
- Lorsque l'outil Explorateur est sélectionné, dans la fenêtre Configuration, cliquez sur Annotation.
- Dans Nom, tapez un nom pour la fenêtre.
Quand un outil Explorateur est connecté à un outil avec des types de données chaîne, numérique ou date/heure, l’onglet Profil de la fenêtre Configuration affiche un graphique et les métadonnées de la colonne sélectionnée. Cliquez sur des colonnes de la fenêtre Résultats pour afficher les informations de profil des données d’autres colonnes.
Par défaut, le profilage des données est activé. Pour désactiver les caractéristiques de profilage de données, accédez à Options > Paramètres de l'utilisateur > Modifier les paramètres utilisateur et désélectionnez Collecter et afficher les informations du profil de données.
Graphiques
Sélectionnez une colonne pour afficher un graphique à barres ou un nuage de points dans la fenêtre de configuration. Le type de graphique affiché est basé sur le type de données que vous sélectionnez.
Si le flux de données contient une colonne date/heure et que vous sélectionnez une colonne numérique, les graphiques de corrélation sont affichés. Par exemple, les informations sur les ventes contenues dans une colonne peuvent être combinées avec les dates contenues dans une autre colonne afin de créer un graphique représentant les ventes par mois. Utilisez les flèches ou les icônes du graphique pour naviguer entre plusieurs graphiques.
Une fois que plus de 10 000 valeurs uniques sont profilées, le stockage est appliqué pour augmenter les performances et représenter les données d'une manière plus significative. Les messages au bas du graphique indiquent le moment où le stockage est appliqué.
Graphique à barres
Les types de valeur de chaîne (catégorique) sont profilés, triés et affichés dans un graphique à barres. Le graphique à barres représente la fréquence d'une valeur, ou des valeurs groupées, dans les données. Une barre de qualité résume la qualité des données.
- INCORRECT (Rouge) : les valeurs contiennent un espace vide en début ou en fin
- NULL (Jaune) : aucune valeur n’est indiquée
- VIDE (Gris) : chaînes sans valeur
- OK (vert) : valeurs sans espace de tête ou de fin, valeur nulle ni valeur vide.
Les points de données sont représentés dans un maximum de 100 bacs. S'il y a plus de 100 valeurs uniques, le jeu de données complet est profilé, mais le graphique affiche les 100 valeurs les plus fréquentes.
Nuage de points
Les types de valeurs numériques sont affichés dans un nuage de points. Le nuage de points représente la distribution des données et inclut un diagramme de quartiles qui identifie les valeurs les plus basses et les plus élevées, ainsi que les valeurs du premier quartile, du deuxième quartile (ou quartile médian) et du troisième quartile.
Une fois que plus de 10 000 valeurs uniques sont trouvées, les données sont représentées sous forme d'un graphique à barres affichant les 100 valeurs les plus fréquentes.
Survolez un graphique pour faire apparaître plusieurs options d'interaction graphique :
- Zoom : permet de zoomer sur une zone de données sélectionnée en cliquant et en faisant glisser.
- Pan : permet d'activer le déplacement autour du graphique en cliquant et en faisant glisser.
- Zoom avant : effectue un zoom sur la position centrée actuelle. Vous pouvez aussi utiliser la molette de défilement de la souris pour effectuer un zoom sur la position du curseur.
- Zoom arrière : effectue un zoom arrière à partir de la position centrée actuelle. Vous pouvez aussi utiliser la molette de défilement de la souris pour effectuer un zoom à partir de la position du curseur.
- Réinitialisation des axes : sélectionnez cette option pour réinitialiser le graphique sur la vue par défaut. Sinon, double-cliquez sur le graphique.
- Basculer les lignes de pointage : permet d'afficher les lignes pointillées pour trouver plus facilement les valeurs d'axe d'un point de données.
- Afficher les données les plus proches au passage du curseur : permet de faire apparaître une valeur de données entre parenthèses.
- Comparer les données au passage du curseur : permet de révéler une valeur de données à l'aide des étiquettes d'axe.
- Enregistrer au format PNG : permet d'enregistrer la vue graphique en cours en tant que fichier image.
Métadonnées
Les métadonnées de la colonne sélectionnée apparaissent en dessous du graphique dans la fenêtre Configuration. Les métadonnées disponibles varient en fonction du type de données contenues dans la colonne sélectionnée. Voir Types de données, pour obtenir la liste des types de données.
Si la colonne sélectionnée contient des valeurs de chaîne, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Type de données : le type de données de la colonne sélectionnée.
- Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
- Vides : le nombre de valeurs vides.
- Valeurs avec espace vide de début : le nombre de valeurs de chaîne contenant un espace avant la valeur. Utilisez l’outil Nettoyage des données ou la fonction d’ajustement de l’outil Formule pour résoudre le problème. Voir Outil Nettoyage des données et Outil Formule.
- Valeurs avec espace vide de fin : le nombre de valeurs de chaîne suivies d'un espace.
- Longueur la plus courte (non vide) : le nombre de caractères dans la plus courte valeur de la colonne.
- Longueur moyenne : la longueur moyenne des valeurs dans la colonne.
- Longueur la plus longue : le nombre de caractères dans la plus longue valeur de la colonne.
- Valeur la plus courte : la plus courte valeur de la colonne.
- Valeur la plus longue : la plus longue valeur de la colonne.
- Première valeur alphanumérique : la première entrée de chaîne dans une colonne triée par ordre alphabétique.
-
Dernière valeur alphanumérique : la dernière entrée de chaîne dans une colonne triée par ordre alphabétique.
Si la colonne sélectionnée contient des valeurs numériques, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Type de données : le type de données de la colonne sélectionnée.
- Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
- Minimum : la plus petite valeur de la colonne.
- Maximum : la plus grande valeur de la colonne.
- Moyenne : la valeur moyenne des valeurs dans la colonne.
- Écart-type : la mesure de la dispersion des valeurs dans le graphique.
- Variance : la mesure de la distance selon laquelle un ensemble de nombres aléatoires sont dispersés par rapport à la moyenne.
- 25e percentile : la valeur médiane dans la partie inférieure, ou la première moitié des données.
- 50e percentile : la valeur médiane des données.
-
75e percentile : la valeur médiane dans la partie supérieure, ou seconde moitié des données.
Si la colonne sélectionnée contient des valeurs de type date/heure, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Type de données : le type de données de la colonne sélectionnée.
- Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
- Minimum : la plus petite valeur de la colonne.
-
Maximum : la plus grande valeur de la colonne.
Si la colonne sélectionnée contient des objets géographiques, les métadonnées suivantes sont fournies sous l'onglet Profil.
- Nom : le nom de la colonne.
- Type de données : le type de données de la colonne sélectionnée.
- Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
L’outil Profil de données de base fournit des métadonnées similaires sans graphique. Utilisez l’outil Profil de données de base pour sortir les informations de profil des données en vue d’une analyse ultérieure. Voir Outil Profil de données de base.
Lorsqu'un outil Exploratuer est connecté à un outil avec des snippets de rapports, l'onglet Rapport de la fenêtre de Configuration affiche ces snippets de rapports tels qu’ils apparaîtront dans un rapport. Les snippets de rapports sont créés par les outils de la catégorie de rapports. Voir Génération de rapports.
Les options de la vue Rapport sont les suivantes :
- Champs : cliquez pour afficher la liste des champs de rapport visibles dans la vue. Cliquez sur pour désélectionner tous les champs de rapport et sur pour les sélectionner tous.
-
Navigation : cliquez sur les flèches de navigation pour afficher des enregistrements spécifiques. Par défaut, la fenêtre Configuration affiche 10 enregistrements à la fois.
Quand un outil Explorateur est connecté à un outil comportant des données géographiques, l’onglet Carte de la fenêtre Configuration affiche une carte des données dessinée au moyen d’une projection de Mercator sphérique.
Les options de la vue Carte sont les suivantes :
- Champs : cliquez pour afficher la liste des champs d'objets géographiques dans la vue. Cliquez sur pour désélectionner tous les champs d’objets géographiques et sur pour les sélectionner tous.
- Panoramique : cliquez pour afficher une vue panoramique de la carte en cliquant et en faisant glisser la carte jusqu'à la position souhaitée. Chaque fois que vous utilisez le panoramique, la carte affiche la nouvelle image.
- Sélection : cliquez pour sélectionner des objets sur la carte. Lorsque vous sélectionnez des objets sur la carte, les enregistrements de données correspondants sont également sélectionnés. Ils sont signalés comme tels dans les onglets Table et Rapport.
Plusieurs méthodes de sélection sont acceptées. Sélectionnez ou cliquez pour activer, puis désélectionnez ou cliquez à nouveau pour désactiver.
- Simple clic : sélectionne les objets individuels.
- Ctrl + clic : ajoute ou soustrait à une sélection.
- Cliquer et déposer : cliquer et faire glisser une zone de sélection autour des objets pour sélectionner plusieurs objets à la fois.
- Zoom avant : cliquez pour diminuer la zone de la carte et produire une image plus localisée de la carte.
- Zoom arrière : cliquez pour agrandir la zone de la carte, en produisant une image de carte plus généralisée.
- Zoom sur la sélection : cliquez pour zoomer sur un point cliqué ou sur une zone sélectionnée.
- Réinitialiser la vue : cliquez pour réinitialiser la vue de la carte à la zone d'origine.
- Carte de base : cliquez pour afficher et sélectionner une couche de référence pour l'image de la carte. Seuls les jeux de couches et de fichiers de cartes actuellement installés sur votre ordinateur apparaissent dans la liste déroulante. Voir Valeurs par défaut des jeux de données.
- Copier : cliquez pour copier l'image de la carte dans le presse-papiers afin de le coller dans d'autres applications.
- Exporter : cliquez pour enregistrer l'image de la carte dans un format de fichier image pris en charge: .jpeg, .png, .bmp.
Quand un outil Explorateur est connecté à un outil comportant des données de profil d’analyse comportementale, l’onglet Analyse comportementale de la fenêtre Configuration affiche le contenu XML du champ de profil sélectionné, enregistrements par enregistrement, dans une table.
Les options d’affichage des analyses comportementales sont les suivantes :
- Profil : répertorie les champs de profil dans les données. Un seul champ de profil peut être visualisé à la fois.
- Navigation : cliquez sur les flèches de navigation pour afficher des enregistrements spécifiques. Par défaut, la fenêtre Configuration affiche 1 enregistrement à la fois, car un seul enregistrement contient les données des 60 clusters du profil sélectionné.
- Jeu de données : affiche les données à partir desquelles le profil a été extrait.
- Démographique : le niveau de classification avec lequel le profil a été construit (généralement, foyer ou adulte).
- Principal : si cette option est sélectionnée, cela indique la population primaire en fonction de laquelle le profil a été construit (généralement foyer, démographique ou adulte).
- Numéro de cluster : identifie le cluster.
- Nombre : identifie la population qui répond aux critères du profil.
- Base : identifie la population (ménage ou adulte) correspondant à ce cluster particulier.
- Volume moyen : identifie la valeur moyenne calculée en divisant le Nombre par la Base pour chaque cluster. Les valeurs sont nulles si les données du cluster ne sont pas fournies.
- Grille de données : affiche les données du cluster.
Utilisez l’outil Champs détaillés pour ajouter les données disponibles dans cet onglet à un workflow. Voir Outil Champs détaillés.