Outil Récapitulatif des champs
L’outil Récapitulatif des champs analyse les données et crée un rapport récapitulatif contenant les statistiques descriptives des données dans les colonnes sélectionnées.
L’outil Récapitulatif des champs permet de tirer parti des données et de recevoir des recommandations pour la gestion des données.
Les valeurs numériques, de type chaîne, géographique et date/heure sont prises en charge dans cet outil. Un ensemble unique de statistiques descriptives est indiqué pour chaque type de données. Voir Types de données pour en savoir plus sur les types de données.
Configurer l’outil
Sélectionnez toutes les colonnes, quelques colonnes ou un échantillon aléatoire de colonnes à inclure dans la sortie.
Les colonnes contenant des données qui ne sont pas prises en charge dans cet outil, telles que les données booléennes, peuvent être sélectionnées pendant la configuration de l'outil; Toutefois, la colonne n'est pas analysée ou incluse dans la sortie de l'outil.
- Sélectionnez les champs à info Résumé du produit: sélectionnez les colonnes à analyser et à inclure dans la sortie.
- Tous: cliquez pour sélectionner toutes les colonnes dans les données.
- None: cliquez pour désélectionner les colonnes précédemment sélectionnées.
- Exemples de données d'entrée: sélectionnez cette option pour inclure un échantillon de colonnes dans la sortie au lieu de sélectionner tout ou des colonnes spécifiques.
- Enregistrements aléatoires N: sélectionnez le nombre d'enregistrements à inclure dans la sortie.
- N% aléatoire des enregistrements: sélectionnez le pourcentage d'enregistrements entrants à inclure dans la sortie.
Afficher la sortie
L’outil Récapitulatif des champs a trois sorties :
- O ancre: un flux de données Alteryx avec des statistiques descriptives pour les colonnes sélectionnées ainsi que des recommandations, dans la colonne remarques, pour la gestion des données.
- R ancre: un rapport statique avec une dispersion et des statistiques descriptives pour les colonnes sélectionnées ainsi que des recommandations (voir Remarques) pour la gestion des données dans une colonne. Pour afficher le rapport, ajoutez un outil de navigation et connectez-le à la sortie R. Voir Outil Explorateur.
- I ancre: tableau de bord interactif composé de panneaux extensibles pour chaque colonne. Pour afficher le rapport, ajoutez un outil Explorateur, puis connectez-le à la sortie I. Voir Outil Explorateur. Chaque volet inclut un histogramme ou un graphique en colonnes, ainsi que des statistiques récapitulatives.
- Survolez un volet avec le pointeur de la souris pour afficher des icônes supplémentaires.
- Cliquez sur l’icône d’information pour afficher des informations supplémentaires.
- Cliquez sur l’icône Développer pour ouvrir le rapport dans une vue détaillée.
- Survolez une barre du graphique avec le pointeur de la souris pour afficher les détails.
- Sélectionnez variable pour afficher pour vous concentrer sur un plus petit ensemble de colonnes.
- Triez les volets par ordre alphabétique ou par pourcentage de valeurs manquantes.
- Survolez un volet avec le pointeur de la souris pour afficher des icônes supplémentaires.
Les statistiques descriptives disponibles dans la sortie varient selon le type de données contenues dans les colonnes sélectionnées pour l’analyse. Les résultats sont affichés horizontalement. Faites défiler l’écran de gauche à droite pour parcourir les statistiques relatives à chaque type de données.
Si une colonne contient des valeurs numériques, les statistiques suivantes sont fournies :
- Min: valeur minimale dans les données.
- Max: la valeur maximale dans les données.
- Médiane: la valeur médiane des données.
- Écart Dev.: mesure de la dispersion des valeurs dans les données.
- Pour cent manquant: le pourcentage de valeurs dans les données qui sont null.
- Valeurs uniques: nombre de valeurs uniques dans les données.
- moyen: la moyenne des données.
- Miseen page: ajoutez un outil de navigation et connectez-le à la sortie R pour afficher les statistiques dans un format visuel. Voir Outil Explorateur.
- Remarques: recommandations pour la gestion des données, le cas échéant.
Si une colonne contient des données de type Chaîne, les statistiques suivantes sont fournies :
- Pour cent manquant: le pourcentage de valeurs dans les données qui sont null.
- Valeurs uniques: nombre de valeurs uniques dans les données.
- Valeur la plus courte: la valeur de chaîne courte (longueur) dans les données.
- Plus longue valeur: valeur de chaîne la plus longue (longueur) dans les données.
- Valeur min Count: nombre de valeurs égales à la valeur minimale.
- nombre de valeurs max.: valeur égale à la valeur maximale.
- Remarques: recommandations pour la gestion des données, le cas échéant.
Si une colonne contient des données géographiques, les statistiques suivantes sont fournies :
- Pour cent manquant: le pourcentage de valeurs dans les données qui sont null.
- Typed'objet: type d'objet spatial (par exemple, point ou polygone) dans les données.
- Superficie AVG (milles carrés): superficie moyenne, en milles carrés, des valeurs dans les données.
- Longueur Moy (milles): longueur moyenne, en milles, des valeurs dans les données.
- AVG num points: nombre moyen de valeurs dans les données qui sont des points.
- Remarques: recommandations pour la gestion des données, le cas échéant.
Si une colonne contient des données de type date/heure, les statistiques suivantes sont fournies :
- Pour cent manquant: le pourcentage de valeurs dans les données qui sont null.
- Valeurs uniques: nombre de valeurs uniques dans les données.
- Dernière date: la date la plus récente, ou la plus future, dans les données.
- Date la plus rapprochée: la date la plus rapprochée des données.
- Intervalle: intervalle de dates (par exemple, mensuel) dans les données.
- Remarques: recommandations pour la gestion des données, le cas échéant.