Field Summary Tool Icon

Outil Récapitulatif Des Champs

Version:
2022.3
Last modified: September 25, 2020

Utilisez l’outil Résumé de champ pour analyser les données et créer un rapport récapitulatif contenant des statistiques descriptives des données dans des colonnes sélectionnées. Utilisez l’outil pour obtenir un aperçu des données et recevoir des recommandations pour la gestion des données.

Les données numériques, de chaîne, spatiale et de date/heure sont prises en charge dans cet outil. Un ensemble unique de statistiques descriptives est indiqué pour chaque type de données. Voir Types de données pour en savoir plus sur les types de données.

Configurer l'outil

Sélectionnez les champs pour produire des informations récapitulatives: Cochez la case à cocher associée aux champs (colonnes) pour lesquelles vous souhaitez produire des informations récapitulatives.

Exemples de données d’entrée: Cochez cette case à cocher pour prélever un échantillon aléatoire d’enregistrements. Cela peut réduire le temps d’exécution de votre flux de travail si vous disposez d’un grand jeu de données. Chaque fois que vous exécutez votre flux de travail, un exemple de données différent s’affiche. Vous disposez de 2 options d’échantillonnage :

  • Enregistrements N aléatoires: Spécifiez le nombre d’enregistrements que vous souhaitez échantillonner au hasard.
  • N% aléatoire des enregistrements: spécifiez le pourcentage d’enregistrements que vous souhaitez échantillonner au hasard.

Afficher la sortie

L’outil Résumé de champ comporte 3 sorties :

  • O ancre : flux de données Alteryx avec des statistiques descriptives pour les colonnes sélectionnées ainsi que des recommandations, dans la colonne Remarques, pour la gestion des données.
  • R anchor : rapport statique avec un scatterplot et des statistiques descriptives pour les colonnes sélectionnées ainsi que des recommandations (voir Remarques) pour la gestion des données dans une colonne. Pour afficher le rapport, ajoutez un outil Parcourir et connectez-le à la sortie R. Voir Outil Explorateur.
  • J’ancre : Un tableau de bord interactif composé de panneaux extensibles pour chaque colonne. Pour afficher le rapport, ajoutez un outil Parcourir et connectez-le à la sortie I. Voir Outil Explorateur. Chaque panneau se compose d’un histogramme ou d’un graphique de colonnes et de statistiques sommaires.
    • Survolez un volet avec le pointeur de la souris pour afficher des icônes supplémentaires.
      • Sélectionnez l’icône d’informations pour afficher des informations supplémentaires
      • Sélectionnez l’icône d’extension pour ouvrir le rapport dans une vue détaillée.
    • Survolez une barre du graphique avec le pointeur de la souris pour afficher les détails.
    • Sélectionnez variable à afficher pour se concentrer sur un plus petit ensemble de colonnes.
    • Trier les panneaux par ordre alphabétique ou par le pourcentage de valeurs manquantes.

Les statistiques descriptives disponibles dans la sortie varient selon le type de données contenues dans les colonnes sélectionnées pour l’analyse. Les résultats sont affichés horizontalement. Faites défiler l’écran de gauche à droite pour parcourir les statistiques relatives à chaque type de données.

Données numériques

Si une colonne contient des données numériques, ces statistiques sont fournies :

  • Min: Valeur minimale dans les données.
  • Max: Valeur maximale dans les données.
  • Médiane: Valeur médiane des données.
  • Écart Dev. : Mesure de la dispersion des valeurs dans les données.
  • Pourcentage manquant: pourcentage de valeurs dans les données qui sont null.
  • Valeurs uniques: nombre de valeurs uniques dans les données.
  • Moyenne: Moyenne des données.
  • Mise en page: Ajoutez un outil Parcourir et connectez-le à la sortie R pour afficher les statistiques dans un format visuel. Voir Outil Explorateur.
  • Remarques: Recommandations pour la gestion des données, si disponible.

Données String (chaîne)

Si une colonne contient des données de chaînes, ces statistiques sont fournies :

  • Pourcentagemanquant : pourcentage de valeurs dans les données qui sont null.
  • Valeurs uniques: nombre de valeurs uniques dans les données.
  • Valeurla plus courte : valeur de chaîne la plus courte (longueur) des données.
  • Valeurla plus longue : valeur de chaîne la plus longue (longueur) des données.
  • Compte de valeur Min: nombre de valeurs qui égalent la valeur minimale.
  • Nombre de valeurs maximums: nombre de valeurs égales à la valeur maximale.
  • Remarques: Recommandations pour la gestion des données, si disponible.

Données géographiques

Si une colonne contient des données spatiales, ces statistiques sont fournies :

  • Pourcentage manquant: pourcentage de valeurs dans les données qui sont null.
  • Type d’objet: Type d’objet spatial (par exemple, Point ou Polygon) dans les données.
  • Zone Avg (Sq Miles): Superficie moyenne, en miles carrés, des valeurs des données.
  • Longueur Avg (Miles): Longueur moyenne, en miles, des valeurs dans les données.
  • Points Num Avg: nombre moyen de valeurs dans les données qui sont des points.
  • Remarques: Recommandations pour la gestion des données, si disponible.

Données date/heure

Si une colonne contient des données de date/heure, ces statistiques sont fournies :

  • Pourcentage manquant: pourcentage de valeurs dans les données qui sont null.
  • Valeurs uniques: nombre de valeurs uniques dans les données.
  • Dernière date: La date la plus récente, ou la plus future, dans les données.
  • Date la plus ancienne: La date la plus ancienne des données.
  • Intervalle: Intervalle de dates (par exemple, Mensuel) dans les données.
  • Remarques: Recommandations pour la gestion des données, si disponible.
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.