
Outil Profil De Données De Base
L’outil Profil de données de base analyse les données et fournit des métadonnées pour chaque colonne (champ) de données.
Utilisez l’outil Profil de données de base pour afficher une vue d’ensemble, ou profil, des données et sortir les informations en vue d’une analyse ultérieure. Pour afficher une représentation visuelle du profil de données, outre les métadonnées, utilisez un outil Explorateur. Voir Parcourir l'outil.
Configuration de l'outil
Renseignez toutes les options de configuration facultatives :
- Limite pour le nombre exact : La limite par défaut est recommandée pour les meilleures performances. Augmentez la limite pour afficher les informations de profil relatives à davantage de données. Tapez ou cliquez pour sélectionner le nombre maximum de valeurs uniques que vous souhaitez qu'Alteryx identifie dans les données.
- Limite de taille pour retourner toutes les valeurs uniques (personnages) : La limite par défaut est recommandée pour les meilleures performances. Augmentez la limite pour afficher les informations de profil relatives à davantage de données. Tapez ou cliquez pour sélectionner le nombre de caractères maximum qu’Alteryx doit vérifier dans une valeur pour déterminer si elle est unique.
- Utiliser les unités métriques : Sélectionnez pour utiliser des unités métriques de mesure. Cette option s’applique uniquement aux données géographiques.
Afficher la sortie
Les informations de profil des données affichées dans la fenêtre Résultats varient selon le type de données provenant de l’outil Connecter. Voir Types de données, pour une liste de types de données.
Les résultats sont affichés verticalement. Faites défiler l’écran pour parcourir les métadonnées relatives à chaque colonne de données.
Données de type Chaîne
Si une colonne contient des valeurs de type chaîne, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Données Type : Le type de données de la colonne sélectionnée.
- Taille: La quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Source: L'origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
- Description: La description de la colonne, si disponible. Si aucune description n'est disponible, c'est [Null].
- Nulls: Nombre de valeurs dans la colonne qui sont nulles, à l'exclusion des valeurs vides.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Blancs: Le nombre de valeurs vides.
- Valeurs avec l'espace blanc de premier plan: Le nombre de valeurs de chaîne avec l'espace blanc avant la valeur. Utilisez l’outil Nettoyage des données ou la fonction d’ajustement de l’outil Formule pour résoudre le problème. Voir outil de nettoyage des données et outil de formule.
- Valeurs avec Trailing Whitespace: Le nombre de valeurs de chaîne avec l'espace blanc après la valeur.
- Valeurs avec les deux Espace blanc: Le nombre de valeurs de chaîne avec l'espace blanc avant et après la valeur.
- Longueur moyenne: La longueur moyenne des valeurs dans la colonne.
- Longueur la plus longue : Nombre de caractères dans la valeur la plus longue de la colonne.
- Valeur la plus longue : La valeur la plus longue de la colonne.
- Longueur la plus courte (non-blank) : Le nombre de caractères dans la valeur la plus courte de la colonne.
- Valeur la plus courte : La valeur la plus courte de la colonne.
- Minimum: La première entrée de chaîne dans une colonne qui est triée par ordre alphabétique.
- Maximum: La dernière entrée de chaîne dans une colonne qui est triée par ordre alphabétique.
- Uniques: Le nombre de valeurs uniques sur le terrain. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- Valeurs uniques : Toutes les valeurs uniques dans la colonne.
Données numériques
Si une colonne contient des valeurs numériques, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Données Type : Le type de données de la colonne sélectionnée.
- Taille: La quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Source: L'origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
- Description: La description de la colonne, si disponible. Si aucune description n'est disponible, c'est [Null].
- Nulls: Nombre de valeurs dans la colonne qui sont nulles, à l'exclusion des valeurs vides.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Minimum: La plus petite valeur dans la colonne.
- Maximum: La plus grande valeur dans la colonne.
- Moyenne: La valeur moyenne des valeurs dans la colonne.
- Déviation standard : La mesure de la dispersion des valeurs dans le graphique.
- Variance: La mesure de la mesure dans quelle mesure un ensemble de nombres aléatoires sont dispersés de la moyenne.
- Uniques: Le nombre de valeurs uniques sur le terrain. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- Valeurs uniques : Toutes les valeurs uniques dans la colonne.
- 25ème Pourcentage: La valeur médiane dans la moitié inférieure, ou la première, des données.
- 50e Percentile: La valeur médiane des données.
- 75e Percentile: La valeur médiane dans la partie supérieure, ou la deuxième, de la moitié des données.
- Histogramme: Nombre de valeurs dans la colonne qui se divisent en données regroupées uniformément. Chaque groupe est indiqué par une valeur de départ et un nombre de valeurs dans le groupe, séparés par un côlon. Un groupe contient des valeurs allant jusqu’à la valeur de départ du groupe suivant, cette valeur de départ étant exclue. 1:23, 2:15,3:0 indique trois groupes commençant à 1, 2 et 3. Chaque groupe possède respectivement 23, 15 et 0 éléments.
- Marge d'erreur : La gamme possible de valeurs sous et au-dessus de la valeur calculée.
Données de type date/heure
Si une colonne contient des données de type date/heure, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Données Type : Le type de données de la colonne sélectionnée.
- Taille: La quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Source: L'origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
- Description: La description de la colonne, si disponible. Si aucune description n'est disponible, c'est [Null].
- Nulls: Nombre de valeurs dans la colonne qui sont nulles, à l'exclusion des valeurs vides.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Histogramme de date: (Seulement pour les données de date) Nombre de valeurs dans la colonne qui se divisent en données regroupées uniformément. Chaque groupe est indiqué par une valeur de départ et un nombre de valeurs dans le groupe, séparés par un côlon. Un groupe contient des valeurs allant jusqu’à la valeur de départ du groupe suivant, cette valeur de départ étant exclue. 1:23, 2:15,3:0 indique trois groupes commençant à 1, 2 et 3. Chaque groupe possède respectivement 23, 15 et 0 éléments.
- Minimum: La plus petite valeur dans la colonne.
- Maximum: La plus grande valeur dans la colonne.
- Uniques: Le nombre de valeurs uniques sur le terrain. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Voir Outil Unique.
- Valeurs uniques : Toutes les valeurs uniques dans la colonne.
Données d’objet géographique
Si une colonne contient des objets géographiques, les métadonnées suivantes sont fournies :
- Nom : le nom de la colonne.
- Données Type : Le type de données de la colonne sélectionnée.
- Taille: La quantité de mémoire réservée à chaque enregistrement dans cette colonne.
- Source: L'origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
- Description: La description de la colonne, si disponible. Si aucune description n'est disponible, c'est [Null].
- Nulls: Nombre de valeurs dans la colonne qui sont nulles, à l'exclusion des valeurs vides.
- Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
- Taille moyenne (Bytes) : La taille moyenne de la mémoire que cet objet prend.
- Plus grande taille (Bytes): La taille en mémoire du plus grand objet de la colonne.
- Point de comptage: Le nombre d'objets spatiaux dans la colonne qui sont des points.
- Ligne de comptage: Le nombre d'objets spatiaux dans la colonne qui sont des lignes.
- Comte PolyPolyline: Le nombre d'objets spatiaux dans la colonne qui sont polylignes.
- Compter Rectangle: Nombre d'objets spatiaux dans la colonne qui sont des rectangles.
- Comte Polygone: Le nombre d'objets spatiaux dans la colonne qui sont des polygones.
- Comptez MultiPoint: Nombre d'objets spatiaux dans la colonne qui sont multi-points.
- Nombre moyen de pièces: Nombre moyen de parties dans les objets spatiaux dans la colonne.
- Plus grand nombre de pièces: Le plus grand nombre de pièces dans les objets spatiaux dans la colonne.
- Nombre moyen de points: Nombre moyen de points dans les objets spatiaux dans la colonne.
- Plus grand nombre de points: Le plus grand nombre de points dans les objets spatiaux dans la colonne.
- Longueur la plus longue : La longueur la plus longue dans les objets spatiaux dans la colonne.
- Plus grande zone: La plus grande zone en miles carrés ou kilomètres carrés.