Outil Tableau de contingence
L'outil de table de contingence a une utilisation similaire à celle de la Outil Tableau des fréquences, mais au lieu de simplement regarder chaque champ individuellement, l'outil de table de contingence examine jusqu'à quatre variables/champs et comment ils se rapportent les uns aux autres. L'outil produit deux sorties, une sortie de données qui répertorie toutes les combinaisons de valeurs entre les champs sélectionnés, avec une fréquence et une colonne pour cent. La sortie de rapport produit des tableaux pour montrer les combinaisons de valeurs entre les champs, plus des lignes et colonnes de pourcentages supplémentaires.
Si l'utilisateur analyse seulement deux champs, il peut également sélectionner pour afficher la statistique Chi-Square à inclure dans le rapport. Une statistique chi au carré permet de vérifier si les distributions de variables catégorielles diffèrent entre elles. Pour que cette option puisse s’exécuter avec succès, R doit être installé.
Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.
Configurer l’outil
- Incluez la statistique de Chi-carré: une statistique de Chi carré (X2) est employée pour examiner si les distributions des variables catégoriques diffèrent les unes des autres. Ces données sont incluses dans la sortie de rapport.
- N'incluez pas la statistique Chi-carrée: au moins deux champs et jusqu'à quatre champs peuvent être sélectionnés.
Sélectionnez les deux champs à analyser.
Lorsque vous sélectionnez des champs pour l’une ou l’autre de ces options, les règles suivantes s’appliquent :
- Chaque variable doit posséder des valeurs uniques. Si les valeurs ne sont pas uniques dans les champs, une erreur s’affiche.
- Certains types de champs ne peuvent pas être sélectionnés: FixedDecimal, float, double, date, Time, DateTime, BLOB et SpatialObj. Les types de champs Entier sont autorisés, mais vous ne devez les utiliser que si le champ est véritablement catégoriel.
Afficher la sortie
D ancre: la sortie de données comprend les champs suivants:
Nom | Description |
---|---|
InputField_SelectedField1 (2, 3, 4) | Nom d’origine du champ des données d’entrée.
En fonction du nombre de champs sélectionnés, il est possible que les champs InputField_SelectedField3 et InputField_SelectedField4 ne soient pas présents et la partie en italique sera alors remplacée par le nom réel du champ sélectionné. |
Fréquence | Nombre de fois que la valeur est présente dans les données d’entrée pour le nom de champ fourni. |
Pourcentage | (Fréquence/total des enregistrements) *100 |
R ancre: la sortie de rapport inclut une table de contingence pour chaque champ sélectionné.
Le premier enregistrement de cette sortie affiche des avertissements à propos des types de champs. Si l’un des champs sélectionnés est défini sur un type de données numérique, un avertissement apparaît. Le reste du rapport affiche un tableau de contingence pour chaque combinaison de valeurs de champs. L’en-tête du tableau présente les champs sélectionnés et les valeurs des champs non représentés dans le tableau. Le tableau contient également une colonne Total et des lignes pour la fréquence, le pourcentage, le pourcentage de lignes et le pourcentage de colonnes.
Si la statistique chi au carré est sélectionnée, les valeurs suivantes sont affichées sous le tableau : chi au carré, df et valeur p. Chi au carré correspond à la valeur chi au carré calculée, df correspond au degré de liberté et la valeur p correspond à la valeur statistique renvoyée par R. Plus la valeur p est basse, plus il est probable que les variables soient dépendantes les unes des autres.
I ancre: la sortie interactive comprend un graphique où le spectateur peut personnaliser ce qui s'affiche avec une série d'options de déroulant.