Magnifying glass over a rain drop and umbrella symbol

Outil Analyse D’association

Version:
2023.1
Last modified: August 25, 2022

L’outil Analyse d’association permet d’identifier les champs d’une base de données qui possèdent une association bivariée entre eux. L’évaluation peut être basée sur les coefficients de corrélation produit-moment de Pearson (« régulier »)*, sur les coefficients de corrélation rang-ordre de Spearman** ou sur les statistiques D d’Hoeffding*** (un test non paramétrique capable de trouver des relations non monotones telles que les formes en U inversées). En outre, le caractère statistiquement significatif de chaque mesure d’association est déterminé.

L’outil fournit toujours l’ensemble complet de relations. Il peut même assurer une analyse approfondie d’un champ cible d’intérêt et de sa relation avec d’autres variables numériques. Le champ cible d’intérêt peut être soit une variable numérique, soit une variable catégorielle binaire. Si une variable catégorielle binaire est utilisée comme champ cible, elle est convertie en champ numérique 0-1, la valeur 1 étant imputée lorsque le champ possède un niveau correspondant à un niveau cible.

Cet outil utilise l’outil R. Sélectionnez options > Télécharger les outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les paquets utilisés par l'outil R. Voir Télécharger et utiliser les outils prédictifs.

Configuration des outils

  1. Ciblez un champ pour une analyse plus détaillée : Cela vous permet d'exécuter une analyse plus ciblée d'un domaine d'intérêt et d'autres domaines dans les données. Cette fonction est particulièrement utile lorsque l’analyse a pour but de déterminer le jeu de champs à utiliser dans un modèle prédictif ultérieur. Si cette option est sélectionnée, vous devez fournir le nom du champ cible, qui peut être soit numérique ou binaire catégorique. Si le champ est binaire catégorique, sélectionnez la valeur de ce champ qui sera re codé comme un, avec l'autre valeur codée comme zéro. Si le champ indiqué est catégoriel et s’il contient plus de 2 valeurs différentes, une erreur est générée.
    Les colonnes contenant des identifiants uniques, tels que les clés primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l’exécution.
  2. Champs (sélectionnez deux ou plus) : Sélectionnez les champs pour l'analyse de l'association. Si vous avez sélectionné un champ « cible », il est automatiquement inclus dans cette liste. Les champs autres que cibles doivent être numériques.
  3. Mesure de l'association : Sélectionnez l'une des corrélations produit-moment Pearson, la corrélation rang-ordre De Spearman, ou la statistique D de Hoeffding.

Afficher la sortie

R ancre: la sortie du rapport comprend 3 tableaux comprenant une analyse de corrélation Pearson: analyse focalisée du champ trans, matrice de corrélation complète et matrice des valeurs p correspondantes.

I ancre: le rapport interactif inclut une matrice de corrélation avec dispersion qui change en fonction de votre position de souris.

Tableau des valeurs critiques pour pearson’s r

Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.