
Outil Corrélation De Pearson
Utilisez l’outil de corrélation Pearson pour mesurer la corrélation entre deux variables.
L’outil Corrélation de Pearson utilise le coefficient de corrélation produit-moment de Pearson (parfois appelé « PMCC », et généralement désigné par r) pour mesurer la corrélation (dépendance linéaire) entre deux variables X et Y, fournissant une valeur comprise entre +1 et −1 inclus. Il est couramment utilisé dans le domaine des sciences pour mesurer la force de la dépendance linéaire entre deux variables.*
La corrélation (souvent mesurée sous la forme du coefficient de corrélation ρ) indique la force et la direction d’une relation linéaire entre deux variables aléatoires. Les valeurs de corrélation vont de 1,00 à 1,00 euros (corrélation positive parfaite). La valeur zéro indique l’absence de corrélation.
Le coefficient de Pearson est obtenu en divisant la covariance des deux variables par le produit de leur écart-type.*
Configurer l'outil
- Générer une corrélation pour les variables sélectionnées: sélectionnez deux ou plusieurs champs (colonnes) dans le flux d’entrée sur le volet d’entrée sur le jour de l’exécution de la corrélation. Les champs doivent être numériques. Les colonnes contenant des identificateurs uniques, comme les touches primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l’exécution.
- Spécifier le type de calcul à exécuter :
- Calculer la corrélation: Mesure la corrélation Pearson.
- Calculer la covariance: Mesure la covariance entre les différents champs. Le type de covariance est « Covariance d’échantillon », qui correspond à la formule statistique Excel « COVARIANCES ».
L’outil Coefficient de corrélation de Pearson attend des valeurs non-Null. S’il y a des nulls dans les données, il est préférable d’utiliser l’outil Imputation pour remplacer d’abord les nulls.
*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient