Herramienta de correlación de Pearson

La herramienta de correlación de Pearson utiliza el coeficiente de correlación producto-momento de Pearson (a veces referido como el PMCC, y típicamente denotado por r) para medir la correlación (dependencia lineal) entre dos variables X e y, dando un valor entre + 1 y − 1 Incluido. Es ampliamente utilizado en las ciencias como una medida de la fuerza de la dependencia lineal entre dos variables. *

La correlación (a menudo medida como coeficiente de correlación, ρ) indica la fortaleza y dirección de una relación lineal entre dos variables aleatorias. Los valores de correlación oscilan entre – 1,00 (una correlación negativa perfecta) a + 1,00 (una correlación positiva perfecta). Cero no indica ninguna correlación.

El coeficiente de Pearson se obtiene dividiendo la covarianza de las dos variables por el producto de sus desviaciones estándar. *

Configurar la herramienta

  1. Generar correlación para las variables seleccionadas: Seleccione dos o más campos de la secuencia de entrada para ejecutar la correlación. Los campos deben ser numéricos.
  2. Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.

  3. Especifique el tipo de cálculo que se debe ejecutar. Las opciones son:
    • Calcular correlación: mide la correlación de Pearson.
    • Calcular covarianza: mide la covarianza entre diferentes campos. El tipo de covarianza es la "covarianza de la muestra", que es la misma que la fórmula estadística de Excel.

La herramienta de coeficiente de correlación de Pearson espera valores no nulos. Si hay valores NULL en los datos, es recomendable utilizar el Herramienta Imputación para reemplazar primero los valores NULL.

*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient