Ferramenta de correlação de Pearson
A ferramenta de correlação de Pearson usa o coeficiente de correlação de momento do produto Pearson (às vezes chamado de PMCC, e tipicamente indicado por r) para medir a correlação (dependência linear) entre duas variáveis X e Y, dando um valor entre + 1 e − 1 inclusive. É amplamente utilizado nas ciências como uma medida da força da dependência linear entre duas variáveis. *
A correlação (muitas vezes medida como um coeficiente de correlação, ρ) indica a força e a direção de uma relação linear entre duas variáveis aleatórias. Os valores de correlação variam de – 1, 0 (uma correlação negativa perfeita) a + 1, 0 (uma correlação positiva perfeita). Zero não indica nenhuma correlação.
O coeficiente de Pearson é obtido dividindo-se a covariância das duas variáveis pelo produto de seus desvios padrão. *
Configure a ferramenta
- Gerar correlação para variáveis selecionadas: selecione dois ou mais campos do fluxo de entrada para executar a correlação. Os campos devem ser numéricos.
- Especifique o tipo de cálculo a ser executado. As escolhas são:
- Calcular correlação: mede a correlação de Pearson.
- Calcular covariância: mede a covariância entre diferentes campos. O tipo de covariância é "amostra covariância", que é o mesmo que a fórmula estatística do Excel "covariâncias".
As colunas que contêm identificadores exclusivos, como chaves primárias substitutas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.
A ferramenta coeficiente de correlação de Pearson espera valores não nulos. Se houver NULLs nos dados, é uma boa idéia usar o Ferramenta Imputação para substituir o NULLs primeiro.
*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient