Skip to main content

Pearson Correlation Tool Icon Strumento Correlazione Pearson

Esempio di uno strumento

La Correlazione Pearson presenta l'opzione Esempio di uno strumento. Consulta Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.

Utilizza Correlazione Pearson per misurare la correlazione tra due variabili.

Lo strumento Correlazione Pearson utilizza il coefficiente di correlazione prodotto-momento di Pearson (a volte indicato come PMCC, e generalmente indicato da r) per misurare la correlazione (dipendenza lineare) tra due variabili X e Y, generando un valore compreso tra +1 e −1 incluso. È ampiamente usato nelle scienze come misura della forza della dipendenza lineare tra due variabili.*

La correlazione (spesso misurata come coefficiente di correlazione, ρ) indica la forza e la direzione di una relazione lineare tra due variabili casuali. I valori di correlazione sono compresi tra -1,00 (una perfetta correlazione negativa) e +1,00 (una perfetta correlazione positiva). Zero indica che non vi è alcuna correlazione.

Il coefficiente di Pearson è ottenuto dividendo la covarianza delle due variabili per il prodotto delle loro deviazioni standard.*

Configurazione dello strumento

  • Genera correlazione per le variabili selezionate: seleziona due o più campi (colonne) dal flusso di input su cui eseguire la correlazione. I campi devono essere numerici. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.

  • Specifica il tipo di calcolo da eseguire:

    • Calcola correlazione: misura la correlazione Pearson.

    • Calcola covarianza: misura la covarianza tra campi diversi. Il tipo di covarianza è "covarianza campione", che è la stessa della formula statistica di Excel "COVARIANCES".

Lo strumento Coefficiente di correlazione Pearson prevede valori non nulli. Se i dati contengono valori nulli, è consigliabile utilizzare lo Strumento Imputazione per sostituire prima i nulli.

*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient