
Strumento Analisi Associazione
Lo strumento di analisi dell'associazione consente all'utente di determinare quali campi di un database hanno un'associazione bivariata tra loro. La valutazione può essere basata su coefficienti di correlazione Pearson product-moment ("regolari") , sui coefficienti di correlazione degli ordini di rango di Spearman, o sulle statistiche D di Hoeffding ( un test non parametrico in grado di trovare relazioni non monotoniche come U-forme rovesciate). Inoltre, viene determinata la rilevanza statistica di ogni misura di associazione.
Lo strumento fornisce sempre il set completo di relazioni e, facoltativamente, può fornire un'analisi approfondita di un campo di destinazione di interesse e la relativa relazione con altre variabili numeriche. Il campo di destinazione di interesse può essere una variabile numerica o una variabile di categoria binaria. Se una variabile di categoria binaria viene utilizzata come campo di destinazione, viene convertita in un campo numerico zero-uno con il valore uno imputato nei casi in cui il campo ha un livello che corrisponde a un livello di destinazione e un valore zero viene imputato in caso contrario.
Questo strumento utilizza lo strumento R. Vai a Opzioni> Scarica Strumenti predittivie accedi al portale Licenze e Download di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consultare Scaricare e utilizzare strumenti predittivi.
Configurazione dello strumento
- Scegliere un campo per un'analisi più dettagliata: Ciò consente di eseguire un'analisi più mirata di un campo di interesse e di altri campi nei dati. Ciò è particolarmente utile se l'obiettivo dell'analisi è determinare il set di campi da utilizzare in un modello predittivo successivo. Se questa opzione è selezionata, è necessario fornire il nome del campo di destinazione, che può essere classificato numerico o binario. Se il campo è binario categorico, selezionare il valore di questo campo che verrà ricodificato come uno, con l'altro valore codificato come zero. Se il campo fornito è categorico e contiene più di due valori diversi, verrà restituito un errore.
Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime. - Campi (selezionare due o più): Selezionare i campi per l'analisi dell'associazione. Se è stato selezionato un campo "destinazione", questo verrà automaticamente incluso in questo elenco. I campi non di destinazione devono essere numerici.
- Misura dell'associazione: Selezionare una delle correlazioni prodotto-momento di Pearson, Correlazione ordine di rango Spearmano Statistica D di Hoeffding.
Visualizzazione dell'output
R ancoraggio: l'output del report include 3 tabelle che comprendono un'analisi di correlazione Pearson: analisi messa a fuoco di trans di campo, matrice di correlazione completa e matrice dei valori p corrispondenti.
Ancora: il rapporto interattivo include una matrice di correlazione con grafico a dispersione che cambia in base alla posizione del mouse.