Esempio di uno strumento
La Tabella di contingenza presenta l'opzione Esempio di uno strumento. Consulta Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Utilizza Tabella di contingenza per esaminare fino a quattro variabili/campi e stabilire le relazioni tra gli stessi. Lo strumento Tabella di contingenza ha un uso simile a quello dello strumento Tabella di frequenza. Lo strumento produce due output, un output di dati che elenca tutte le combinazioni di valori tra i campi selezionati, con una colonna frequenza e una colonna percentuale. L'output del report produce tabelle per mostrare le combinazioni di valori tra i campi e include anche alcune percentuali aggiuntive di righe e colonne.
Se stai analizzando solo due campi, puoi anche scegliere di generare la statistica chi-quadro da includere nel report. Viene utilizzata una statistica chi-quadro per controllare se le distribuzioni di variabili categoriche differiscono tra loro.
Per eseguire correttamente questa opzione, è necessario installare R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo Strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Includi statistiche chi-quadro: viene utilizzata una statistica chi-quadro (X2) per controllare se le distribuzioni di variabili categoriche differiscono tra loro. Questi dati saranno inclusi nell'output del report. Seleziona i due campi da analizzare tramite Variabile 1 e Variabile 2.
Non includere statistica chi-quadro: è possibile selezionare almeno due campi e fino a quattro campi. Quando selezioni i campi per una delle due opzioni, si applicano le seguenti regole:
Ogni variabile deve avere valori univoci. Se i valori non sono univoci nei campi, viene generato un errore.
Non è possibile selezionare determinati tipi di campo: FixedDecimal, Float, Double, Date, Time, DateTime, Blob e SpatialObj. I tipi di campo interi sono consentiti ma devono essere utilizzati solo se il campo è realmente categorico.
Ancoraggio D: l'output dei dati include i seguenti campi:
Nome
Descrizione
InputField_SelectedField1 (2, 3, 4)
Nome del campo originale dei dati di input.
A seconda del numero di campi selezionato, InputField_SelectedField3 e InputField_SelectedField4 potrebbero non essere presenti e la parte in corsivo viene aggiornata con il nome del campo attualmente selezionato.
Frequenza
Numero di volte in cui il valore è presente nei dati di input per il nome campo specificato.
Percentuale
(Frequenza/record totali)*100
Ancoraggio R: l'output del report include una tabella di contingenza per ciascun campo selezionato.
Il primo record di questo output mostra eventuali avvertenze per i tipi di campo. Se uno dei campi selezionati è impostato su tipi di dati numerici, viene visualizzato un avviso. Il resto del report mostra una tabella di contingenza per ogni combinazione di valori di campo, l'intestazione della tabella mostra i campi selezionati dall'utente e i valori per tutti i campi non visualizzati nella tabella. La tabella mostra anche una colonna Totale e le righe per Frequenza, Percentuale, Percentuale riga e Percentuale colonna.
Se l'opzione statistica chi-quadro è selezionata, sotto la tabella vengono visualizzati i seguenti valori:
Chi-quadro: il valore chi-quadro calcolato.
df: gradi di libertà.
Valore-p: il valore statistico restituito da R. Più basso è il valore p, più è probabile che le variabili siano dipendenti l'una dall'altra.
Ancoraggio I: l'output interattivo include un grafico in cui il visualizzatore può personalizzare i contenuti visualizzati con una serie di opzioni a discesa.