
Strumento Analisi Distribuzione
Utilizzare lo strumento Analisi distribuzione per adattare una o più distribuzioni ai dati di input e confrontarle in base a una serie di statistiche di Bonness-of-Fit. In base alla rilevanza statistica (valori p) dei risultati di questi test, è possibile determinare quale distribuzione rappresenta meglio i dati.
Lo strumento Analisi della distribuzione può essere utile quando si cerca di comprendere la natura complessiva dei dati e di prendere decisioni su come analizzarli. Ad esempio, è probabile che i dati che soddisfano una distribuzione normale siano adatti a una regressione lineare, mentre i dati che sono Gamma Distributed potrebbero essere più adatti all'analisi tramite lo strumento di regressione gamma.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Alteryx Downloads and Licenses per installare R e i pacchetti utilizzati dallo strumento R. Consultate Scaricare e utilizzare gli strumenti predittivi.
Configurare lo strumento
Scheda Configurazione
Utilizzare la scheda Configurazione per impostare i controlli obbligatori per l'analisi della distribuzione.
- Selezionare un campo per l'analisi:selezionare un campo dai dati in entrata per l'analisi.
- Selezionare le distribuzioni per ilconfronto : Selezionare una o più distribuzioni da confrontare. Le opzioni di distribuzione sono:
- Normale: Una distribuzione di probabilità continua che si verifica comunemente che viene spesso utilizzata sia nelle scienze naturali che sociali per rappresentare variabili casuali con valori reali (cioè variabili casuali continue che possono assumere valori sia positivi che negativi).
- Lognormale: Distribuzione a probabilità continua di una variabile casuale il cui logaritmo è normalmente distribuito. Questa distribuzione è adatta alla descrizione di fenomeni naturali come il tasso di crescita e le distribuzioni delle dimensioni. Inoltre, è spesso usato per descrivere la distribuzione del reddito in una popolazione sufficientemente grande.
- Weibull: Una distribuzione relativamente flessibile che è strettamente correlata alla distribuzione esponenziale. Si trova spesso nei dati che descrivono i tassi di "guasto" di qualche tipo, ad esempio, guasti meccanici casuali, mortalità, varianza, tassi di usura meccanica, ecc.
- Gamma: Una distribuzione di probabilità continua caratterizzata da una concentrazione significativa di casi a valori inferiori non interi e non negativi, consentendo anche la ragionevole possibilità di valori molto più alti. La distribuzione Gamma ha una vasta gamma di usi e si trova comunemente nei dati che descrivono importi aggregati (o medi) per caso, ad esempio, la dimensione media di un reclamo assicurativo, misurato per individuo.
Le distribuzioni Lognormal, Weibull e Gamma funzionano solo per i dati non negativi.
Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
Scheda Opzioni grafica
Utilizzare la scheda Opzioni grafiche per impostare i controlli per l'output grafico.
- Dimensioni distampa : Selezionare Pollici o Centimetri per le dimensioni del grafico e impostare i valori Larghezza e Altezza.
- Risoluzione grafico: Selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi), 2x (192 dpi)o 3x (288 dpi).
- La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
- Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
Visualizzazione dell'output
Set di frammenti di report che include un istogramma, statistiche di riepilogo di base dei risultati del test, bontà delle statistiche di adattamento, quantili di dati per distribuzione e parametri di distribuzione.
D'Agostino, R., Stephens, M.A. (1986) Bontà delle tecniche di fit.