Gamma Regression Tool Icon

Strumento Di Regressione Gamma

Versione:
2023.1
Last modified: September 25, 2020

Lo strumento di regressione gamma mette in relazione una variabile di interesse distribuita gamma e strettamente positiva (variabile di destinazione) con una o più variabili (variabili predittive) che si prevede abbiano un'influenza sulla variabile di destinazione.

In un certo numero di applicazioni, i valori della variabile di destinazione sono sempre strettamente positivi (cioè, non sono mai zero o negativi), ma tendono a raggrupparsi verso l'intervallo inferiore dei valori osservati, ma in una piccola minoranza di casi assumono valori di grandi dimensioni. Le variabili di destinazione di questo tipo rappresentano un processo di generazione di dati non coerente con i presupposti di normalità alla base del modello di regressione lineare tradizionale. Tuttavia, i valori sono sempre positivi e non saranno sempre numeri interi, quindi non seguono una distribuzione di Poisson o un processo basato sulla distribuzione binomiale negativo. Sono coerenti con un processo basato su una distribuzione Gamma e possono essere stimati utilizzando metodi simili alla regressione lineare, tramite il framework del modello lineare generalizzato.

Con questo strumento, se i dati di input provengono da un normale flusso di dati Alteryx, la funzione R glm open source viene utilizzata per la stima del modello. Se l'input proviene da uno strumento Di input XDF o output XDF, per la stima del modello viene utilizzata la funzione Revo ScaleR rxGlm. Il vantaggio di utilizzare la funzione basata su Revo ScaleR è che consente di analizzare set di dati molto più grandi (memoria insufficiente), ma al costo di un sovraccarico aggiuntivo per creare un file XDF e con l'impossibilità di creare parte dell'output di diagnostica del modello disponibile con le funzioni R open source.

Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Di download e licenze Dita per installare R e i pacchetti utilizzati dallo strumento R. Consultate Scaricare e utilizzare gli strumenti predittivi.

Collegare un ingresso

Un flusso di dati Alteryx o un flusso di metadati XDF che include un campo di destinazione di interesse insieme a uno o più campi predittivi possibili.

Configurare lo strumento

Utilizzare la scheda Configurazione per impostare i controlli per la regressione Gamma.

  • Nome modello: Ogni modello deve essere assegnato un nome in modo che possa essere identificato in un secondo momento. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e il carattere di sottolineatura ("_"). Non sono consentiti altri caratteri speciali e R fa distinzione tra maiuscole e minuscole.
  • Selezionare la variabile didestinazione : Selezionare il campo dal flusso di dati che si desidera stimare.
  • Selezionare le variabili predittori: Scegliere i campi dal flusso di dati che si ritiene "causa" modifiche nel valore della variabile di destinazione. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
  • Tipo di modello: una casella a discesa con le opzioni di log, inversa e identità. Questa opzione determina la funzione di collegamento da utilizzare con la famiglia Gamma nella stima del modello lineare generalizzato.
  • Utilizzare i pesi di campionamento nella stima del modello? (Facoltativo)...: Selezionare la casella di controllo e quindi selezionare un campo peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.

Utilizzare la scheda Opzioni grafiche per impostare i controlli per l'output grafico.

  • Risoluzione grafico: Selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi), 2x (192 dpi) o 3x (288 dpi).
    • La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
    • Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.

Visualizzazione dell'output

  • O ancoraggio: è costituito da una tabella del modello serializzato con il relativo nome di modello.
  • R ancoraggio: è costituito dai frammenti di report generati dallo strumento Regressione gamma: un riepilogo statistico, un'analisi di tipo II della devianza (ANOD) e i grafici diagnostici di base. La tabella Analisi di tipo II di dissezione e i grafici di diagnostica di base non vengono prodotti quando l'input del modello proviene da uno strumento di input XDF o XDF.
Questa pagina è stata utile?

Si sono verificati problemi con il tuo prodotto Alteryx? Visita la community Alteryx o contatta il supporto. Non riesci a inviare questo modulo? Inviaci un'e-mail.