Stepwise Tool Icon

Strumento Stepwise

Versione:
2023.1
Last modified: September 25, 2020

Lo strumento Stepwise determina le variabili predittive migliori da includere in un modello da un insieme più ampio di variabili predittive potenziali per modelli di regressione lineari, logistici e di altro tipo tradizionali.

Esistono due approcci di base utilizzati nell'implementazione della regressione passo per passo. Il primo (noto come selezione all'indietro) prevede l'uso di un modello che include tutte le variabili che sono ritenute potenzialmente influenzare la variabile di destinazione, quindi rimuove in sequenza la variabile meno importante dal modello originale in base a una bontà di misura di adattamento che si adatta al numero di variabili incluse nel modello. Questo processo continua, con altre variabili che vengono rimosse nei passaggi successivi indietro, fino a quando non ci sono ulteriori miglioramenti nella misura di adattamento regolata. Il secondo approccio di base (noto come selezione di variabili in avanti) inizia con un modello che include solo una costante e quindi aggiunge a tale modello una variabile dal set di variabili potenziali che fornisce il massimo miglioramento nella misura di adattamento regolata. Questo processo viene ripetuto per aggiungere ulteriori variabili utilizzando una serie di ulteriori passaggi in avanti, che termina quando non vi è alcun ulteriore miglioramento nella misura di adattamento regolata. Nella selezione delle variabili a ritroso, una variabile rimossa non rientra mai nei passaggi successivi, mentre nella selezione in avanti una variabile non viene mai rimossa nei passaggi successivi dopo l'aggiunta. È possibile utilizzare un approccio ibrido che inizia con un modello iniziale di grandi dimensioni ("massimo") e un primo passo indietro, ma quindi i movimenti avanti e indietro vengono valutati in ogni passaggio successivo.

Lo strumento di regressione graduale basato su Alteryx R utilizza sia una selezione di variabili all'indietro che una selezione mista di variabili all'indietro e in avanti. Per utilizzare lo strumento, creare innanzitutto un modello di regressione "massimo" che include tutte le variabili che si ritiene possano essere importanti, quindi utilizzare lo strumento di regressione passo per determinare quali di queste variabili devono essere rimosse in base a una misura di adattamento regolata. All'utente è disponibile una scelta di due diverse misure di adattamento adattate, il criterio di informazione di Akaike (o AIC) e il criterio di informazione bayesiano Queste due misure sono simili tra loro, ma il BIC impone una penalità maggiore sul numero di variabili incluse nel modello, in genere risultando in un modello finale con meno variabili rispetto a quando viene utilizzato l'AIC.

Con questo strumento, se i dati di input provengono da un normale flusso di dati Alteryx, la funzione R open source applicabile viene utilizzata per la stima del modello. Se l'input proviene da uno strumento di output XDF o da uno strumento di input XDF, per la stima del modello viene utilizzata la funzione Revo ScaleR appropriata. Il vantaggio dell'utilizzo della funzione basata su Revo ScaleR è che consente di analizzare set di dati molto più grandi (memoria insufficiente), ma con l'impossibilità di creare parte dell'output di diagnostica del modello disponibile con le funzioni R open source.

Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Alteryx Downloads and Licenses per installare R e i pacchetti utilizzati dallo strumento R. Consultate Scaricare e utilizzare gli strumenti predittivi.

Collegare gli ingressi

  • Flusso di output da uno strumento Di regressione conteggio, regressione lineare o regressione logistica utilizzato per creare il modello "massimo". Il flusso può essere inserito in entrambi i lati dello strumento.
  • Lo stesso flusso di dati Alteryx o flusso di metadati XDF utilizzato per creare il modello "massimo". Il flusso può essere inserito in entrambi i lati dello strumento.

Configurazione dello strumento

Utilizzare la scheda Configurazione per impostare i controlli per il modello stepwise.

  • Il nome del nuovo modello: Questo è il modello migliore trovato utilizzando la selezione variabile stepwise in base alla direzione di ricerca e ai criteri di selezione scelto. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e il punto dei caratteri speciali (".") e il carattere di sottolineatura ("_"). Non sono consentiti altri caratteri speciali (ad esempio spazi) e R fa distinzione tra maiuscole e minuscole.
  • Direzione di ricerca: Se la direzione della ricerca prevede passaggi avanti e indietro (il metodo inizia con un passo indietro) o vengono utilizzati solo passaggi all'indietro.
  • Misura di adattamento regolata: I criteri utilizzati per confrontare diversi modelli e scelta il miglior modello. Le scelte previste sono il criterio di informazione Akaike (AIC) o il criterio di informazione bayesiana (BIC).

Utilizzare la scheda Opzioni grafiche per impostare i controlli per l'output grafico.

  • Risoluzione grafico: selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi). La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor. Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.

Visualizzare l'output

Collegare uno strumento Sfoglia a ogni ancoraggio di output per visualizzare i risultati.

  • O ancoraggio: è costituito da una tabella del modello serializzato con il nome del modello e le dimensioni dell'oggetto.
  • R ancoraggio: è costituito dai frammenti di report generati dallo strumento Stepwise: un riepilogo statistico, analisi di tipo II dei test di deviazione o ANOVA e grafici diagnostici di base. La tabella Analisi di tipo II di devianza o ANOVA e i grafici diagnostici di base non vengono prodotti quando l'input di dati proviene da un'utilità di input XDF o XDF.

-https://en.wikipedia.org/wiki/Stepwise_regression
-https://en.wikipedia.org/wiki/Akaike_information_criterion
https://en.wikipedia.org/wiki/Bayesian_information_criterion

Questa pagina è stata utile?

Si sono verificati problemi con il tuo prodotto Alteryx? Visita la community Alteryx o contatta il supporto. Non riesci a inviare questo modulo? Inviaci un'e-mail.