
Strumento Di Rete Neurale
Lo strumento Rete neurale crea un modello di rete neurale perceptron feedforward con un singolo livello nascosto. I neuroni nel livello nascosto utilizzano una funzione di attivazione logistica (nota anche come sigmoide) e la funzione di attivazione dell'output dipende dalla natura del campo di destinazione. In particolare, per i problemi di classificazione binaria (ad esempio, la probabilità che un cliente acquista o non acquista), la funzione di attivazione dell'output utilizzata è logistica, per problemi di classificazione multinomiale (ad esempio, la probabilità che un cliente scelga l'opzione A, B o C) funzione di attivazione dell'output utilizzata è softmax, per i problemi di regressione (dove la destinazione è un campo numerico continuo) viene utilizzata una funzione di attivazione lineare per l'output.
Le reti neurali rappresentano il primo algoritmo di apprendimento automatico (in contrapposizione agli approcci statistici tradizionali) per la modellazione predittiva. La motivazione alla base del metodo è imitando la struttura dei neuroni nel cervello (da qui il nome del metodo). La struttura di base di una rete neurale comporta un insieme di input (campi predittivi) che alimentano uno o più livelli "nascosti", con ogni livello nascosto con uno o più "nodi" (noti anche come "neuroni").
Nel primo livello nascosto, gli ingressi sono linearmente combinati (con un peso assegnato a ogni ingresso in ogni nodo) e una "funzione di attivazione" viene applicata alla combinazione lineare ponderata dei predittori. Nel secondo e nei successivi livelli nascosti, l'output dei nodi del livello nascosto precedente viene combinato linearmente in ogni nodo del livello nascosto (di nuovo con i pesi assegnati a ciascun nodo dal livello nascosto precedente) e viene applicata una funzione di attivazione combinazione lineare ponderata. Infine, i risultati dei nodi del livello nascosto finale vengono combinati in un livello di output finale che utilizza una funzione di attivazione coerente con il tipo di destinazione.
La stima (o "apprendimento" nel vocabolario della letteratura della rete neurale) comporta la ricerca del set di pesi per ogni input o valori di nodo di livello precedente che riducono al minimo la funzione oggettiva del modello. Nel caso di un campo numerico continuo ciò significa ridurre al minimo la somma degli errori al quadrato della previsione del modello finale rispetto ai valori effettivi, mentre le reti di classificazione tentano di ridurre al minimo una misura di entropia sia per binario che per quello multinomiale problemi di classificazione. Come indicato in precedenza, lo strumento Rete neurale (che si basa sul pacchetto R nnet), consente solo un singolo livello nascosto (che può avere un numero arbitrario di nodi) e utilizza sempre una funzione di trasferimento logistico nei nodi di livello nascosto. Nonostante queste limitazioni, la nostra ricerca indica che il pacchetto di nnet è il pacchetto di rete neurale più robusto disponibile in R in questo momento.
Mentre i metodi di apprendimento statistico più moderni (come i modelli prodotti dagli strumenti Boosted, Forest, e Spline Model) in genere forniscono una maggiore efficacia predittiva rispetto ai modelli di rete neurale, in alcune applicazioni specifiche (che non possono essere determinate prima del fatto), i modelli di rete neurale superano altri metodi sia per i modelli di classificazione che per quelli di regressione. Inoltre, in alcune aree, come nella valutazione del rischio finanziario, i modelli di rete neurale sono considerati un metodo "standard" ampiamente accettato. Questo strumento utilizza lo strumento R.This tool uses the R tool. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Alteryx Downloads and Licenses per installare R e i pacchetti utilizzati dallo strumento R. Vedere Scaricare e utilizzare gli strumenti predittivi.
Configurazione dello strumento
- Nome modello: Ogni modello deve essere assegnato un nome in modo che possa essere identificato in un secondo momento. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e il carattere di sottolineatura ("_"). Non sono consentiti altri caratteri speciali e R fa distinzione tra maiuscole e minuscole.
- Selezionare la variabile di destinazione: Selezionare il campo dal flusso di dati che si desidera stimare. Questa destinazione deve essere di tipo stringa.
- Selezionare le variabili predittivo: Scegliere i campi dal flusso di dati che si ritiene "causa" modifiche nel valore della variabile di destinazione.
Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime. - Utilizzare i pesi di campionamento nella stima del modello (facoltativo): Fare clic sulla casella di controllo e quindi selezionare un campo peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.
- Il numero di nodi nel livello nascosto: Il numero di nodi (neuroni) nel singolo livello nascosto del modello. Il valore predefinito è dieci.
- Includi grafici effetti: Se selezionata, verranno prodotti grafici degli effetti che mostrano graficamente la relazione tra la variabile predittiva e la destinazione, con una media sull'effetto di altri campi predittivo. Il numero di trame da produrre è controllato da "Il livello minimo di importanza di un campo da includere nei grafici", che indica la percentuale della potenza predittiva totale del modello che un particolare campo deve contribuire al modello per avere un ef marginale trama infetto prodotto per quel campo. Maggiore è il valore di questa selezione riduce il numero di grafici di effetti marginali prodotti.
- Ridimensionamento/normalizzazione personalizzati...: I metodi numerici alla base dell'ottimizzazione dei pesi del modello possono essere problematici se gli input (campi predittori) sono su scale diverse (ad esempio, reddito che varia da settemila a un milione combinato con il numero di membri presenti nella famiglia che varia da uno a sette).
- Nessuno: Predefinito.
- Punteggio z: Tutti i campi predittori vengono ridimensionati in modo da avere una media pari a zero e una deviazione standard di uno.
- Intervallo unità: Tutti i campi predittori vengono ridimensionati in modo da avere un valore minimo pari a zero e un valore massimo pari a uno, con tutti gli altri valori compresi tra zero e uno.
- Centrato zero: Tutti i campi predittori vengono ridimensionati in modo da avere un valore minimo negativo uno e un valore massimo di uno, con tutti gli altri valori compresi tra uno negativo e uno positivo).
- Il decadimento del peso: Il peso del decadimento limita il movimento nei nuovi valori di peso a ogni iterazione (chiamata anche "epoch") del processo di stima. Il valore del peso del decadimento deve essere compreso tra zero e uno, valori più grandi pongano una maggiore restrizione dei possibili movimenti dei pesi. In generale, un valore di decadimento del peso compreso tra 0,01 e 0,2 spesso funziona bene.
- L'intervallo di valori iniziali (casuali) intorno allo zero: I pesi assegnati alle variabili di input in ogni nodo nascosto vengono inizializzati utilizzando numeri casuali. Questa opzione consente all'utente di impostare l'intervallo dei numeri casuali utilizzati. In genere, i valori devono essere vicini a 0,5. Tuttavia, i valori più piccoli possono essere migliori se tutte le variabili di input sono di grandi dimensioni. Un valore pari a 0 è in realtà un valore speciale che fa sì che lo strumento trovi un buon valore di raccolta dati i dati di input.
- Il numero massimo di pesi consentiti nel modello: Questa opzione diventa rilevante quando nel livello nascosto è presente un numero elevato di campi e nodi predittivo. La riduzione del numero di pesi accelera la stima del modello e riduce anche la possibilità che l'algoritmo trovi un'opzione ottimale locale (al contrario di un'opzione ottimale globale) per i pesi. I pesi esclusi dal modello vengono implicitamente impostati su zero.
- Numero massimo di iterazioni per la stima del modello: Questo valore controlla il numero di tentativi che l'algoritmo può effettuare nel tentativo di trovare miglioramenti nel set di pesi del modello rispetto al set di pesi precedente. Se non vengono rilevati miglioramenti nei pesi precedenti al numero massimo di iterazioni, l'algoritmo terminerà e restituirà il set di pesi migliore. Il valore predefinito di questa opzione è 100 iterazioni. In generale, dato il comportamento dell'algoritmo, è probabile che abbia senso aumentare questo valore se necessario, al costo dell'allungamento del runtime per la creazione del modello.
- Dimensioni del grafico: Selezionare pollici o centimetri per le dimensioni del grafico.
- Risoluzione grafico: selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi). La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor. Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
- Dimensione carattere di base (punti): Selezionare la dimensione del carattere nel grafico.
Visualizzare l'output
- O ancoraggio: Oggetto. È costituito da una tabella del modello serializzato con il relativo nome del modello.
- R ancoraggio: Report. È costituito dai frammenti di report generati dallo strumento Rete neurale: un riepilogo del modello di base, nonché grafici degli effetti principali per ogni classe della variabile di destinazione.