Strumento Rete neurale

Esempio di uno strumento

Lo strumento Rete neurale presenta l'opzione Esempio di uno strumento. Consulta Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.

Lo strumento Rete neurale crea un modello di rete neurale di tipo percettrone feed-forward con un singolo livello nascosto. I neuroni del livello nascosto utilizzano una funzione di attivazione logistica (anche nota come sigmoidea) e la funzione di attivazione dell'output dipende dalla natura del campo target. In particolare, per i problemi di classificazione binaria (come la probabilità che un cliente acquisti o non acquisti), la funzione di attivazione dell'output utilizzata è logistica; per i problemi di classificazione multinomiale (come la probabilità che un cliente scelga l'opzione A, B o C), la funzione di attivazione dell'output utilizzata è softmax; per i problemi di regressione (dove il target è un campo numerico continuo) per l'output viene utilizzata una funzione di attivazione lineare.

Le reti neurali rappresentano il primo algoritmo di Machine Learning per la modellazione predittiva (al contrario dei tradizionali approcci statistici). Questo metodo intende imitare la struttura dei neuroni del cervello (da cui il nome). La struttura di base di una rete neurale coinvolge un insieme di input (campi predittivi) che si alimentano in uno o più livelli "nascosti", con ogni livello che presenta uno o più "nodi" (anche noti come "neuroni").

Nel primo livello nascosto, gli input sono combinati in modo lineare (con un peso assegnato a ogni input in ciascun nodo) e viene applicata una "funzione di attivazione" alla combinazione lineare ponderata dei predittori. Nel secondo e nei successivi livelli nascosti, l'output dei nodi del livello nascosto precedente viene combinato in modo lineare in ciascun nodo del livello nascosto (sempre con i pesi assegnati a ciascun nodo del precedente livello nascosto) e una funzione di attivazione viene applicata alla combinazione lineare ponderata. Infine, i risultati dei nodi del livello nascosto finale vengono combinati in un livello di output finale che utilizza una funzione di attivazione coerente con il tipo di target.

La stima (o "apprendimento" nel vocabolario della letteratura sulla rete neurale) implica la ricerca del set di pesi per ogni input o dei valori dei nodi del livello precedente che minimizzano la funzione oggettiva del modello. Nel caso di un campo numerico continuo, ciò significa ridurre al minimo la somma degli errori quadrici della previsione del modello finale rispetto ai valori effettivi, mentre le reti di classificazione tentano di ridurre al minimo una misura di entropia sia per problemi di classificazione binaria che per quelli di classificazione multinomiale. Come indicato sopra, lo strumento Rete neurale (che si basa sul pacchetto R nnet), consente solo un singolo livello nascosto (che può avere un numero arbitrario di nodi) e utilizza sempre una funzione di trasferimento logistico nei nodi del livello nascosto. Nonostante queste limitazioni, la nostra ricerca indica che il pacchetto nnet è il pacchetto di rete neurale più robusto attualmente disponibile nello strumento R.

Sebbene i metodi di apprendimento statistico più moderni (come i modelli prodotti dagli strumenti Modello potenziato, Modello Spline e Modello a foresta) solitamente forniscano una maggiore efficacia predittiva rispetto ai modelli di rete neurale, in alcune applicazioni specifiche (che non possono essere determinate prima del fatto), i modelli di rete neurale superano gli altri metodi sia per i modelli di classificazione che di regressione. Inoltre, in alcuni settori, come nella valutazione del rischio finanziario, i modelli di rete neurale sono considerati un metodo "standard" ampiamente accettato. Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica Strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.

Configurazione dello strumento

Parametri richiesti

Nome modello: è necessario assegnare un nome a ogni modello per poterlo identificare in futuro. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e trattino basso ("_"). Non sono consentiti altri caratteri speciali e lo strumento R fa distinzione tra maiuscole e minuscole.
Seleziona il campo target: seleziona il campo dal flusso di dati da stimare. Questo target deve essere un tipo di stringa.
Seleziona i campi predittivi: scegli i campi dal flusso di dati che potrebbero causare variazioni nel valore della variabile target. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non dovrebbero essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
Utilizza pesi di campionamento per la stima del modello (facoltativo): seleziona la casella di spunta e scegli un campo del peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.
Il numero di nodi nel livello nascosto: il numero di nodi (neuroni) nel singolo livello nascosto del modello. Il valore predefinito è dieci.
Includere grafici degli effetti?: se selezionato, verranno prodotti i grafici degli effetti che mostrano la relazione tra la variabile predittiva e il target, calcolando la media sull'effetto di altri campi predittivi. Il numero di grafici da produrre è controllato dall'elemento "Livello minimo di importanza di un campo da includere nei grafici" indicante la percentuale della potenza predittiva totale che un determinato campo fornisce al modello affinché si produca un effetto marginale per quel campo. Maggiore è il valore di questa selezione, minore sarà il numero di grafici degli effetti marginali prodotti.

Personalizzazione modello

Scala/normalizzazione personalizzata...: i metodi numerici che incidono sull'ottimizzazione dei pesi del modello possono essere problematici se gli input (campi predittivi) sono su scale diverse (ad esempio, un reddito che varia da 7.000 a 1 milione, combinato con il numero di membri di una famiglia che varia da uno a sette).
Nessuno: predefinito.
Z-score: tutti i campi predittivi sono scalati in modo da avere una media di 0 e una deviazione standard pari a 1.
Intervallo unità: tutti i campi predittivi sono scalati in modo che abbiano un valore minimo pari a 0 e un valore massimo pari a 1, con tutti gli altri valori compresi tra 0 e 1.
Centrato su zero: tutti i campi predittivi sono scalati in modo da avere un valore minimo negativo e un valore massimo pari a 1, con tutti gli altri valori compresi tra negativo e positivo.
Regolarizzazione: la regolarizzazione limita il movimento nei nuovi valori di peso ad ogni iterazione (chiamata anche "epoch") del processo di stima. Il valore della regolarizzazione deve essere compreso tra 0 e 1; i valori più grandi determinano una maggiore restrizione dei possibili movimenti dei pesi. In generale, un valore di regolarizzazione compreso tra 0,01 e 0,2 spesso funziona bene.
Intervallo +/- dei pesi iniziali (casuali) intorno a zero: i pesi assegnati alle variabili di input in ogni nodo nascosto sono inizializzati utilizzando numeri casuali. Questa opzione consente all'utente di impostare l'intervallo di numeri casuali utilizzati. Generalmente, i valori devono essere vicini a 0,5. Tuttavia, i valori più piccoli possono essere migliori se tutte le variabili di input sono di grandi dimensioni. Un valore pari a 0 è in realtà un valore speciale che fa sì che lo strumento trovi un buon valore comprensivo per i dati di input.
Numero massimo di pesi consentiti nel modello: questa opzione diventa rilevante quando nel livello nascosto è presente un gran numero di campi predittivi e nodi. Riducendo il numero di pesi, si accelera la stima del modello e si riduce anche la possibilità che l'algoritmo trovi una condizione ottimale locale (rispetto a una ottimale globale) per i pesi. I pesi esclusi dal modello sono implicitamente impostati su 0.
Numero massimo di iterazioni per la stima del modello: questo valore controlla il numero di tentativi che l'algoritmo può effettuare per trovare miglioramenti nel set di pesi del modello rispetto al set precedente. Quando nei pesi non si riscontrano miglioramenti precedenti al numero massimo di iterazioni, l'algoritmo si interrompe e restituisce il miglior set di pesi. Per impostazione predefinita, questa opzione è impostata su 100 iterazioni. In generale, dato il comportamento dell'algoritmo, è probabile che abbia senso aumentare questo valore, se necessario, a costo di allungare il tempo di esecuzione della creazione del modello.

Opzioni Grafica

Dimensioni del grafico: seleziona pollici o centimetri per le dimensioni del grafico.
Risoluzione grafico: seleziona la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi) o 3x (288 dpi).
- La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
- Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
Dimensione carattere di base (punti): seleziona la dimensione del carattere nel grafico.

Visualizzazione dell'output

Ancoraggio O: oggetto. Consiste in una tabella del modello serializzato con il nome del modello.
Ancoraggio R: report. È costituito dai frammenti di report generati dallo strumento Rete neurale: un riepilogo di base del modello e i grafici degli effetti principali per ogni classe della variabile target.

_{https://en.wikipedia.org/wiki/Artificial_neural_network}