Skip to main content

Neural Network Tool Icon Strumento Rete neurale

Esempio di uno strumento

ID Record dispone dell'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.

Lo strumento Rete neurale crea un modello di rete neurale di tipo percettrone feedforward con un singolo strato nascosto. I neuroni nello strato nascosto utilizzano una funzione di attivazione sigmoidea e la funzione di attivazione di output dipende dalla natura del campo target. In particolare, per i problemi di classificazione binaria (ad esempio, la probabilità che un cliente acquisti o non acquisti), la funzione di attivazione dell'output utilizzata è logistica, per i problemi di classificazione multinomiale (ad esempio, la probabilità che un cliente scelga l'opzione A, B, oppure C) la funzione di attivazione dell'uscita utilizzata è softmax, per problemi di regressione (dove il target è un campo numerico continuo) viene utilizzata una funzione di attivazione lineare per l'uscita.

Le reti neurali rappresentano il primo algoritmo Machine Learning (al contrario degli approcci statistici tradizionali) per la modellazione predittiva. La motivazione dietro il metodo è imitare la struttura dei neuroni nel cervello (da qui il nome del metodo). La struttura di base di una rete neurale coinvolge un insieme di input (campi predittivi) che si alimentano in uno o più livelli "nascosti", con ogni livello nascosto che ha uno o più "nodi" (noti anche come "neuroni").

Nel primo livello nascosto, gli input sono combinati linearmente (con un peso assegnato a ciascun input in ogni nodo) e una "funzione di attivazione" viene applicata alla combinazione lineare ponderata dei predittori. Nel secondo e nei successivi livelli nascosti, l'output dai nodi del precedente livello nascosto viene combinato linearmente in ogni nodo del livello nascosto (sempre con pesi assegnati a ciascun nodo dal precedente livello nascosto) e viene applicata una funzione di attivazione alla combinazione lineare ponderata. Infine, i risultati dei nodi del livello finale nascosto sono combinati in un livello finale di output che utilizza una funzione di attivazione coerente con il tipo di destinazione.

La stima (o "apprendimento" nel vocabolario della letteratura della rete neurale) implica la ricerca dell'insieme di pesi per ogni input o per i valori dei nodi di livello precedenti che minimizzano la funzione oggettiva del modello. Nel caso di un campo numerico continuo ciò significa ridurre al minimo la somma degli errori quadrati della previsione del modello finale rispetto ai valori effettivi, mentre le reti di classificazione tentano di minimizzare una misura di entropia per problemi di classificazione sia binari che multinomiali. Come indicato sopra, il Strumento Rete neurale (che si basa sul pacchetto R nnet), consente solo un singolo livello nascosto (che può avere un numero arbitrario di nodi), e utilizza sempre una funzione di trasferimento logistico nei nodi di livello nascosti. Nonostante queste limitazioni, la nostra ricerca indica che il pacchetto nnet è il pacchetto di rete neurale più robusto attualmente disponibile in R.

Mentre metodi di apprendimento statistico più moderni (come i modelli prodotti da Boosted, Forest, e gli strumenti Spline Model) forniscono in genere una maggiore efficacia predittiva rispetto ai modelli di rete neurali, in alcune applicazioni specifiche (che non possono essere determinate prima del fatto), i modelli di rete neurale superano altri metodi sia per i modelli di classificazione che per quelli di regressione. Inoltre, in alcune aree, come nella valutazione del rischio finanziario, i modelli di rete neurali sono considerati un metodo "standard" ampiamente accettato. Questo strumento utilizza lo strumento R. Vai a OpzioniScarica Strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.

Configura lo strumento

  • Nome modello: è necessario assegnare un nome a ogni modello per poterlo identificare in futuro. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e trattino basso ("_"). Non sono consentiti altri caratteri speciali e la R fa distinzione tra maiuscole e minuscole.

  • Seleziona la variabile target: seleziona il campo dal flusso di dati da stimare. Questo target deve essere un tipo di stringa.

  • Seleziona le variabili predittive: scegli i campi dal flusso di dati che ritieni "essere la causa" delle variazioni nel valore della variabile target. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.

  • Usa pesi di campionamento per la valutazione del modello: fai clic sulla casella di controllo, quindi seleziona un campo del peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.

  • Il numero di nodi nel livello nascosto: il numero di nodi (neuroni) nel singolo livello nascosto del modello. Il valore predefinito è dieci.

  • Includere grafici ad effetti marginali?: opzione per includere grafici nel report che mostrano la relazione tra la variabile predittiva e la destinazione, calcolando la media sull'effetto di altri campi predittivi. Il numero di parcelle da produrre è controllato dal "livello minimo di importanza di un campo da includere nelle parcelle", che indica la percentuale della potenza predittiva totale del modello un particolare campo deve contribuire al modello per avere un grafico di effetto marginale prodotto per quel campo. Maggiore è il valore di questa selezione, minore è il numero di grafici di effetti marginali prodotti.

  • Scala/normalizzazione personalizzata...: i metodi numerici alla base dell'ottimizzazione dei pesi del modello possono essere problematici se gli input (campi predittivi) sono su scale diverse (ad esempio, il reddito che varia da settemila a un milione combinato con il numero di componenti presenti nella famiglia che varia da uno a sette).

  • Nessuno (predefinito)

  • Z-score: tutti i campi predittivi sono scalati in modo che abbiano una media di zero e una deviazione standard di uno.

  • Intervallo unitario: Tutti i campi predittivi sono scalati in modo da avere un valore minimo pari a zero e un valore massimo pari a uno, mentre tutti gli altri valori sono compresi tra zero e uno.

  • Centrato su zero: Tutti i campi predittivi sono scalati in modo da avere un valore minimo di uno negativo e un valore massimo di uno, con tutti gli altri valori compresi tra uno negativo e uno positivo).

  • Il decadimento del peso: il peso del decadimento limita il movimento nei nuovi valori di peso ad ogni iterazione (chiamata anche "epoca") del processo di stima. Il valore del peso di decadimento deve essere compreso tra zero e uno, valori maggiori limitano maggiormente i possibili movimenti dei pesi. In generale, un valore di decadimento del peso compreso tra 0,01 e 0,2 spesso funziona bene.

  • L' intervallo +/- dei pesi iniziali (casuali) intorno allo zero: i pesi dati alle variabili di input in ogni nodo nascosto sono inizializzati usando numeri casuali. Questa opzione consente all'utente di impostare l'intervallo dei numeri casuali utilizzati. Generalmente, i valori devono essere vicini a 0,5. Tuttavia, i valori più piccoli possono essere migliori se tutte le variabili di input sono di grandi dimensioni. Un valore pari a 0 è in realtà un valore speciale che fa sì che l'attrezzo trovi un buon valore comprende dati di input.

  • Il numero massimo di pesi consentiti nel modello: questa opzione diventa rilevante quando ci sono un gran numero di campi predittivi e nodi nel livello nascosto. Riducendo il numero di pesi si accelera la stima del modello e si riduce anche la possibilità che l'algoritmo trovi un ottimale locale (rispetto a un ottimale globale) per i pesi. I pesi esclusi dal modello sono implicitamente impostati su zero.

  • Il numero massimo di iterazioni per la stima del modello: questo valore controlla il numero di tentativi che l'algoritmo può compiere nel tentativo di trovare miglioramenti nell'insieme dei pesi del modello rispetto all'insieme precedente di pesi. Se non si riscontrano miglioramenti nei pesi prima del numero massimo di iterazioni, l'algoritmo terminerà e restituirà la migliore serie di pesi. Questa opzione è impostata per default su 100 iterazioni. In generale, dato il comportamento dell'algoritmo, è probabile che abbia senso aumentare questo valore se necessario, al costo di allungare il runtime per la creazione del modello.

  • Dimensioni del grafico: seleziona pollici o centimetri per le dimensioni del grafico.

  • Risoluzione grafico: seleziona la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi) o 3x (288 dpi).

    • La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.

    • Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.

  • Dimensione carattere di base (punti): seleziona la dimensione del carattere nel grafico.

Visualizzazione dell'output

  • Ancoraggio O: oggetto. Consiste in una tabella del modello serializzato con il nome del modello.

  • Ancoraggio R: report. È costituito dai frammenti di report generati dallo strumento Classificatore Naive Bayes: un riepilogo di base del modello e i grafici degli effetti principali per ogni classe della variabile target.

https://en.wikipedia.org/wiki/Confusion_matrix