Riconoscimento dell'immagine
Utilizza lo strumento Riconoscimento dell'immagine per generare un modello di Machine Learning in grado di classificare le immagini per gruppo. Puoi utilizzare i tuoi dati e le tue etichette per addestrare un nuovo modello oppure puoi usare uno dei modelli pre-addestrati che forniamo.
Alteryx Intelligence Suite necessario
Questo strumento fa parte di Alteryx Intelligence Suite . Intelligence Suite richiede una licenza separata e un ulteriore programma di installazione per Designer. Dopo aver installato Designer, installa Intelligence Suite e avvia la versione di prova gratuita .
Componenti dello strumento
Lo strumento Riconoscimento immagine ha 5 ancoraggi (2 di input e 3 di output):
Ancoraggio di input T : usa questo ancoraggio per inserire i dati da utilizzare per l'addestramento.
Ancoraggio di input V : usa questo ancoraggio per inserire i dati da utilizzare per la convalida.
Ancoraggio di output M : usa questo ancoraggio per trasferire il modello creato a valle.
Ancoraggio di output E : usa questo ancoraggio di output E per visualizzare le metriche di valutazione del modello. Le metriche includono informazioni sulla precisione, sul richiamo e sull'accuratezza di ciascuna etichetta di classificazione.
Ancoraggio di output R : connetti l'ancoraggio di output R a uno strumento Sfoglia per visualizzare il report del modello. Il report include grafici di perdita e precisione dopo ogni epoch. Utilizza questi grafici per comprendere se lo strumento ha addestrato adeguatamente il modello.
Importante
Le immagini inoltrate in Riconoscimento dell'immagine devono avere il formato file BLOB.
Configura lo strumento
Per utilizzare questo strumento...
Trascina lo strumento nell'area di disegno.
Esegui la connessione ai dati a monte con le immagini che desideri addestrare il modello a riconoscere. La dimensione massima dell'immagine è di 512 x 512 pixel.
Inserisci le Immagini per l'addestramento specificando il Campo immagine e le Etichette immagine .
Inserisci le Immagini per la convalida specificando il Campo immagine e le Etichette immagine .
Esegui il flusso di lavoro.
Opzioni
Una epoch è un singolo passaggio (in avanti e all'indietro) di tutti i dati in un set di addestramento attraverso una rete neurale. Le epoch sono correlate alle iterazioni, ma non sono la stessa cosa. Un'iterazione è un passaggio singolo di tutti i dati in un batch di un set di addestramento.
L'aumento del numero delle epoch consente al modello di apprendere dal set di addestramento per un periodo più lungo. Tuttavia, questa operazione aumenta anche le spese di calcolo.
Si può aumentare il numero di epoch per ridurre gli errori nel modello. Tuttavia, a un certo punto, il livello di riduzione degli errori potrebbe non valere la spesa di calcolo aggiuntiva. Inoltre, l'aumento eccessivo del numero di epoch può causare problemi di overfitting, mentre un uso insufficiente di epoch può causare problemi di underfitting.
I modelli pre-addestrati sono modelli che contengono metodi di estrazione delle funzionalità con parametri già definiti. I modelli con più parametri tendono a essere più accurati, ma risultano più lenti e più costosi a livello computazionale. Al contrario, i modelli con un numero inferiore di parametri tendono a essere meno accurati, ma sono più veloci ed economici a livello computazionale.
Ecco alcune spiegazioni semplificate dei modelli pre-addestrati presenti all'interno dello strumento. Ricorda che le prestazioni di questi modelli dipendono molto dai dati, quindi i riepiloghi non saranno sempre veri.
Il modello VGG16 è il più accurato, il più lento e il più costoso a livello computazionale. Dimensione minima dell'immagine: 32 x 32 pixel.
Il modello InceptionResNetV2 riesce a equilibrare accuratezza, velocità e costi computazionali, con una propensione verso l'accuratezza. Dimensione minima dell'immagine: 75 x 75 pixel.
Il modello Resnet50V2 riesce a equilibrare accuratezza, velocità e costi computazionali, con una propensione verso la velocità e la riduzione dei costi computazionali. Dimensione minima dell'immagine: 32 x 32 pixel.
Il modello InceptionV3 presenta un grado di accuratezza minore tra tutti (è tuttavia abbastanza accurato), è il modello più veloce e quello dai costi computazionali minori. Dimensione minima dell'immagine: 75 x 75 pixel.
Tutti questi modelli sono stati addestrati sulla base di un set di dati contenente oltre 14 milioni di immagini con più di 20.000 etichette.
Scegliendo un modello pre-addestrato, eviterai di addestrare un'intera rete neurale utilizzando le immagini a tua disposizione. Quando si sceglie di utilizzare un modello pre-addestrato, di fatto si presume che i propri parametri di input corrispondano a quelli che ci si aspetterebbe di trovare in un modello pre-addestrato. Non è quindi necessario ricostruire un modello che si comporti allo stesso modo di un modello pre-addestrato e che potrebbe avere persino prestazioni peggiori. Dal momento che molte delle funzionalità ricavate dalle immagini sono simili a quelle utilizzate dai modelli durante l'addestramento, puoi presumere con certezza che un modello pre-addestrato funzionerà con il tuo input.
Utilizza un modello pre-addestrato quando disponi di immagini con funzionalità che corrispondono a quelle dei modelli pre-addestrati e quando vuoi evitare di addestrare il tuo modello.
Un batch è un sottoinsieme dell'intero set di dati di addestramento.
La riduzione delle dimensioni del batch consente di distribuire la quantità di dati che passano attraverso una rete neurale in un determinato momento. Questa procedura consente di addestrare i modelli senza occupare lo spazio di memoria che occorrerebbe se tutti i dati passassero attraverso la rete neurale contemporaneamente. A volte l'elaborazione in batch può accelerare l'addestramento, ma suddividere i dati in batch può anche aumentare gli errori nel modello.
Separa i dati in batch quando la macchina non è in grado di elaborare tutti i dati contemporaneamente o se desideri ridurre i tempi di addestramento.