Bilderkennung
Verwenden Sie das Bilderkennung-Tool, um ein Machine Learning-Modell zu erstellen, das Bilder nach Gruppen klassifizieren kann. Sie können Ihre eigenen Daten und Beschriftungen verwenden, um ein neues Modell zu trainieren, oder Sie können eines der von uns zur Verfügung gestellten vortrainierten Modelle verwenden.
Alteryx Intelligence Suite - Überblick
Dieses Tool ist Teil der Alteryx Intelligence Suite . Alteryx Intelligence Suite erfordert eine separate Lizenz und ein Add-on-Installationsprogramm für Designer. Nachdem Sie Designer installiert haben, installieren Sie Intelligence Suite und starten Sie Ihre kostenlose Testversion .
Tool-Komponenten
Das Bilderkennung-Tool verfügt über fünf Anker (zwei Eingabe- und drei Ausgabeanker):
T -Eingabeanker: Verwenden Sie den T -Eingabeanker, um die Daten einzugeben, die Sie für das Training verwenden möchten.
V -Eingabeanker: Verwenden Sie den V -Eingabeanker, um die Daten einzugeben, die Sie für die Validierung verwenden möchten.
M -Ausgabeanker: Verwenden Sie den M -Ausgabeanker, um das Modell, das Sie erstellt haben, nachgeschaltet zu übergeben.
E -Ausgabeanker: Verwenden Sie den E -Ausgabeanker, um die Metriken der Modellauswertung anzuzeigen. Zu den Metriken gehören Informationen zu Präzision, Recall-Wert und Genauigkeit der einzelnen Label für die Klassifizierung.
R -Ausgabeanker: Verbinden Sie den R -Ausgabeanker mit einem Durchsuchen-Tool , um den Modellbericht anzuzeigen. Der Bericht umfasst Genauigkeits- und Verlustdiagramme für jede Epoche. Verwenden Sie diese Diagramme, um zu sehen, ob das Tool das Modell ausreichend trainiert hat.
Wichtig
Die Bilder, die Sie an das Bilderkennung-Tool weiterleiten, müssen im BLOB-Dateiformat sein.
Tool-Konfiguration
So verwenden Sie dieses Tool:
Ziehen Sie das Tool auf den Canvas.
Stellen Sie eine Verbindung zu vorgeschalteten Daten mit Bildern her, die Ihr Modell erkennen soll. Beachten Sie, dass die maximale Bildgröße 512 x 512 Pixel beträgt.
Geben Sie Ihre Trainingsbilder ein, indem Sie das Bildfeld und die Bildbeschriftungen angeben.
Geben Sie Ihre Validierungsbilder ein, indem Sie das Bildfeld und die Bildbeschriftungen angeben.
Klicken Sie auf Ausführen , um den Workflow auszuführen.
Optionen
Eine Epoche ist ein einzelner Durchlauf (vorwärts und rückwärts) aller Daten in einem Trainingsset durch ein neuronales Netzwerk. Epochen sind verwandt mit Iterationen, aber nicht identisch. Eine Iteration ist ein einzelner Durchlauf aller Daten in einem Batch eines Trainingssets.
Durch Erhöhen der Epochenanzahl kann das Modell über einen längeren Zeitraum aus dem Trainingsset lernen. Dies erhöht jedoch auch den Rechenaufwand.
Sie können die Anzahl der Epochen erhöhen, um Fehler im Modell zu reduzieren. Aber gelegentlich könnte die Fehlerreduzierung den zusätzlichen Rechenaufwand nicht wert sein. Auch kann eine zu hohe Epochenanzahl zu Problemen der Überanpassung führen, wogegen eine zu geringe Epochenanzahl zu Problemen der Unteranpassung führen kann.
Vortrainierte Modelle enthalten bereits definierte Parameter und Methoden zur Extraktion von Eigenschaften. Modelle mit mehr Parametern sind in der Regel genauer, aber auch langsamer und rechenintensiver. Das Gegenteil gilt für Modelle mit weniger Parametern. Sie sind in der Regel weniger genau, dafür aber schneller und weniger rechenintensiv.
Hier finden Sie vereinfachte Erläuterungen zu den vortrainierten Modellen, die im Tool enthalten sind. Beachten Sie, dass die Leistung dieser Modelle stark von Ihren Daten abhängt, was bedeutet, dass die Zusammenfassungen nicht immer zutreffend sein werden.
VGG16 ist in der Regel die präziseste, aber langsamste und rechenintensivste Methode. Minimale Bildgröße: 32 x 32 Pixel.
InceptionResNetV2 tendiert dazu, Genauigkeit, Geschwindigkeit und Rechenaufwand in Einklang zu bringen, mit einem gewissen Schwerpunkt auf Genauigkeit. Minimale Bildgröße: 75 x 75 Pixel.
Resnet50V2 neigt dazu, Genauigkeit, Geschwindigkeit und Rechenaufwand auszubalancieren, mit einer gewissen Tendenz zu Geschwindigkeit und weniger Rechenaufwand. Minimale Bildgröße: 32 x 32 Pixel.
InceptionV3 ist in der Regel am ungenauesten (aber immer noch recht genau), am schnellsten und am wenigsten rechenintensiv. Minimale Bildgröße: 75 x 75 Pixel.
Jedes dieser Modelle wurde mit einem Dataset trainiert, das mehr als 14 Millionen Bilder mit mehr als 20.000 Beschriftungen enthielt.
Wenn Sie ein vorab trainiertes Modell wählen, können Sie das Training eines gesamten neuronalen Netzwerks mit Ihren eigenen Bildern überspringen. Wenn Sie sich für die Verwendung eines vorab trainierten Modells entscheiden, gehen Sie praktisch davon aus, dass Ihre Eingabeparameter mit den Erwartungen des vorab trainierten Modells übereinstimmen, sodass Sie kein Modell neu erstellen müssen, das ungefähr das Gleiche tut wie das vorab trainierte Modell eins (und könnte sogar schlechter abschneiden). Da viele der Funktionen aus Bildern in der Regel mit denen übereinstimmen, die die Modelle während des Trainings verwendet haben, können Sie oft davon ausgehen, dass ein vorab trainiertes Modell mit Ihren Eingaben funktioniert.
Verwenden Sie ein vortrainiertes Modell, wenn Sie Bilder mit Eigenschaften haben, die den Erwartungen des vortrainierten Modells entsprechen, und und Sie nicht Ihr eigenes Modell trainieren möchten.
Ein Batch ist eine Teilmenge des gesamten Trainings-Datasets.
Durch Verringern der Batchgröße können Sie jederzeit die Datenmenge staffeln, die durch ein neuronales Netzwerk läuft. Auf diese Weise können Sie Modelle trainieren, ohne so viel Arbeitsspeicher zu beanspruchen, als dies bei der gleichzeitigen Verarbeitung aller Daten in einem neuronalen Netz der Fall wäre. Batchverarbeitung kann manchmal das Training beschleunigen. Die Aufteilung Ihrer Daten in Batches kann jedoch auch zu mehr Fehlern im Modell führen.
Teilen Sie Ihre Daten in Batches auf, wenn Ihr Rechner nicht alle Daten auf einmal verarbeiten kann oder wenn Sie die Trainingszeit reduzieren möchten.