Skip to main content

Icon for the Image Recognition Tool Reconnaissance d'image

Utilisez l'outil Reconnaissance d'image pour créer un modèle de machine learning capable de classer les images par groupe. Vous pouvez utiliser vos propres données et étiquettes pour entraîner un nouveau modèle, ou utiliser l'un des modèles pré-entraînés que nous fournissons.

Alteryx Intelligence Suite requis

Cet outil fait partie de Alteryx Intelligence Suite . Intelligence Suite nécessite une licence séparée et un programme d'installation complémentaire pour Designer. Après avoir installé Designer, installez Intelligence Suite et commencez votre essai gratuit .

Composants de l'outil

L'outil Reconnaissance d'image dispose de 5 ancrages (2 entrées et 3 sortie) :

  • Ancrage d'entrée T  : utilisez l'ancrage d'entrée T pour insérer les données que vous souhaitez utiliser pour l'entraînement.

  • Ancrage d'entrée V  : utilisez l'ancrage d'entrée V pour insérer les données que vous souhaitez utiliser pour la validation.

  • Ancrage de sortie  M  : utilisez l'ancrage de sortie  M pour passer le modèle que vous avez conçu en aval.

  • Ancrage de sortie E  : utilisez l'ancrage de sortie  E pour afficher les mesures d'évaluation du modèle. Les mesures comprennent des renseignements sur la précision, le rappel et l'exactitude de chaque étiquette de classification.

  • Ancrage de sortie R  : connectez l'ancrage de sortie R à un outil Explorateur pour afficher le rapport du modèle. Le rapport comprend des tracés de précision et de perte après chaque époque. Utilisez ces tracés pour visualiser si l'outil a suffisamment entraîné le modèle.

Important

Les images que vous passez dans l'outil Reconnaissance d'images doivent être au format de fichier BLOB.

Configuration de l'outil

Pour utiliser cet outil…

  1. Faites glisser l'outil sur le canevas.

  2. Connectez-vous aux données en amont avec les images que vous voulez entraîner votre modèle à reconnaître. Notez que la taille maximale de l'image est de 512 × 512 pixels.

  3. Entrez vos images d'entraînement en indiquant le champ d'image et les étiquettes d'image .

  4. Entrez vos images de validation en indiquant le champ d'image et les étiquettes d'image .

  5. Exécutez le workflow.

Options

Une époque est un passage unique (avant et arrière) de l'intégralité des données d'un jeu d'entraînement via un réseau neuronal. Les époques sont différentes des itérations, même si elles y sont liées. Une itération est un passage unique de l'intégralité des données dans un lot d'un jeu d'entraînement.

L'augmentation du nombre d'époques permet au modèle d'apprendre plus longtemps auprès du jeu d'entraînement. Toutefois, cela augmente également la consommation de calculs.

Vous pouvez augmenter le nombre d'époques pour réduire le nombre d'erreurs dans le modèle. Toutefois, à un moment donné, la réduction du nombre d'erreurs ne compense plus l'augmentation de la consommation de calculs. Par ailleurs, une augmentation trop importante du nombre d'époques peut entraîner des problèmes de surajustement, tandis qu'une utilisation insuffisante des époques peut entraîner des problèmes de sous-ajustement.

Les modèles pré-entraînés sont des modèles qui comportent des méthodes d'extraction de caractéristiques avec des paramètres déjà définis. Les modèles avec plus de paramètres ont tendance à être plus précis, mais plus lents et plus coûteux en termes de calcul. Le contraire est vrai pour les modèles avec moins de paramètres : ils ont tendance à être moins précis, mais plus rapides et moins coûteux en termes de calcul.

Voici des explications simplifiées des modèles pré-entraînés inclus dans l'outil. Gardez à l'esprit que les performances de ces modèles dépendent en grande partie de vos données, de sorte que les synthèses ne seront pas toujours correctes.

  • VGG16 tend à être le modèle le plus précis, le plus lent et le plus coûteux en calcul. Taille minimale de l'image : 32 x 32 pixels.

  • InceptionResNetV2 tend à équilibrer la précision, la vitesse et le coût du calcul, avec un certain penchant pour la précision. Taille minimale de l'image : 75 x 75 pixels.

  • Resnet50V2 tend à équilibrer la précision, la vitesse et le coût du calcul, avec un certain penchant pour la vitesse et moins de calcul. Taille minimale de l'image : 32 x 32 pixels.

  • InceptionV3 tend à être le moins précis (mais reste plutôt précis), le plus rapide, et le moins coûteux en calcul. Taille minimale de l'image : 75 x 75 pixels.

Tous ces modèles ont été entraînés avec un jeu de données contenant plus de 14 millions d'images avec plus de 20 000 étiquettes.

Opter pour un modèle pré-entraîné vous permet d'utiliser un réseau neuronal en utilisant vos propres images, sans avoir à entraîner le réseau neuronal entier au préalable. Lorsque vous choisissez d'utiliser un modèle pré-entraîné, cela suppose effectivement que vos paramètres d'entrée correspondent à ce que le modèle pré-entraîné attend. Vous n'avez donc pas besoin de reconstruire un modèle qui fait peu ou prou la même chose que le modèle pré-entraîné, et qui pourrait même se montrer moins performant. Comme la plupart des caractéristiques des images ont tendance à être identiques à celles utilisées par les modèles pendant l'entraînement, vous pouvez souvent supposer avec certitude qu'un modèle pré-entraîné fonctionnera avec votre entrée.

Utilisez un modèle pré-entraîné lorsque vous disposez d'images avec des caractéristiques qui correspondent à ce que le modèle pré-entraîné attend et que vous souhaitez éviter de construire votre propre modèle.

Un lot est un sous-ensemble du jeu de données d'entraînement.

La diminution de la taille du lot vous permet d'échelonner la quantité de données qui passe par un réseau neuronal à tout moment. Cela vous permet d'entraîner les modèles en utilisant moins de mémoire que vous ne le feriez si vous transfériez l'intégralité des données en une seule fois via un réseau neuronal. Le regroupement par lot peut parfois accélérer l'entraînement. Toutefois, le fait de diviser vos données en lots peut également augmenter le nombre d'erreurs dans le modèle.

Séparez vos données en lots lorsque votre machine ne peut pas traiter l'intégralité des données en une seule fois, ou si vous souhaitez réduire le temps d'entraînement.