Skip to main content

Zero-shot Text Classification tool icon Classification du texte Zero-shot

L'outil Classification du texte Zero-shot attribue des catégories notées aux corps de texte en fonction d'une liste de catégories que vous définissez. Par exemple, vous pouvez alimenter des articles de journaux et définir les catégories d'étiquette « Politique » et « Technologie ». L'outil fournit ensuite une probabilité pour la pertinence de chaque étiquette. L'outil Classification du texte Zero-shot ne nécessite pas de données d'entraînement et utilise  ONNX Runtime  à l'aide du modèle  huggingface transformer .

Alteryx Intelligence Suite requis

Cet outil fait partie de Alteryx Intelligence Suite . Intelligence Suite nécessite une licence séparée et un programme d'installation complémentaire pour Designer. Après avoir installé Designer, installez Intelligence Suite et commencez votre essai gratuit .

Prise en charge des langues

Pour le moment, l'outil Classification du texte Zero-shot prend uniquement en charge l'anglais.

Composants de l'outil

L'outil Classification du texte Zero-shot comporte 3 ancrages (2 entrées et 1 sortie) :

  • Ancrage d'entrée  D  : utilisez l'ancrage d'entrée  D  pour vous connecter aux données de texte que vous souhaitez catégoriser.

  • Ancrage d'entrée  L  : utilisez l'ancrage d'entrée  L  pour transmettre les étiquettes de catégorie à l'outil.

  • Ancrage de sortie : utilisez l'ancrage de sortie pour transmettre les catégories évaluées pour chaque corps de texte en aval.

Configuration de l'outil

  1. Ajoutez un outil Classification du texte Zero-shot au canevas.

  2. Utilisez l'ancrage d'entrée  D  pour connecter l'outil Classification du texte Zero-shot aux données de texte que vous souhaitez utiliser dans le workflow.

  3. Si vous avez de grands corps de texte, fractionnez le texte en sections plus petites ou pré-traitez votre texte à l'aide des outils  Pré-traitement de texte  ou Résumé de texte .

  4. Utilisez l'ancrage d'entrée  L  pour transmettre les étiquettes de catégorie à l'outil Classification du texte Zero-shot. Vous pouvez utiliser l' outil Saisie de texte  pour créer votre liste d'étiquettes de catégorie.

  5. Sélectionnez la  colonne avec texte  que vous souhaitez analyser. L'outil ne nécessite pas de données d'entraînement.

  6. Sélectionnez la  colonne avec étiquettes  pour les catégories que vous souhaitez évaluer.

  7. (Facultatif) Sélectionnez  Classification multi-étiquettes  pour traiter les catégories indépendamment les unes des autres. Utilisez cette option pour déterminer si votre texte appartient à plusieurs catégories.

  8. Exécutez le workflow.

Sortie

La sortie comprend 2 ensembles de colonnes :

  • Colonne pour chaque étiquette de catégorie. Chaque colonne représente le degré auquel le texte de chaque ligne est associé à chaque catégorie. Une valeur plus élevée dans la colonne de catégorie indique une probabilité plus élevée que le texte soit associé à cette catégorie.

  • Colonne contenant l'étiquette de catégorie avec la valeur de probabilité la plus élevée si vous utilisez plusieurs étiquettes de catégorie.