Classification du texte Zero-shot
L'outil Classification du texte Zero-shot attribue des catégories notées aux corps de texte en fonction d'une liste de catégories que vous définissez. Par exemple, vous pouvez alimenter des articles de journaux et définir les catégories d'étiquette « Politique » et « Technologie ». L'outil fournit ensuite une probabilité pour la pertinence de chaque étiquette. L'outil Classification du texte Zero-shot ne nécessite pas de données d'entraînement et utilise ONNX Runtime à l'aide du modèle huggingface transformer .
Alteryx Intelligence Suite requis
Cet outil fait partie de Alteryx Intelligence Suite . Intelligence Suite nécessite une licence séparée et un programme d'installation complémentaire pour Designer. Après avoir installé Designer, installez Intelligence Suite et commencez votre essai gratuit .
Prise en charge des langues
Pour le moment, l'outil Classification du texte Zero-shot prend uniquement en charge l'anglais.
Composants de l'outil
L'outil Classification du texte Zero-shot comporte 3 ancrages (2 entrées et 1 sortie) :
Ancrage d'entrée D : utilisez l'ancrage d'entrée D pour vous connecter aux données de texte que vous souhaitez catégoriser.
Ancrage d'entrée L : utilisez l'ancrage d'entrée L pour transmettre les étiquettes de catégorie à l'outil.
Ancrage de sortie : utilisez l'ancrage de sortie pour transmettre les catégories évaluées pour chaque corps de texte en aval.
Configuration de l'outil
Ajoutez un outil Classification du texte Zero-shot au canevas.
Utilisez l'ancrage d'entrée D pour connecter l'outil Classification du texte Zero-shot aux données de texte que vous souhaitez utiliser dans le workflow.
Si vous avez de grands corps de texte, fractionnez le texte en sections plus petites ou pré-traitez votre texte à l'aide des outils Pré-traitement de texte ou Résumé de texte .
Utilisez l'ancrage d'entrée L pour transmettre les étiquettes de catégorie à l'outil Classification du texte Zero-shot. Vous pouvez utiliser l' outil Saisie de texte pour créer votre liste d'étiquettes de catégorie.
Sélectionnez la colonne avec texte que vous souhaitez analyser. L'outil ne nécessite pas de données d'entraînement.
Sélectionnez la colonne avec étiquettes pour les catégories que vous souhaitez évaluer.
(Facultatif) Sélectionnez Classification multi-étiquettes pour traiter les catégories indépendamment les unes des autres. Utilisez cette option pour déterminer si votre texte appartient à plusieurs catégories.
Exécutez le workflow.
Sortie
La sortie comprend 2 ensembles de colonnes :
Colonne pour chaque étiquette de catégorie. Chaque colonne représente le degré auquel le texte de chaque ligne est associé à chaque catégorie. Une valeur plus élevée dans la colonne de catégorie indique une probabilité plus élevée que le texte soit associé à cette catégorie.
Colonne contenant l'étiquette de catégorie avec la valeur de probabilité la plus élevée si vous utilisez plusieurs étiquettes de catégorie.