Skip to main content

Zero-shot Text Classification tool icon Classificazione testo zero-shot

Lo strumento Classificazione testo zero-shot assegna le categorie valutate al corpo del testo in base all'elenco di categorie da te definito. Ad esempio, puoi inserire articoli di giornale e definire le categorie di etichette "Politica" e "Tecnologia" e lo strumento fornisce una probabilità per la pertinenza di ciascuna etichetta. Lo strumento Classificazione testo zero-shot non richiede dati di training e sfrutta ONNX Runtime utilizzando il modello huggingface transformer .

Alteryx Intelligence Suite necessario

Questo strumento fa parte di Alteryx Intelligence Suite . Intelligence Suite richiede una licenza separata e un ulteriore programma di installazione per Designer. Dopo aver installato Designer, installa Intelligence Suite e avvia la versione di prova gratuita .

Supporto linguistico

Al momento, lo strumento Classificazione testo zero-shot supporta solo l'inglese.

Componenti dello strumento

Lo strumento Classificazione testo zero-shot ha 3 ancoraggi (2 di input e 1 di output):

  • Ancoraggio di input D : utilizza l'ancoraggio di input D per connettere i dati di testo che desideri classificare.

  • Ancoraggio di input L : utilizza l'ancoraggio di input L per passare le etichette delle categorie allo strumento.

  • Ancoraggio di output: utilizza l'ancoraggio di output per passare le categorie valutate per ogni corpo di testo a valle.

Configura lo strumento

  1. Aggiungi uno strumento Classificazione testo zero-shot all'area di disegno.

  2. Utilizza l'ancoraggio di input D per connettere lo strumento Classificazione testo zero-shot ai dati di testo che desideri utilizzare nel flusso di lavoro.

  3. Se disponi di corpi di testo di grandi dimensioni, dividi il testo in sezioni più piccole o pre-elabora il testo con gli strumenti Pre-elaborazione del testo o Riepilogo del testo .

  4. Utilizza l'ancoraggio di input L per passare le etichette delle categorie allo strumento Classificazione testo zero-shot. Puoi utilizzare lo strumento Input di testo per creare un elenco di etichette di categoria.

  5. Seleziona la colonna con testo che desideri analizzare. Lo strumento non richiede dati di training.

  6. Seleziona la colonna con etichette per le categorie che desideri valutare.

  7. (Facoltativo) Seleziona Classificazione multietichetta per trattare le categorie in modo indipendente l'una dall'altra. Utilizza questa opzione per determinare se il testo appartiene a più di 1 categoria.

  8. Esegui il flusso di lavoro.

Output

L'output include 2 set di colonne:

  • Colonna per ciascuna etichetta di categoria. Ogni colonna rappresenta il grado in cui il testo in ogni riga è associato a ciascuna categoria. Un valore più alto nella colonna della categoria indica una maggiore probabilità che il testo si associ a quella categoria.

  • Colonna che contiene l'etichetta della categoria con il valore di probabilità più alto se utilizzi più di 1 etichetta di categoria.