
Classificazione testo zero-shot
Lo strumento Classificazione testo zero-shot assegna le categorie valutate al corpo del testo in base all'elenco di categorie da te definito. Ad esempio, puoi inserire articoli di giornale e definire le categorie di etichette "Politica" e "Tecnologia" e lo strumento fornisce una probabilità per la pertinenza di ciascuna etichetta. Lo strumento Classificazione testo zero-shot non richiede dati di training e sfrutta ONNX Runtime utilizzando il modello huggingface transformer.
Questo strumento fa parte di Alteryx Intelligence Suite. Intelligence Suite richiede una licenza separata e un programma di installazione aggiuntivo per Designer. Dopo aver installato Designer, installa Intelligence Suite e avvia la versione di prova gratuita.
Supporto linguistico
Al momento, lo strumento Classificazione testo zero-shot supporta solo l'inglese.
Componenti dello strumento
Lo strumento Classificazione testo zero-shot ha 3 ancoraggi (2 di input e 1 di output):
- Ancoraggio di input D: utilizza l'ancoraggio di input D per connettere i dati di testo che desideri classificare.
- Ancoraggio di input L: utilizza l'ancoraggio di input L per passare le etichette delle categorie allo strumento.
- Ancoraggio di output: utilizza l'ancoraggio di output per passare le categorie valutate per ogni corpo di testo a valle.
Configurazione dello strumento
- Aggiungi uno strumento Classificazione testo zero-shot all'area di disegno.
- Utilizza l'ancoraggio di input D per connettere lo strumento Classificazione testo zero-shot ai dati di testo che desideri utilizzare nel flusso di lavoro.
- Se disponi di corpi di testo di grandi dimensioni, dividi il testo in sezioni più piccole o pre-elabora il testo con gli strumenti Pre-elaborazione del testo o Riepilogo del testo.
- Utilizza l'ancoraggio di input L per passare le etichette delle categorie allo strumento Classificazione testo zero-shot. Puoi utilizzare lo strumento Input di testo per creare un elenco di etichette di categoria.
- Seleziona la colonna con testo che desideri analizzare. Lo strumento non richiede dati di training.
- Seleziona la colonna con etichette per le categorie che desideri valutare.
- (Facoltativo) Seleziona Classificazione multietichetta per trattare le categorie in modo indipendente l'una dall'altra. Utilizza questa opzione per determinare se il testo appartiene a più di 1 categoria.
- Esegui il flusso di lavoro.
Output
L'output include 2 set di colonne:
- Colonna per ciascuna etichetta di categoria. Ogni colonna rappresenta il grado in cui il testo in ogni riga è associato a ciascuna categoria. Un valore più alto nella colonna della categoria indica una maggiore probabilità che il testo si associ a quella categoria.
- Colonna che contiene l'etichetta della categoria con il valore di probabilità più alto se utilizzi più di 1 etichetta di categoria.