
Estrazione coppia chiave-valore
Strumento della categoria Laboratorio
Questo strumento appartiene alla categoria Laboratorio e non è destinato all'uso in produzione. Potrebbe presentare problemi noti documentati e non essere dotato di funzionalità complete. È inoltre soggetto a modifiche.
Una coppia chiave-valore collega 2 elementi di dati. La chiave è un identificatore univoco che definisce il set di dati (ad esempio persona, luogo, cosa), mentre il valore corrisponde ai dati identificati. Esempi di coppie chiave-valore:
- Persona: John
- Luogo: Banca
- Cosa: Controllo
Lo strumento Estrazione coppia chiave-valore identifica le strutture con coppie chiave-valore nei documenti. Per trovare le coppie chiave-valore, lo strumento utilizza la libreria di Google Tesseract e la corrispondenza sfocata. Lo strumento Estrazione coppia chiave-valore non è destinato ai dati tabulari. Per i dati tabulari utilizza lo strumento Modello immagine.
Se intendi passare documenti con rumore allo strumento Estrazione coppia chiave-valore, prova a pre-elaborare le immagini con la funzionalità Ottimizzazione OCR nello strumento Elaborazione delle immagini per migliorare i risultati. La funzionalità Ottimizzazione OCR pulisce i documenti con sfondi non bianchi, filigrane e altri rumori.
Supporto linguistico
Lo strumento Estrazione coppia chiave-valore supporta l'input nelle seguenti lingue: inglese, cinese (semplificato), francese, tedesco, italiano, portoghese e spagnolo. È preferibile che la chiave e il valore siano nella stessa lingua.
Componenti dello strumento
Lo strumento Estrazione coppia chiave-valore ha 3 ancoraggi:
- Ancoraggio D: utilizza l'ancoraggio D per passare i dati immagine che desideri analizzare.
- Ancoraggio K: utilizza l'ancoraggio K per passare le chiavi che desideri identificare.
- Ancoraggio di output: utilizza l'ancoraggio di output per passare le coppie chiave-valore a valle.
Configura lo strumento
- Aggiungi uno strumento Estrazione coppia chiave-valore al canvas.
- Utilizza gli ancoraggi per connettere lo strumento Estrazione coppia chiave-valore ai dati immagine e alle chiavi che desideri utilizzare nel flusso di lavoro.
- Seleziona la colonna contenente i dati immagine.
- Seleziona la lingua del testo all'interno dei dati immagine.
- Selezionala colonna contenente le chiavi. Suggerimento: per immettere le chiavi all'interno del flusso di lavoro, puoi utilizzare lo strumento Input di testo.
- Esegui il flusso di lavoro.
Output
Lo strumento Estrazione coppia chiave-valore produce come output le colonne in entrata oltre a colonne denominate secondo ogni chiave identificata. La colonna di ogni chiave contiene i valori associati in una singola cella. Se esiste più di 1 valore per chiave, lo strumento separa i valori con uno spazio (ad esempio, valore1 valore2 valore3). Se una chiave viene visualizzata in più posizioni, lo strumento crea una colonna per ogni istanza (ad esempio, chiave1, chiave2, chiave3).
Domande frequenti
Per ottenere risultati ottimali, ti consigliamo di utilizzare chiavi quanto più possibile corrispondenti al documento. Tuttavia, lo strumento Estrazione coppia chiave-valore può trovare chiavi con maiuscole/minuscole diverse o coppie chiave-valore con delimitatori diversi (ad esempio [CHIAVE: valore] e [chiave, valore]).
In generale, puoi utilizzare lo strumento con immagini dotate di testo nero su sfondo bianco. Tuttavia, in caso di documenti con uno sfondo non bianco, la funzionalità Ottimizzazione OCR nello strumento Elaborazione delle immagini può risolvere il problema.
Ti consigliamo di utilizzare prima la funzionalità Ottimizzazione OCR nello strumento Elaborazione delle immagini, poiché tale strumento esegue automaticamente la conversione in scala di grigi sullo sfondo ed elimina la necessità di regolazioni manuali della scala di grigi.
Non è possibile collegare lo strumento Estrazione coppia chiave-valore allo strumento Modello immagine. Tieni presente che lo strumento Estrazione coppia chiave-valore identifica tutte le istanze delle chiavi specificate e restituisce i valori corrispondenti, indipendentemente dalla loro posizione in un documento. In questo modo elimina la necessità di creare riquadri di delimitazione e annotazioni.
Elimina eventuali righe vuote nell'elenco di chiavi, quindi esegui nuovamente il flusso di lavoro.
Lo strumento Estrazione coppia chiave-valore non è ottimizzato per la scrittura manuale.
Idealmente, struttura le coppie chiave-valore come segue:
Struttura
<Chiave>: <Valore>
Esempio 1
Azienda: Alteryx
Esempio 2
Nome: Libby
Lo strumento è anche in grado di riconoscere chiavi con valori multiriga, purché tali valori non siano separati da linee, ad esempio dalle celle di una tabella:
Struttura
<Chiave>: <Riga valore 1>
<Riga valore 2>
<Riga valore 3>
Esempio 1
Shipping Address: ABC Company
123 Main Street
Some City, New York 12345
Esempio 2
Billing Address: XYZ Vendor
456 Pleasant Street