
Imagem para Texto
Use a ferramenta Imagem para Texto para extrair texto de arquivos de imagem BLOB criados pela ferramenta Entrada de Imagem. Você também pode usar essa ferramenta para executar detecção automática de tabelas.
A ferramenta Imagem para Texto não tem suporte para linhas nulas ou vazias.
Esta ferramenta faz parte do Alteryx Intelligence Suite. O Intelligence Suite exige uma licença separada e um instalador complementar para o Designer. Depois de instalar o Designer, instale o Intelligence Suite e inicie sua avaliação gratuita.
Componentes da ferramenta
A ferramenta Imagem para Texto tem três âncoras:
- Âncora de entrada D: use a âncora de entrada D para conectar a imagem PDF que você deseja converter. Você pode usar a ferramenta Entrada de Imagem para trazer imagens para o seu fluxo de trabalho.
- Âncora de entrada T: use a âncora de entrada T para conectar anotações da ferramenta Modelo de Imagem.
- Âncora de saída: use a âncora de saída para passar o texto convertido para etapas posteriores do fluxo de trabalho. Para visualizar a saída completa de cada imagem, use a ferramenta Navegar.
Configurar a ferramenta
-
Adicione uma ferramenta Entrada de Imagem à tela e conecte-a à ferramenta Imagem para Texto.
-
Selecione a Imagem da qual deseja extrair texto.
-
Identifique o Idioma do texto contido na imagem.
-
Se você conectou a ferramenta Modelo de Imagem e todas as páginas têm o mesmo layout, selecione Aplicar a primeira página de anotações na ferramenta Modelo de Imagem a todas as páginas.
-
Execute o fluxo de trabalho para converter a imagem para texto.
Saída
Se você estiver convertendo imagens em texto usando a âncora D, a ferramenta Imagem para Texto cria uma coluna no conjunto de dados. As linhas dessa coluna contêm o texto das páginas da imagem PDF. Se você usar a âncora T, a ferramenta gera uma tabela que corresponde à tabela detectada nos arquivos de imagem fornecidos.