Processamento de Imagem

Use a ferramenta Processamento de Imagem para executar várias ações em imagens. A ferramenta permite alinhar, limiarizar, redimensionar, deslocar e recortar imagens. Você também pode equilibrar o brilho das imagens e convertê-las para escala de cinza.

Requer o Alteryx Intelligence Suite

Esta ferramenta faz parte do Alteryx Intelligence Suite . O Intelligence Suite exige uma licença separada e um instalador complementar para o Designer. Depois de instalar o Designer, instale o Intelligence Suite e inicie sua avaliação gratuita .

Componentes da ferramenta

A ferramenta Processamento de Imagem tem três âncoras (duas de entrada e uma de saída):

Âncora de entrada: use a âncora de entrada para conectar as imagens que deseja processar.
Âncora de entrada opcional: conecta anotações da ferramenta Modelo de Imagem . Você pode usar essas anotações como pontos de âncora para a etapa Deslocamento .
Âncora de saída: use a âncora de saída para passar as imagens processadas para etapas posteriores do fluxo de trabalho.
- Observação: a coluna "Image_processed" contém as imagens processadas.

Configurar a ferramenta

Adicione a ferramenta Processamento de Imagem à tela.
Use a âncora de entrada para conectar as imagens que deseja processar.
No campo Imagem , selecione as imagens que deseja processar.
Clique no botão Adicionar etapa para abrir um menu suspenso que permite adicionar as seguintes etapas:
A ferramenta processa cada etapa na ordem exibida, de cima para baixo. Você pode arrastar as etapas que já adicionou para reorganizá-las. Clique nos ícones de lixeira para remover etapas individuais.
- Alinhamento
- Equilíbrio de brilho
- Recortar
- Aprimorar
- Escala de cinza
- Otimização para OCR
- Escala
- Deslocamento
- Limiarização
Clique no botão para Executar o fluxo de trabalho.

Avançado

Cada etapa do processamento de imagem tem opções avançadas de configuração.

Alinhamento

Use a etapa Alinhamento para girar suas imagens ou documentos digitalizados. Essa etapa pode melhorar os resultados de OCR para documentos digitalizados que estão desalinhados.

A etapa Alinhamento tem dois modos:

Automático : gire de forma automática documentos ou imagens digitalizados para seus fluxos de trabalho de OCR. O modo Automático funciona melhor com imagens que contêm texto. Observação: a rotação automática só funciona para imagens giradas em 45 graus ou menos.
Personalizado : você pode usar o controle deslizante para selecionar o grau e a direção da rotação que a ferramenta aplica às imagens. Clique no ícone de atualização para redefinir o controle deslizante. Use o modo Personalizado quando souber o grau exato de rotação ou se tiver imagens giradas em mais de 45 graus.

Equilíbrio de brilho

Ajuste o brilho de imagens de forma automática ou manual.

Converta imagens multicanal para canal único. A opção Automático permite que a ferramenta equilibre automaticamente o brilho das imagens. Se você selecionar a opção Personalizado , poderá usar o controle deslizante para especificar a intensidade de luz ou de sombra que deseja para a imagem.

Recortar

Remova partes de imagens.

Para recortar uma imagem, escolha quanto da imagem você deseja manter. Você pode fazer essa seleção indicando a largura e a altura em pixels ou as porcentagens. Em seguida, use a grade de âncoras para selecionar a parte da imagem que deseja manter após o recorte.

Aprimorar

Aumente a resolução e melhore a qualidade da imagem. Use a etapa Aprimorar para melhorar os resultados de suas tarefas de visão computacional, como OCR. Estes são os modelos de aprimoramento de imagem disponíveis:

Texto para OCR : para imagens que contêm texto digitado, aprimore a resolução em 400%. Essa opção pode melhorar os resultados de OCR. Observe que Texto para OCR somente aplica aprimoramentos a imagens menores que ou iguais a 1000 × 1000 pixels. Imagens maiores passam pela ferramenta sem aprimoramentos.

Importante

Observe que a etapa Aprimoramento pode levar mais tempo para ser processada do que outras etapas, pois depende de modelos de aprendizagem profunda.

Escala de cinza

Converta imagens multicanal para canal único. Não é necessário configurar nada.

Otimização para OCR

Otimize seus arquivos PDF digitalizados para reconhecimento óptico de caracteres (OCR). Use a Otimização para OCR somente em documentos ruidosos com artefatos de digitalização, textura de plano de fundo impressa e planos de fundo não brancos. Não recomendamos a Otimização para OCR para documentos limpos.

A Otimização para OCR tem três modos:

Auto : a ferramenta decide automaticamente se aplica o processamento Pesado ou Leve por documento.
Pesado : use para documentos mais densos e ruidosos.
Leve : use para documentos relativamente limpos.

Se o seu documento tiver um fundo não branco, selecione Parte do texto não tem plano de fundo branco . Por exemplo, selecione essa opção se o documento tiver texto em branco em um fundo azul.

Escala

Redimensione imagens.

Escolha o quão maior ou menor você quer que as imagens sejam. Você pode especificar a largura e a altura em pixels ou por porcentagem em relação ao tamanho das imagens originais.

Você também pode optar por fixar a taxa de proporção de suas imagens, o que significa que as proporções não serão alteradas mesmo que você altere a altura ou largura.

Deslocamento

Desloque automaticamente os documentos que ficaram desalinhados quando digitalizados. Use Deslocamento para melhorar os resultados de OCR para documentos digitalizados. Siga essas etapas para usar o recurso Deslocamento :

Crie uma anotação na ferramenta Modelo de Imagem para agir como uma âncora. A etapa Deslocamento usa a âncora para alinhar os outros documentos digitalizados. Observação: Deslocamento não funciona com Detecção de tabela . Use somente as anotações adicionadas no modo de anotação manual.
Conecte a ferramenta Modelo de Imagem à âncora de entrada opcional.
Adicione a etapa Deslocamento .
Selecione Ancorar em Deslocamento para deslocar automaticamente os documentos digitalizados.
Selecione o Nome da âncora da anotação criada na etapa 1.
Clique no botão para Executar o fluxo de trabalho.

Limiarização

Defina um limiar para converter imagens em um binário, como preto e branco, para cada canal.

Fornecemos vários algoritmos que você pode usar para limiarizar suas imagens. Na maioria dos casos, recomendamos que você use o método Gaussiano adaptativo para imagens de texto, como páginas digitalizadas de um livro, e Binário para outras imagens, como fotografias. Para uma discussão mais aprofundada sobre limiarização, acesse a documentação de limiarização do OpenCV .

Observação: os métodos de limiarização adaptativa exigem que as imagens tenham apenas um canal, ou seja, estejam em escala de cinza. Se você não tiver uma etapa para conversão em Escala de cinza antes de uma etapa de Limiarização , realizamos essa conversão para você. Note, no entanto, que essa etapa de conversão em escala de cinza não aparecerá na janela de configuração.