图像处理
使用“图像处理”工具对图像执行各种操作。利用此工具可以对齐、二值化、缩放、移位、裁剪图像。您还可以平衡图像亮度并将其转换为灰色。
要求 Alteryx Intelligence Suite
此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用 。
工具组件
“图像处理”工具有 3 个锚点(2 个输入和 1 个输出):
输入锚点:利用输入锚点连接要处理的图像。
可选输入锚点:从 “图像模板”工具 连接注释。您可以将这些注释用作 移位 步骤的锚点。
输出锚点:通过输出锚点将已处理图像传递到下游。
注意:“image_processed”列包含您的已处理图像。
配置工具
在画布上添加一个“图像处理”工具。
使用输入锚点来连接要处理的图像。
从 图像 字段中,选择要处理的图像。
选择 添加步骤 按钮打开一个下拉列表,从中选择以下任一步骤:
此工具按从上到下的顺序处理每个步骤。您可以拖动已添加的步骤来重新对这些步骤排序。选择垃圾桶图标可删除单个步骤。
对齐
亮度平衡
裁剪
增强
灰度
光学字符识别优化
缩放
移位
二值化
运行 工作流
高级
图像处理的每个步骤都有高级配置选项。
对齐
使用 对齐 步骤旋转图像或扫描的文档。此步骤可以优化倾斜的扫描文档的光学字符识别结果。
对齐 有 2 种模式:
自动 :为您的光学字符识别工作流自动旋转扫描的文档或图像。 自动 功能对包含文本的图像效果最好。请注意,自动旋转仅适用于旋转 45 度或 45 度以下的图像。
自定义 :使用滑块选择工具旋转图像的角度和方向。选择刷新图标可重置滑块。如果您知道确切的旋转角度或图像旋转超过 45 度时,请使用 自定义 。
亮度平衡
自动或手动调整图像的亮度。
将多通道图像转换为单通道。 自动 选项使工具自动平衡图像的亮度。如果选择 自定义 选项,则可以使用滑块指定图像的亮度或暗度。
裁剪
删除部分图像。
要裁剪图像,请选择要保留多少图像。您可以通过以像素或百分比表示宽度和高度来进行选择。然后使用定位网格来选择裁剪后要保留的图像部分。
增强
提高图像分辨率并改善图像质量。使用 增强 来改善您的计算机视觉任务(比如光学字符识别)的结果。以下是可用的图像增强模式:
用于光学字符识别的文本 :对于包含键入文本的图像,将分辨率提升 400%。此选项可以改善光学字符识别结果。请注意, 用于光学字符识别的文本 仅针对小于或等于 1000 × 1000 像素的图像应用增强功能。通过该工具更大的图像不予以增强。
重要
请注意,由于 增强 依赖于深度学习模式,因此它可能需要比其他步骤更长的处理时间。
灰度
将多通道图像转换为单通道。您不必进行任何配置。
光学字符识别优化
优化扫描的 PDF 文件以进行光学字符识别 (OCR)。只能对带有扫描伪影、打印背景纹理和非白色背景的嘈杂文档使用 OCR 优化 。我们不建议对干净文档使用 OCR 优化 。
OCR 优化 具有 3 种模式:
自动 :该工具就各文档自动决定是 深 还是 浅 处理。
深 :用于密度较高和干扰因素较多的文档。
浅 :用于相对干净的文档。
如果文档背景不全是白色,请选择 某些文本背景非白色 。例如,如果您的文档具有蓝色背景的白色文本,请选择此选项。
缩放
调整图像大小。
选择要将图像调整到怎样的大小。您可以指定宽度和高度(以像素为单位),也可以指定相对于原始图像大小的百分比。
您也可以选择锁定图像的宽高比,这意味着即使您更改高度或宽度,图像的比例也不会改变。
移位
自动对扫描时未对齐的文档移位处理。使用 移位 功能来优化扫描后文档的光学字符识别结果。按照以下步骤使用 移位 功能:
在 “图像模板”工具 中创建注释以充当锚点。 移位 功能使用锚点对齐其他扫描的文档。注意: 移位 功能不适用于 表格检测 。仅使用在手动注释模式下添加的注释。
将“图像模板”工具连接至可选的输入锚点。
添加 移位 步骤。
选择 移位 下的 锚点 ,以自动移位扫描的文档。
从步骤 1 中创建的注释中选择 锚点名称 。
运行 工作流。
二值化
设置将图像转换为二进制图像(如黑白)的阈值,应用于每个通道。
我们提供了多种您可用的算法,来对图像二值化。在大多数情况下,我们建议您对文本图像(如书籍的扫描页面)使用 自适应Gaussian ,对其他图像(如照片)使用 二进制 。有关二值化的更深入讨论,请访问 OpenCV 二值化文档 。
注意 - 自适应阈值设置方法要求图像为单通道(即灰色)。如果您在 二值化 步骤之前没有添加 灰度 步骤,我们会为您执行灰度设置,但不会在“配置”窗口中添加灰度步骤。