图像转文本
使用“图像转文本”工具从 “图像输入”工具 创建的 BLOB 图像文件中提取文本。您也可以使用此工具执行表格自动检测。
要求 Alteryx Intelligence Suite
此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用 。
重要
“图像转文本”工具不支持 Null 行或空行。
工具组件
图像转文本工具有三个锚点:
配置工具
在画布上添加“图像输入”工具,并将其连接到“图像转文本”工具。
选择要从中提取文本的 图像 。
识别图像中文本的 语言 。
如果您已连接 图像模板工具 ,并且所有页面的布局相同,请选择 将图像模板中的第一页注释应用到所有页面 。
运行 工作流以将图像转换为文本。
输出
如果使用 D 锚点将图像转换为文本,图像转文本工具将在数据集中创建一个新列。列中每一行都包含来自PDF图像页面的文本。如果您使用 T 锚点,工具将输出一个表格,此表格与在您提供的图像文件中检测到的表格相匹配。