Skip to main content

Image to Text Tool Icon 图像转文本

使用“图像转文本”工具从 “图像输入”工具 创建的 BLOB 图像文件中提取文本。您也可以使用此工具执行表格自动检测。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

重要

“图像转文本”工具不支持 Null 行或空行。

工具组件

图像转文本工具有三个锚点:

  • D  输入锚点:用 D  输入锚点连接至要转换的 PDF 图像。您可以使用 “图像输入”工具 将图像输入至工作流中。

  • T 输入锚点:用 T 输入锚点来连接 “图像模板”工具 中的注释。

  • 输出锚点:输出锚点将转换后的文本传递到下游。要查看每个图像的完整输出,请使用 “浏览”工具

配置工具

  1. 在画布上添加“图像输入”工具,并将其连接到“图像转文本”工具。

  2. 选择要从中提取文本的 图像

  3. 识别图像中文本的 语言

  4. 如果您已连接 图像模板工具 ,并且所有页面的布局相同,请选择 将图像模板中的第一页注释应用到所有页面

  5. 运行 工作流以将图像转换为文本。

输出

如果使用 D 锚点将图像转换为文本,图像转文本工具将在数据集中创建一个新列。列中每一行都包含来自PDF图像页面的文本。如果您使用 T 锚点,工具将输出一个表格,此表格与在您提供的图像文件中检测到的表格相匹配。