Skip to main content

Zero-shot Text Classification tool icon 零击 (Zero-shot) 文本分类

“零击文本分类”工具根据您定义的类别列表将评分类别分配给文本正文。例如,您可以输入报纸文章并定义标签类别“政治”和“技术”,该工具会提供每个标签相关性的概率。“零击文本分类”工具无须训练数据,它通过 huggingface transformer  模型杠杆利用  ONNX Runtime

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

语言支持

“零击文本分类”工具目前仅支持英语。

工具组件

“零击文本分类”工具有 3 个锚点(2 个输入锚点和 1 个输出锚点):

  • D 输入锚点:使用 D 输入锚点连接要分类的文本数据。

  • L 输入锚点:使用 L 输入锚点将类别标签传递到工具。

  • 输出锚点:使用输出锚点将每个文本体的已评过分的类别传递到下游。

配置工具

  1. 向画布添加“零击文本分类”工具。

  2. 使用 D 输入锚点将“零击文本分类”工具连接至要在工作流中使用的文本数据。

  3. 如果文本较大,请将文本拆分为几个较小的组成部分,或者使用 文本预处理 文本摘要 工具对文本进行预处理。

  4. 使用 L 输入锚点,将类别标签传递到“零击分类”工具。您可以使用 “文本输入”工具 建立一个类别标签列表。

  5. 选择您要分析的 包含文本的列 。该工具不需要训练数据。

  6. 为要评分的类别选择 带标签的列

  7. (可选)选择 多标签分类 以相互独立地处理类别。使用该选项确定您的文本是否属于多个类别。

  8. 运行 工作流。

输出

输出包括 2 组列:

  • 每个类别标签的列。每列表示每行中的文本与每个类别关联的程度。类别列中的值越大,表示文本与该类别关联的可能性就越大。

  • 如果使用多个类别标签,该列包含概率最高的类别标签。