Skip to main content

Icon for the Sentiment Analysis Tool 情感分析

情感分析工具判断文本数据是反映积极、消极还是中性情绪。

我们建议 不要 使用“文本预处理”工具来处理情感分析工具的文本数据。“文本预处理”工具可能会删除情感分析工具进行情感分析时依赖的特征。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

语言支持

目前,“情感分析”工具只能分析包含英语文本的数据。

工具组件

情感分析工具有两个锚点:

  • 输入锚点:输入锚点连接要分析的文本数据。

  • 输出锚点:输出锚点将经过分析的数据传递到下游。

配置工具

  1. 在画布上添加一个情感分析工具。

  2. 使用锚点将“情感分析”工具与要在工作流中使用的文本数据相连接。

  3. 选择执行情感分析的 算法

  4. 选择要分析的 文本字段

  5. 运行 工作流。

高级选项

情感分析工具有高级选项。

算法

目前,只有一种算法可用。

《Valence Aware Dictionary for Sentiment Reasoning (VADER) algorithm》 一文对文本情感的正负性和幅度进行度量。情感的正负性是指情感是积极的还是消极的。情感的幅度是指情感的积极或消极程度。VADER 还能识别不带情感的或在正负性上属于中性的文本。

句子级情感

如需在分析前根据标点符号将文本解析为句子,选中 从句子级分析情绪 复选框。

许多情感分析算法(包括 VADER 算法)被调整为寻找句子级的情绪,这表示算法可以解析句子,单独分析每个句子,然后返回整个文本所有句子综合得分的平均值。要使算法解析句子,文本数据必须包含结束标点符号。

情感分类

要将文本数据分类为“积极”、“消极”和“中性”并输出类别,选中 输出情感分类 复选框。使用 消极类最大值 积极类最小值 字段可根据综合情绪得分定义每个情绪类别的值范围。

“消极类最大值”指定算法对消极情绪的敏感程度。增加此参数,则扩大算法用于检测负面情绪的范围标准。“积极类最小值”定义算法对积极情绪的敏感程度。减小此参数,则扩大算法用于检测正面情绪的范围标准。

综合情绪得分范围是-1至1。算法对 -1 和 积极类最小值 之间的任何数值归类为“消极”; 消极类最大值 积极类最小值 之间的任何数值归类为“中性”; 积极类最小值 和 1 之间的任何数值为“积极”。

输出

情感分析工具输出最多五列数据。默认情况下包含四列数据。如果选择了 输出情感分类 选项,则会输出第五列。

列按以下顺序排列:

  • 消极情绪(negative_sentiment):此列显示文本的消极程度的分数( 0 到 1),0 代表最不消极,1 代表最消极。分数代表属于此类别中的词的比例。消极情绪、中性情绪和积极情绪的得分总和应约为 1。

  • 中性情绪(neutral_sentiment):此列显示文本的中性程度(0 到 1),0 代表不是中性, 1 代表最中性的。分数代表属于此类别中的词的比例。消极情绪、中性情绪和积极情绪的得分总和应约为 1。

  • 积极情绪(positive_sentiment):此列显示文本的积极程度,范围从 0 到 1,0 代表不积极,1 代表最积极。分数代表属于此类别中的词的比例。消极情绪、中性情绪和积极情绪的得分总和应约为 1。

  • 综合情绪得分(compound_sentiment_score):此列显示一个 -1 至 1 之间的分数。负数表示消极情绪,正数表示积极情绪。-1 是负分数的极限,0 代表最中性的分数,1 代表最积极的分数。

  • 情绪类别(sentiment_category):情绪类别根据综合情绪得分得出,它包括积极、消极和中性类别。算法的分类(积极、中性、消极)取决于 消极类最大值 积极类最小值 的设置。