Skip to main content

Blue circle with white snowflake inside. 唯一值工具

单个工具示例

“唯一值”工具有一个单个工具示例。访问 示例工作流 以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

利用“唯一值”工具对一个或多个指定字段进行分组,然后对这些字段进行排序,从而区分一个数据记录是唯一的还是重复的。

配置工具

列名称 :选择要查找唯一值的列。

  • 使用 全选 按钮比较所有记录。数据将根据唯一列进行排序。因此,如果需要特定的排序顺序,在使用“唯一值”工具之前请先使用 “排序”工具 为文件分配具体的排序顺序。 为获得最佳效果,请在“排序”工具配置中取消选中 使用词典顺序 设置,并在“唯一”工具中对所有选中的字段进行排序,然后再对其他字段执行排序。

  • 使用 取消全选 可取消选择所有字段。

输出锚点

唯一值工具有 2 个输出锚点:

  • U 锚点:包含数据集中的 唯一 记录。将显示每个组中的第一条记录。

  • D 锚点:包含数据集中的 重复 记录。将显示每个组中的剩余记录。

请注意,通常需要对结果进行人工检查,以确保标记为重复的行确实是重复的。例如,您可能有 2 个居住在不同地址的同名客户。如果您认为数据集可能包括这类的离群值,则可能需要在配置此工具时选择附加列。

输出示例

我们来看一个基于此样本数据集的“唯一值”工具输出的一个示例。

输入数据流

在“唯一值”工具的 配置 窗口中,我们从传入数据流中同时选中 FirstName LastName 列,以确保不包含有相同 FirstName-LastName 组合的重复条目。

FirstName

LastName

Pamela

Wright

Melissa

Ruff

Constanti

Vlassis

Amy

Lockemer

Danielle

Valdez

Pamela

Wright

Mary

Kiniry

Melissa

Ruff

Danielle

Valdez

U 锚点输出

U 输出锚点返回上述传入数据流中的所有唯一行。

FirstName

LastName

Amy

Lockemer

Constanti

Vlassis

Danielle

Valdez

Mary

Kiniry

Melissa

Ruff

Pamela

Wright

D 锚点输出

D 输出锚点返回来自上述传入数据流中的任何重复行。

FirstName

LastName

Danielle

Valdez

Melissa

Ruff

Pamela

Wright