Skip to main content

唯一值工具

使用唯一值工具通过对一个或多个指定列进行分组并按这些列排序,以判断某行是唯一还是重复。

配置工具

要查找唯一值的列:选择您要检查是否唯一的列。使用全选复选框比较整行数据。

输出锚点

Unique_Tool_Anchors.png

图解:具有输出锚点的“唯一值”工具。

唯一值工具有 2 个输出锚点:

  • U 锚点:包含数据集中的唯一行。将显示每个组中的第一行。

  • D 锚点:包含数据集中的重复行。将显示每个组中的剩余行。

警告

通常需要对结果进行手动检查,以确保标记为重复的行确实是重复的。例如,您可能有 2 个居住在不同地址的同名客户。如果您认为数据集可能包括这些类型的离群值,则可能需要在配置此工具时选择附加列。

输出示例

以下是基于示例数据集的“唯一值”工具输出的示例。

输入数据流

在唯一值配置窗口中,我们从传入数据流中同时选中 FirstNameLastName 列,以确保不包含有相同 FirstName-LastName 组合的重复条目。

FirstName

LastName

Pamela

Wright

Melissa

Ruff

Constanti

Vlassis

Amy

Lockemer

Danielle

Valdez

Pamela

Wright

Mary

Kiniry

Melissa

Ruff

Danielle

Valdez

U 锚点输出

U 输出锚点返回上述传入数据流中的所有唯一行。

FirstName

LastName

Amy

Lockemer

Constanti

Vlassis

Danielle

Valdez

Mary

Kiniry

Melissa

Ruff

Pamela

Wright

D 锚点输出

D 输出锚点返回上述传入数据流中的任何重复行。

FirstName

LastName

Danielle

Valdez

Melissa

Ruff

Pamela

Wright