唯一值工具
使用唯一值工具通过对一个或多个指定列进行分组并按这些列排序,以判断某行是唯一还是重复。
提示
此工具具有单个工具示例。查看访问示例工作流以了解如何在 Designer Cloud 中访问此示例和其他更多示例。
配置工具
要查找唯一值的列:选择您要检查是否唯一的列。使用全选复选框比较整行数据。
数据将根据唯一列进行排序。因此,如果需要特定的排序顺序,请在使用“唯一值”工具之前,使用排序工具为文件分配排序顺序。
排序依据(可选):传入数据的行位置未被保留。按列排序以返回准确的范围。
输出锚点
![]() |
图解:具有输出锚点的“唯一值”工具。
唯一值工具有 2 个输出锚点:
U 锚点:包含数据集中的唯一行。将显示每个组中的第一行。
D 锚点:包含数据集中的重复行。将显示每个组中的剩余行。
警告
通常需要对结果进行手动检查,以确保标记为重复的行确实是重复的。例如,您可能有 2 个居住在不同地址的同名客户。如果您认为数据集可能包括这些类型的离群值,则可能需要在配置此工具时选择附加列。
输出示例
以下是基于示例数据集的“唯一值”工具输出的示例。
输入数据流
在唯一值配置窗口中,我们从传入数据流中同时选中 FirstName 和 LastName 列,以确保不包含有相同 FirstName-LastName 组合的重复条目。
FirstName | LastName |
|---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
U 锚点输出
U 输出锚点返回上述传入数据流中的所有唯一行。
FirstName | LastName |
|---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
D 锚点输出
D 输出锚点返回上述传入数据流中的任何重复行。
FirstName | LastName |
|---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |
