唯一值工具
单个工具示例
“唯一值”工具有一个单个工具示例。访问 示例工作流 以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。
利用“唯一值”工具对一个或多个指定字段进行分组,然后对这些字段进行排序,从而区分一个数据记录是唯一的还是重复的。
配置工具
列名称 :选择要查找唯一值的列。
使用 全选 按钮比较所有记录。数据将根据唯一列进行排序。因此,如果需要特定的排序顺序,在使用“唯一值”工具之前请先使用 “排序”工具 为文件分配具体的排序顺序。 为获得最佳效果,请在“排序”工具配置中取消选中 使用词典顺序 设置,并在“唯一”工具中对所有选中的字段进行排序,然后再对其他字段执行排序。
使用 取消全选 可取消选择所有字段。
输出锚点
唯一值工具有 2 个输出锚点:
U 锚点:包含数据集中的 唯一 记录。将显示每个组中的第一条记录。
D 锚点:包含数据集中的 重复 记录。将显示每个组中的剩余记录。
请注意,通常需要对结果进行人工检查,以确保标记为重复的行确实是重复的。例如,您可能有 2 个居住在不同地址的同名客户。如果您认为数据集可能包括这类的离群值,则可能需要在配置此工具时选择附加列。
输出示例
我们来看一个基于此样本数据集的“唯一值”工具输出的一个示例。
输入数据流
在“唯一值”工具的 配置 窗口中,我们从传入数据流中同时选中 FirstName 和 LastName 列,以确保不包含有相同 FirstName-LastName 组合的重复条目。
FirstName | LastName |
---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
U 锚点输出
U 输出锚点返回上述传入数据流中的所有唯一行。
FirstName | LastName |
---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
D 锚点输出
D 输出锚点返回来自上述传入数据流中的任何重复行。
FirstName | LastName |
---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |