分块工具
使用分块工具可根据数据范围分配一个值(分块)。该工具基于用户指定的 3 种方法之一来执行此操作。
以下 2 列会附加到数据中:
Tile_Num 是行的已分配分块。
Tile_SequenceNum 是行在分块中位置的行编号。
提示
此工具具有单个工具示例。查看访问示例工作流以了解如何在 Designer Cloud 中访问此示例和其他更多示例。
工具组件
![]() |
图解:具有锚点的“分块”工具。
“分块”工具有两个锚点。
输入锚点:使用输入锚点选择要根据数据范围分配值的数据。
输出锚点:输出附加到数据中的新分块列。
配置工具
分块方法:选择用于分配分块值的范围模式。
相等总和
根据传入记录的排序顺序,分配分块以覆盖一定范围的值,使每个分块的“总和”字段总计相同。
创建具有相等总计值的分块
在不破坏一条记录的前提下,对于每个分块,“总和”字段的总计尽可能保持接近。
块数量:指定要分配给数据的组数。
求和的列:指定用于分块的字段,以便形成若干范围,使该数值的总和在各个分块中平均分布。
排序列(可选):如果从下拉列表中选择某个字段,数据会先按指定字段排序,再分配到分块中。如果未指定字段,则会根据记录的传入排序顺序将记录分配给分块。
相等记录
输入行分为指定数量的分块,以便为每个分块分配相同数量的行。
平均划分记录
选择要分配给数据的分块数量。
不根据列拆分分块(可选):如果从下拉列表中选择某个字段,分块不会在该字段上拆分。如果未选择任何字段,则分块 # 优先于指定的字段数据,因此可能会拆分组。
排序依据:在分配到分块之前,所选列的数据将根据指定列进行排序(数字按降序,其他列类型按升序)。
输入中的行数可能不能按照您指定的分块数等分。除非指定了排序列,否则这完全基于行在输入文件中的位置。
智能分块
根据指定字段中值的标准偏差创建分块。分配的分块指示记录的值是在平均范围 (=0) 内、高于平均值 (1),还是低于平均值 (-1) 等等。
按与平均值的差异对记录排序
分块值表示数据范围的平均值。分块数量直接解释了范围。范围始终从 -0.5 开始到 +0.5 结束:
标题 | 范围 |
|---|---|
0 | -0.5 至 0.5 |
-1 | -1.5 至 -0.5 |
1 | 0.5 至 1.5 |
分组的数值列:(必须为数值类型)选择用于分块的字段。此字段必须包含数字值。
选择应用于输出字段的命名约定:
不输出带分块标签的列:不会生成额外的输出字段名称。
输出带分块标签的列:输出中将附加一个描述性字段名称。描述符包括 Average(平均)、Above Average(高于平均)、High(高)、Extremely High(极高)、Below Average(低于平均)、Low(低)、Extremely Low(极低)。
输出带详细分块标签的列:除上述描述信息外,分块所表示的数值范围将显示在括号中。例如,高(12750 至 155000)。
手动
用户可以通过在每个范围的新行上键入一个值来指定分块的截止值。
手动设置规则
分组的数值列(必须为数值):选择要分块的列。
输入每个分块的上限:在提供的框中的新行上输入每个分块的上限。
在手动模式下应用分块,但行未排序。如果您希望以这种方式显示数据,则必须添加排序工具并指定排序列。
唯一值
对于指定列中的每个唯一值,将分配一个唯一分块。如果指定了多个列,则会根据值的组合分配分块。
为唯一值创建分块
选择创建唯一块的列:选中要分块的列对应的复选框。
对输出排序:选择此选项以对输出结果进行排序。所选列的数据会先按指定列排序(数字按降序,所有其他列类型按升序),再分配到分块中。
分组列(可选)
分块行基于分组列。当您选择一组时,将为指定组中的每一行创建一系列分块。
