准备
基于列中数据将字段类型设置为尽可能小的大小。
将输入记录拆分为两个或三个随机样本。
修复常见的如 null 值和不需要字符等数据质量问题。修改大小写。
使用“筛选”工具根据条件选择数据。符合条件的数据行会输出至 True 锚点。
公式工具使用表达式创建和更新列。
“生成行”工具会在记录级别创建新的数据行。
“数值替换”工具让用户能够替换数字型数据字段中的值。
此工具允许用户对多个字段进行分块或装箱。
多字段公式工具使用一个表达式创建或更新多个字段。
此工具使用表达式来创建和更新列,在创建公式时使用行数据。
此工具允许对具有较高的否定响应的数据进行标准化。
返回传入数据流的随机抽样。
使用记录 ID 在数据中创建一个新列,用于为数据中的每条记录分配一个按顺序递增的唯一标识符。
此工具将数据流的记录数限制为指定的数目、百分比或随机行数。
此工具返回指定的记录和记录范围,
选择工具对流过工作流的数据列进行选择、排除和重新排序。
排序工具根据指定数据字段值的字母数字顺序,对表格中的记录进行排序。
此工具使用用户指定的方法根据数据中的范围分配一个值(分块)。
此工具根据指定的字段区分一个数据记录是唯一的还是重复的。