准备
基于列中数据将字段类型设置为尽可能小的大小。
将输入记录拆分为两个或三个随机样本。
修复常见的如 null 值和不需要字符等数据质量问题。修改大小写。
使用“筛选”工具根据条件选择数据。符合条件的数据行会输出至 True 锚点。
公式工具使用表达式创建和更新列。
“生成行”工具会在记录级别创建新的数据行。
“数值替换”工具让用户能够替换数字型数据字段中的值。
此工具允许用户对多个字段进行分块或装箱。
多字段公式工具使用一个表达式创建或更新多个字段。
此工具使用表达式来创建和更新列,在创建公式时使用行数据。
此工具允许对具有较高的否定响应的数据进行标准化。
返回传入数据流的随机抽样。
Order your data for further processing or output.
使用记录 ID 在数据中创建一个新列,用于为数据中的每条记录分配一个按顺序递增的唯一标识符。
此工具将数据流的记录数限制为指定的数目、百分比或随机行数。
此工具返回指定的记录和记录范围,
选择工具对流过工作流的数据列进行选择、排除和重新排序。
排序工具根据指定数据字段值的字母数字顺序,对表格中的记录进行排序。
此工具使用用户指定的方法根据数据中的范围分配一个值(分块)。
此工具根据指定的字段区分一个数据记录是唯一的还是重复的。