准备

基于列中数据将字段类型设置为尽可能小的大小。

将输入记录拆分为两个或三个随机样本。

修复常见的如 null 值和不需要字符等数据质量问题。修改大小写。

使用“筛选”工具根据条件选择数据。符合条件的数据行会输出至 True 锚点。

公式工具使用表达式创建和更新列。

“生成行”工具会在记录级别创建新的数据行。

“数值替换”工具让用户能够替换数字型数据字段中的值。

此工具允许用户对多个字段进行分块或装箱。

多字段公式工具使用一个表达式创建或更新多个字段。

此工具使用表达式来创建和更新列,在创建公式时使用行数据。

此工具允许对具有较高的否定响应的数据进行标准化。

返回传入数据流的随机抽样。

使用记录 ID 在数据中创建一个新列,用于为数据中的每条记录分配一个按顺序递增的唯一标识符。

此工具将数据流的记录数限制为指定的数目、百分比或随机行数。

此工具返回指定的记录和记录范围,

选择工具对流过工作流的数据列进行选择、排除和重新排序。

排序工具根据指定数据字段值的字母数字顺序,对表格中的记录进行排序。

此工具使用用户指定的方法根据数据中的范围分配一个值(分块)。

此工具根据指定的字段区分一个数据记录是唯一的还是重复的。