准备
准备数据用于下游分析。
项目 | 描述 |
|---|---|
使用数据清理工具修复常见的数据质量问题。用户可以替换 Null 值、移除标点符号、修改大小写等。 | |
使用筛选工具,根据条件选择数据。 | |
使用公式工具创建新列、对列进行更新、使用一个或多个表达式来执行各种计算和运算。 | |
使用多列公式,可利用一个表达式创建或更新多列。 | |
使用“随机百分比抽样”工具可返回预期行数,从而生成传入数据流的随机样本。 | |
使用行 ID 在数据中创建一个新列,用于为数据中的每行分配一个按顺序递增的唯一标识符。 | |
利用样本将数据流限制为指定的数目、百分比或随机行数。此外,抽样工具还将所选配置应用于分组所依据的列。 | |
使用“选择”工具可对流经工作流的数据列进行添加、排除和重新排序。 | |
使用选择行工具返回指定的行和行范围,包括不连续的行范围。此工具可用于故障排除和数据抽样。 | |
排序工具根据指定数据字段值的字母数字顺序,对表格中的行进行排序。 | |
使用分块工具可根据数据范围分配一个值(分块)。该工具基于用户指定的 3 种方法之一来执行此操作。 |