使用数据清理工具修复常见的数据质量问题。用户可以替换 Null 值、移除标点符号、修改大小写等。
提示
此工具具有单个工具示例。查看 访问示例工作流 以了解如何在 Designer Cloud 中访问此示例和其他更多示例。
Numbers with more than 15 digits need to be treated as strings, or they lose precision. Set the column type to a string with the Select tool.
![]() |
图解:带锚点的“数据清理”工具。
数据清理工具有两个锚点。
输入锚点 :使用输入锚点连接要清理的数据。
输出锚点 :输出锚点会输出清理后的数据。
使用这些选项可移除整行和整列的 null 数据:
移除 null 行
移除每列都有 null 值的所有行。
移除具有 null 值的行,但不移除具有空字符串值的行。
仅移除每列中具有 null 值的行。
Remove Null Columns
Remove all columns with a null value in every row.
Remove columns with null values—doesn't remove columns with empty string values.
Only remove columns that have a null value in every row.
A message displays in the Results window with the number of columns that were removed.
勾选要清理的列。勾选 全部选中 可选择所有列,取消选中可取消选择所有列。
除了 将 null 值替换为 0 之外,其他所有选项都适用于字符串数据类型。要为不同列指定不同的选项,请在工作流中使用多个“数据清理”工具。
替换为空白值(字符串列) :将 null 值替换为空白字符串值。空白值指的是
" "
而非[Null]
。此选项默认选中。替换为 0(数值列) :将 null 值替换为
0
(零)。此选项默认选中。
前导和尾随空格 :删除前导和尾随空格。此选项默认选中。
制表符、换行符和重复空格 :将所有出现的空格(包括换行符、制表符、多个空白字符和其他连续空白字符)替换为单个空格。
所有空格 :移除所有空格。
字母 :移除所有字母,包括非拉丁字母,如 A b Z À é ö 。
数字 :删除所有数字。
标点符号 :移除以下字符: ! " # $ % & ' ( ) * + , \ - ./ : ; < = > ? @ [ / ] ^ _ ` { | } ~
选择 修改大小写 ,然后从下拉菜单中选择一个选项来更改字符串数据类型的大小写:
大写 :将字符串中的所有字母转换为大写。
小写 :将字符串中的所有字母转换为小写。
首字母大写 :将字符串中所有单词的第一个字母转换为大写。