Skip to main content

Data Cleansing Tool Icon 数据清理工具

单个工具示例

“数据清理”有一个单个工具示例。访问 示例工作流 以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

使用数据清理工具修复常见的数据质量问题。用户可以替换 null 值、移除标点符号、修改大小写等。

已知局限

数据清理工具不是动态的。如果在动态设置中使用,例如,一个旨在与新生成的字段名一起工作的宏指令,即使所有选项都被选中,该工具也不会与字段互动。请考虑用 多字段公式工具 替换数据清理工具。

访问 Alteryx 社区精通工具系列 ,了解有关此工具和其它工具的更多信息。

工具组件

Thumbnail

数据清理工具有两个锚点。

  • 输入锚点:使用输入锚点连接到要进行清理的数据。

  • 输出锚点:输出锚点输出清理后的数据。

配置工具

使用 选项 选项卡确定如何处理数据质量问题。

移除 Null 数据

使用这些选项可移除整行和整列的 null 数据。

  • 移除 null 行

    • 移除每列都有 null 值的所有行。

    • 移除具有 null 值的行,但不移除具有空字符串值的行。

    • 仅移除每列都有 null 值的行。

    • 消息显示在 结果 窗口,显示已移除的行数。

  • 移除 Null 列

    • 移除所有每行中都有 null 值的列。

    • 移除具有 null 值的列,但不删除具有空字符串值的列。

    • 仅移除每行都有 null 值的列。

    • 消息显示在 结果 窗口,显示已移除的列数。

选择要清理的字段

选择要清理的字段,使用下列配置选项进行清理。使用 全部 链接可选择所有字段,使用 链接可取消选择所有字段。

字符串数据类型

除了将 null 值替换为 0 之外,其它所有选项都应用于字符串数据类型。为不同字段指定不同的选项时,请在工作流中使用多个数据清理工具。

替换 Null

若需将 Null 值替换成空白或 0 以外的值,请使用 数值替换工具

  • 替换为空白值(字符串字段) :将 null 值替换为空白字符串值。空白值指的是 " " 而非 [Null]。此选项默认选中。

  • 替换为0(数值字段) :将 null 值替换为0(零)。此选项默认选中。

移除不需要的字符

  • 前导和尾随空格 :删除前导和尾随空格。此选项默认选中。

  • 制表符、换行符和重复空格 :将所有出现的空格(包括换行符、制表符、多个空白字符和其他连续空白字符)替换为单个空格。

  • 所有空格 : 删除所有出现的空格。

  • 字母 :移除所有字母,包括非拉丁字母,例如 A b Z À é ö

  • 数字 :移除所有数字。

  • 标点符号 :删除以下字符:

    ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~

修改大小写

选择 修改大小写 然后从下拉菜单中选择一个选项来更改字符串数据类型的大小写:

  • 大写 :将字符串中的所有字母转换为大写。

  • 小写 :将字符串中的所有字母转换为小写字母。

  • 词首字母大写 :将字符串中的所有单词的第一个字母大写。