数据清理工具
单个工具示例
“数据清理”有一个单个工具示例。访问 示例工作流 以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。
使用数据清理工具修复常见的数据质量问题。用户可以替换 null 值、移除标点符号、修改大小写等。
已知局限
数据清理工具不是动态的。如果在动态设置中使用,例如,一个旨在与新生成的字段名一起工作的宏指令,即使所有选项都被选中,该工具也不会与字段互动。请考虑用 多字段公式工具 替换数据清理工具。
访问 Alteryx 社区精通工具系列 ,了解有关此工具和其它工具的更多信息。
工具组件
数据清理工具有两个锚点。
输入锚点:使用输入锚点连接到要进行清理的数据。
输出锚点:输出锚点输出清理后的数据。
配置工具
使用 选项 选项卡确定如何处理数据质量问题。
移除 Null 数据
使用这些选项可移除整行和整列的 null 数据。
移除 null 行
移除每列都有 null 值的所有行。
移除具有 null 值的行,但不移除具有空字符串值的行。
仅移除每列都有 null 值的行。
消息显示在 结果 窗口,显示已移除的行数。
移除 Null 列
移除所有每行中都有 null 值的列。
移除具有 null 值的列,但不删除具有空字符串值的列。
仅移除每行都有 null 值的列。
消息显示在 结果 窗口,显示已移除的列数。
选择要清理的字段
选择要清理的字段,使用下列配置选项进行清理。使用 全部 链接可选择所有字段,使用 无 链接可取消选择所有字段。
字符串数据类型
除了将 null 值替换为 0 之外,其它所有选项都应用于字符串数据类型。为不同字段指定不同的选项时,请在工作流中使用多个数据清理工具。
替换 Null
若需将 Null 值替换成空白或 0 以外的值,请使用 数值替换工具 。
替换为空白值(字符串字段) :将 null 值替换为空白字符串值。空白值指的是 " " 而非 [Null]。此选项默认选中。
替换为0(数值字段) :将 null 值替换为0(零)。此选项默认选中。
移除不需要的字符
前导和尾随空格 :删除前导和尾随空格。此选项默认选中。
制表符、换行符和重复空格 :将所有出现的空格(包括换行符、制表符、多个空白字符和其他连续空白字符)替换为单个空格。
所有空格 : 删除所有出现的空格。
字母 :移除所有字母,包括非拉丁字母,例如 A b Z À é ö 。
数字 :移除所有数字。
标点符号 :删除以下字符:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
修改大小写
选择 修改大小写 然后从下拉菜单中选择一个选项来更改字符串数据类型的大小写:
大写 :将字符串中的所有字母转换为大写。
小写 :将字符串中的所有字母转换为小写字母。
词首字母大写 :将字符串中的所有单词的第一个字母大写。