数据健康状况
利用数据健康状况工具检查数据的健康状况。您可以将该工具与特征工程工具(如“构建特征”和“特征类型”工具)配合使用,以改善数据的健康状况。为了确定数据的健康程度,该工具会分析缺失值、离群值和稀疏度。
要求 Alteryx Intelligence Suite
此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用 。
工具组件
“数据健康状况”工具有 4 个锚点。
输入锚点:输入锚点连接至要检查健康状况的数据。
S 输出锚点: S 输出锚点会将每列的相关数据健康状况评分传递到下游。
R 输出锚点: R 输出锚点会将有关数据健康状况的全面报告传递到下游。您可以使用“浏览”工具查看报告。
O 输出锚点: O 输出锚点会将数据中的离群值传递到下游。
配置工具
为了正确使用数据健康状况工具,您必须针对数据健康状况评分指标以及是否在输出中包括改善数据健康状况的建议作出选择。
重要
要使用此工具,上游数据必须至少有 30 行。
1. 指标
从下拉列表中,选择是要按百分比范围 (0–100%) 还是标准化范围 (0–1) 输出评分。该工具通过评估缺失值、离群值和稀疏度来生成评分。
2. 根据评分输出建议
如果您希望工具根据收到的评分为您提供有关如何改善数据健康状况的建议,请选中此框。建议会成为新的一列,并附加到数据集中。