Skip to main content

Basic Data Profile Tool Icon 数据概要分析工具

单个工具示例

“数据概要分析”具有单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

您可以使用“数据概要分析”工具查看数据的概览或概要分析,并输出信息用于进一步的分析。“数据概要分析”工具可用于分析数据并提供每列(字段)数据的元数据。除了元数据外,若要查看数据概要分析的可视化表示,请使用“浏览”工具

配置工具

完成任何可选的配置选项:

  • 精确计数限制:建议使用默认限制以获得最佳性能。增加限制可查看更详细的数据概要分析信息。输入文本或使用向上/向下按钮,选择您希望 Alteryx 在数据中识别的最大唯一值数量。

  • 大小限制返回所有唯一值(字符):建议使用默认限制以获得最佳性能。增加限制可查看更详细的数据概要分析信息。输入文本或使用向上/向下按钮,选择在确定值是否唯一时您希望 Alteryx 校验的最大字符数。

  • 使用公制单位:选择此选项以使用公制计量单位。此选项仅适用于空间数据。

查看输出

根据所连接工具的数据类型,“结果”窗口中的数据概要分析信息会有所不同。如需查看数据类型列表,请访问数据类型

结果会以垂直列表的形式显示。您可以滚动查看数据中每个列的元数据。

字符串数据

如果列中包含字符串值,则将显示以下元数据:

  • 名称:列名称。

  • 数据类型:选定列的数据类型。

  • 大小:为该列的每个记录保留的内存量。

  • 来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。

  • 描述:列的描述(如有)。如果没有描述,则为 [Null]。

  • OK:列中无质量问题的值的数量,如不具有前导或尾随空格。

  • Null 值数:列中 null 值的数量,不包括空白值。

  • 非 Null 值数:列中非 null 值的数量,包括空白值。

  • 空白值数:空白值的数量。

  • 开头存在空格的值:值前面有空格的字符串值的数量。使用“数据清理”工具或“公式”工具 trim 函数解决该问题。如需了解详情,请访问“数据清理”工具“公式”工具

  • 末尾存在空格的值:值后面有空格的字符串值的数量。

  • 前后都带空格的值:值前面和后面都有空格的字符串值的数量。

  • 平均长度:列中值的平均长度。

  • 最长长度:列中最长值的字符数。

  • 最长值:列中最长的值。

  • 最短(非空)长度:列中最短值的字符数。

  • 最短值:列中最短的值。

  • 最小值:列中按字母顺序排序第一的字符串记录。

  • 最大值:列中按字母顺序排序最后的字符串记录。

  • 唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具

  • 唯一值:列中的所有唯一值。

数值数据

如果列中包含数值,则将显示以下元数据:

  • 名称:列名称。

  • 数据类型:选定列的数据类型。

  • 大小:为该列的每个记录保留的内存量。

  • 来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。

  • 描述:列的描述(如有)。如果没有描述,则为 [Null]。

  • OK:列中无质量问题的值的数量,如不具有前导或尾随空格。

  • Null 值数:列中 null 值的数量,不包括空白值。

  • 非 Null 值数:列中非 null 值的数量,包括空白值。

  • 最小值:列中的最小值。

  • 最大值:列中的最大值。

  • 平均值:列中值的平均值。

  • 总和:列中值的总和。

  • 标准偏差:衡量值在图表中离散程度的度量。

  • 方差:衡量一组随机数据偏离算术平均值的程度的度量。

  • 唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具

  • 唯一值:列中的所有唯一值。

  • 第 25 百分位数:数据下半部分的中位值。

  • 第 50 百分位数:数据的中位值。

  • 第 75 百分位数:数据上半部分的中位值。

  • 直方图:列中属于均匀分组数据的值的数量。每个组都由组中的初始值和值计数表示,中间用冒号分隔。一个组包含的值上限为下一个组的初始值,但不包括该值。1:23、2:15 和 3:0 表示从 1、2 和 3 开始的 3 个组。每个组分别有 23、15 和 0 个项目。

  • 误差范围:值高于或低于计算值的可能范围。

日期/时间数据

如果列中包含日期/时间数据,则将显示以下元数据:

  • 名称:列名称。

  • 数据类型:选定列的数据类型。

  • 大小:为该列的每个记录保留的内存量。

  • 来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。

  • 描述:列的描述(如有)。如果没有描述,则为 [Null]。

  • OK:列中无质量问题的值的数量,如不具有前导或尾随空格。

  • Null 值数:列中 null 值的数量,不包括空白值。

  • 非 Null 值数:列中非 null 值的数量,包括空白值。

  • 日期直方图:(仅适用于日期数据)列中属于均匀分组数据的值的数量。每个组都由组中的初始值和值计数表示,中间用冒号分隔。一个组包含的值上限为下一个组的初始值,但不包括该值。1:23、2:15 和 3:0 表示从 1、2 和 3 开始的 3 个组。每个组分别有 23、15 和 0 个项目。

  • 最小值:列中的最小值。

  • 最大值:列中的最大值。

  • 唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具

  • 唯一值:列中的所有唯一值。

空间对象数据

如果列中包含空间对象,则将显示以下元数据:

  • 名称:列名称。

  • 数据类型:选定列的数据类型。

  • 大小:为该列的每个记录保留的内存量。

  • 来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。

  • 描述:列的描述(如有)。如果没有描述,则为 [Null]。

  • OK:列中无质量问题的值的数量。

  • Null 值数:列中 null 值的数量,不包括空白值。

  • 非 Null 值数:列中非 null 值的数量,包括空白值。

  • 平均空间(字节):此对象占用的平均内存大小。

  • 最大空间(字节):列中最大对象所占用的内存大小。

  • 点计数:列中作为点呈现的空间对象的数量。

  • 行计数:列中作为行呈现的空间对象的数量。

  • 多段线计数:列中作为多段线呈现的空间对象的数量。

  • 矩形计数:列中作为矩形呈现的空间对象的数量。

  • 多边形计数:列中作为多边形呈现的空间对象的数量。

  • 多点计数:列中作为多点呈现的空间对象的数量。

  • 平均组件数:列中空间对象内的平均组件数量。

  • 最大组件数:列中空间对象内的最大组件数量。

  • 平均点数:列中空间对象内的平均点数量。

  • 最大点数:列中空间对象内的最大点数量。

  • 最长长度:列中空间对象的最长长度。

  • 最大面积:以平方英里或平方公里为单位的最大面积。