单个工具示例
“数据概要分析”具有单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。
您可以使用“数据概要分析”工具查看数据的概览或概要分析,并输出信息用于进一步的分析。“数据概要分析”工具可用于分析数据并提供每列(字段)数据的元数据。除了元数据外,若要查看数据概要分析的可视化表示,请使用“浏览”工具。
完成任何可选的配置选项:
精确计数限制:建议使用默认限制以获得最佳性能。增加限制可查看更详细的数据概要分析信息。输入文本或使用向上/向下按钮,选择您希望 Alteryx 在数据中识别的最大唯一值数量。
大小限制返回所有唯一值(字符):建议使用默认限制以获得最佳性能。增加限制可查看更详细的数据概要分析信息。输入文本或使用向上/向下按钮,选择在确定值是否唯一时您希望 Alteryx 校验的最大字符数。
使用公制单位:选择此选项以使用公制计量单位。此选项仅适用于空间数据。
根据所连接工具的数据类型,“结果”窗口中的数据概要分析信息会有所不同。如需查看数据类型列表,请访问数据类型。
结果会以垂直列表的形式显示。您可以滚动查看数据中每个列的元数据。
如果列中包含字符串值,则将显示以下元数据:
名称:列名称。
数据类型:选定列的数据类型。
大小:为该列的每个记录保留的内存量。
来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。
描述:列的描述(如有)。如果没有描述,则为 [Null]。
OK:列中无质量问题的值的数量,如不具有前导或尾随空格。
Null 值数:列中 null 值的数量,不包括空白值。
非 Null 值数:列中非 null 值的数量,包括空白值。
空白值数:空白值的数量。
开头存在空格的值:值前面有空格的字符串值的数量。使用“数据清理”工具或“公式”工具 trim 函数解决该问题。如需了解详情,请访问“数据清理”工具和“公式”工具。
末尾存在空格的值:值后面有空格的字符串值的数量。
前后都带空格的值:值前面和后面都有空格的字符串值的数量。
平均长度:列中值的平均长度。
最长长度:列中最长值的字符数。
最长值:列中最长的值。
最短(非空)长度:列中最短值的字符数。
最短值:列中最短的值。
最小值:列中按字母顺序排序第一的字符串记录。
最大值:列中按字母顺序排序最后的字符串记录。
唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具。
唯一值:列中的所有唯一值。
如果列中包含数值,则将显示以下元数据:
名称:列名称。
数据类型:选定列的数据类型。
大小:为该列的每个记录保留的内存量。
来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。
描述:列的描述(如有)。如果没有描述,则为 [Null]。
OK:列中无质量问题的值的数量,如不具有前导或尾随空格。
Null 值数:列中 null 值的数量,不包括空白值。
非 Null 值数:列中非 null 值的数量,包括空白值。
最小值:列中的最小值。
最大值:列中的最大值。
平均值:列中值的平均值。
总和:列中值的总和。
标准偏差:衡量值在图表中离散程度的度量。
方差:衡量一组随机数据偏离算术平均值的程度的度量。
唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具。
唯一值:列中的所有唯一值。
第 25 百分位数:数据下半部分的中位值。
第 50 百分位数:数据的中位值。
第 75 百分位数:数据上半部分的中位值。
直方图:列中属于均匀分组数据的值的数量。每个组都由组中的初始值和值计数表示,中间用冒号分隔。一个组包含的值上限为下一个组的初始值,但不包括该值。1:23、2:15 和 3:0 表示从 1、2 和 3 开始的 3 个组。每个组分别有 23、15 和 0 个项目。
误差范围:值高于或低于计算值的可能范围。
如果列中包含日期/时间数据,则将显示以下元数据:
名称:列名称。
数据类型:选定列的数据类型。
大小:为该列的每个记录保留的内存量。
来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。
描述:列的描述(如有)。如果没有描述,则为 [Null]。
OK:列中无质量问题的值的数量,如不具有前导或尾随空格。
Null 值数:列中 null 值的数量,不包括空白值。
非 Null 值数:列中非 null 值的数量,包括空白值。
日期直方图:(仅适用于日期数据)列中属于均匀分组数据的值的数量。每个组都由组中的初始值和值计数表示,中间用冒号分隔。一个组包含的值上限为下一个组的初始值,但不包括该值。1:23、2:15 和 3:0 表示从 1、2 和 3 开始的 3 个组。每个组分别有 23、15 和 0 个项目。
最小值:列中的最小值。
最大值:列中的最大值。
唯一值数:字段中唯一值的数量。使用“唯一值”工具查看唯一和重复条目的完整计数。如需了解详情,请访问“唯一值”工具。
唯一值:列中的所有唯一值。
如果列中包含空间对象,则将显示以下元数据:
名称:列名称。
数据类型:选定列的数据类型。
大小:为该列的每个记录保留的内存量。
来源:列的来源。这可以是数据源的名称,也可以是数据保存位置的路径。
描述:列的描述(如有)。如果没有描述,则为 [Null]。
OK:列中无质量问题的值的数量。
Null 值数:列中 null 值的数量,不包括空白值。
非 Null 值数:列中非 null 值的数量,包括空白值。
平均空间(字节):此对象占用的平均内存大小。
最大空间(字节):列中最大对象所占用的内存大小。
点计数:列中作为点呈现的空间对象的数量。
行计数:列中作为行呈现的空间对象的数量。
多段线计数:列中作为多段线呈现的空间对象的数量。
矩形计数:列中作为矩形呈现的空间对象的数量。
多边形计数:列中作为多边形呈现的空间对象的数量。
多点计数:列中作为多点呈现的空间对象的数量。
平均组件数:列中空间对象内的平均组件数量。
最大组件数:列中空间对象内的最大组件数量。
平均点数:列中空间对象内的平均点数量。
最大点数:列中空间对象内的最大点数量。
最长长度:列中空间对象的最长长度。
最大面积:以平方英里或平方公里为单位的最大面积。