Skip to main content

Field Summary Tool Icon 字段汇总工具

单个工具示例

“字段汇总”提供单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

字段汇总工具可用于分析数据,并创建包含选定列中数据的描述性统计信息的汇总报告。使用该工具深入了解数据并获得有关数据管理的建议。

该工具支持数字、字符串、空间和日期时间数据。该工具为每种数据类型提供一组唯一的描述性统计信息。如需详细了解数据类型,请访问数据类型

配置工具

  • 选择要产生摘要信息的字段:选中与要生成摘要信息的字段(列)相关联的复选框。

  • 对输入数据采样:选中此复选框可随机抽取记录样本。如果数据集较大,这可以缩短工作流的运行时间。每次运行工作流都会显示不同的数据样本。您可以选择两种抽样方式:

    • 随机 N 条记录:指定要随机抽样的记录数

    • 随机 N% 条记录:指定要随机抽样的记录数百分比

查看输出

字段汇总工具有 3 个输出锚点:

  • O 锚点:Alteryx 数据流,其中包含所选列的描述性统计信息以及Remarks(备注)列中有关数据管理的建议。

  • R 锚点:一份静态报告,其中包含所选列的散点图和描述性统计信息,以及用于管理列中数据的建议(见Remarks 备注)。要查看该报告,请添加“浏览”工具并将其连接到 R 输出锚点。查看浏览工具

  • I 锚点:交互式仪表板,包含每个列的可扩展面板。要查看该报告,请添加“浏览”工具并将其连接到 I 输出。如需了解详情,请访问浏览工具。每个面板由直方图/柱状图和摘要统计信息组成。

    • 将鼠标悬停控制在面板上方,可查看其他图标。

      • 选择信息图标即可以查看其他信息

      • 选择展开图标即可以详细视图打开报告。

    • 将鼠标悬停在图表柱上方即可查看详细信息。

    • 使用“Select variables to view(选择要查看的变量)”,重点关注一小部分的列。

    • 按字母顺序或缺失值的百分比对面板进行排序。

输出中提供的描述性统计信息取决于用于分析的所选列中的数据类型。结果按水平方向列出。从左向右滚动以查看每种数据类型的统计信息。

数字数据

如果所选列包含数字数据,系统会提供以下统计信息:

  • Min(最小值):数据中的最小值。

  • Max(最大值):数据中的最大值。

  • Median(中间值):数据的中间值。

  • Std.(标准)Dev.(差):衡量值在图表中离散程度的度量。

  • Percent Missing(百分比缺失):数据中空值的百分比。

  • Unique Values(唯一值):数据中唯一值的数量。

  • Mean(均值):数据的平均值。

  • Layout(布局):添加浏览工具并将其连接到 R 输出,以便通过直观的方式查看统计信息。查看浏览工具

  • Remarks(备注):关于数据管理的建议(如有)。

字符串数据

如果所选列包含字符串数据,系统会提供以下统计数据:

  • Percent Missing(百分比缺失):数据中空值的百分比。

  • Unique Values(唯一值):数据中唯一值的数量。

  • Shortest Value(最短值):数据中最短(长度)字符串值。

  • Longest Value(最长值):数据中最长(长度)字符串值。

  • Min Value Count(最小值计数):等于最小值的值的个数。

  • Max Value Count(最大值计数):等于最大值的值的个数。

  • Remarks(备注):关于数据管理的建议(如有)。

空间数据

如果列包含空间数据,系统会提供以下统计信息:

  • Percent Missing(百分比缺失):数据中空值的百分比。

  • Object Type(对象类型):数据中空间对象的类型(例如点或多边形)。

  • Avg Area (Sq Miles)(平均面积(平方英里)):数据中值的平均面积(以平方英里为单位)。

  • Avg Length (Miles) (平均长度(英里)):数据中值的平均长度(以英里为单位)。

  • Avg Num Points(点平均数):数据中属于点的值的平均数。

  • Remarks(备注):关于数据管理的建议(如有)。

日期/时间数据

如果列包含日期/时间数据,系统会提供以下统计信息:

  • Percent Missing(百分比缺失):数据中空值的百分比。

  • Unique Values(唯一值):数据中唯一值的数量。

  • Latest Date(最新日期):数据中最晚的日期,或最远的将来日期。

  • Earliest Date(最早日期):数据中的最早日期。

  • Interval(间隔):数据中日期的间隔(例如,每月)。

  • Remarks(备注):关于数据管理的建议(如有)。