Skip to main content

Stat Transfer 支持的文件格式

SAS 和 SPSS 文件的读写支持通过一个名为 StatTransfer 的 CircleSystems API 库实现。支持的格式包括:

  • SAS 版本 7 至 9.4 (*.sas7bdat)

  • IBM SPSS (*.sav)

字符编码

Alteryx Designer 读取采用任何字符编码的 SAS 和 SPSS 文件。SAS 和 IBM SPSS 文件以 UTF-8 格式写入,这意味着数据采用 UTF-8 编码,与 Designer 兼容。

值标签

IBM SPSS 和 SAS 文件都支持值标签。值标签是数据内部的一个表,它允许数据持有键。值标签索引可以是数字或字母。例如:

值标签

键说明

1

未满 18 岁。

2

18 至 26 岁。

3

26 岁以上。

m

f

输入数据工具中,有一个用于扩展值标签的用户配置选项:

  • 选中“扩展值标签”(默认)时,Designer 会将“1”替换为“未满 18 岁”。

  • 若未勾选,Designer 仅显示键值“1”。

如果为字段定义了值标签表,但字段中的数据没有相应的值标签,则使用数据值。例如,如果仅为值 1-3 定义了标签,则 4 将直接写出。

缺失数据

IBM SPSS 和 SAS 文件具有“缺失”数据的概念。在 Designer 中,数据将包含 NULL 值。写入时,任何 NULL 值都会在生成的 SAS 或 IBM SPSS 文件中以“missing”形式写入。

数据类型

Designer 支持写入 SAS 和 IBM SPSS 文件的所有数据类型,但 blob 和空间字段除外。如果 blob 和/或空间字段被发送至 SAS 或 IBM SPSS 的输出工具,则会被忽略。如果遇到这些类型的字段,系统将在结果窗口中报告警告消息。

读取 SAS/IBM SPSS 文件时,所有数据将转换为以下数据类型之一:

在写入字符串数据类型时,根据 Designer 中定义的字符串长度,写入的文件中字符串的大小可能会增加 4 倍。

  • Double(所有数值将以双精度值形式提供)。

  • V_WString(所有字符串均以可变宽字符串提供)。

  • Date (YYYY-MM-DD)

  • Time (HH:MM:SS)

  • DateTime (YYYY-MM-DD HH:MM:SS)

标签

Designer 读取和写入 SPSS 变量标签。这些在“描述”字段中表示。