Stat Transfer 支持的文件格式
SAS 和 SPSS 文件的读写支持通过一个名为 StatTransfer 的 CircleSystems API 库实现。支持的格式包括:
SAS 版本 7 至 9.4 (*.sas7bdat)
IBM SPSS (*.sav)
字符编码
Alteryx Designer 读取采用任何字符编码的 SAS 和 SPSS 文件。SAS 和 IBM SPSS 文件以 UTF-8 格式写入,这意味着数据采用 UTF-8 编码,与 Designer 兼容。
值标签
IBM SPSS 和 SAS 文件都支持值标签。值标签是数据内部的一个表,它允许数据持有键。值标签索引可以是数字或字母。例如:
值标签 | 键说明 |
|---|---|
1 | 未满 18 岁。 |
2 | 18 至 26 岁。 |
3 | 26 岁以上。 |
m | 男 |
f | 女 |
在输入数据工具中,有一个用于扩展值标签的用户配置选项:
选中“扩展值标签”(默认)时,Designer 会将“1”替换为“未满 18 岁”。
若未勾选,Designer 仅显示键值“1”。
如果为字段定义了值标签表,但字段中的数据没有相应的值标签,则使用数据值。例如,如果仅为值 1-3 定义了标签,则 4 将直接写出。
缺失数据
IBM SPSS 和 SAS 文件具有“缺失”数据的概念。在 Designer 中,数据将包含 NULL 值。写入时,任何 NULL 值都会在生成的 SAS 或 IBM SPSS 文件中以“missing”形式写入。
数据类型
Designer 支持写入 SAS 和 IBM SPSS 文件的所有数据类型,但 blob 和空间字段除外。如果 blob 和/或空间字段被发送至 SAS 或 IBM SPSS 的输出工具,则会被忽略。如果遇到这些类型的字段,系统将在结果窗口中报告警告消息。
读取 SAS/IBM SPSS 文件时,所有数据将转换为以下数据类型之一:
在写入字符串数据类型时,根据 Designer 中定义的字符串长度,写入的文件中字符串的大小可能会增加 4 倍。
Double(所有数值将以双精度值形式提供)。
V_WString(所有字符串均以可变宽字符串提供)。
Date (YYYY-MM-DD)
Time (HH:MM:SS)
DateTime (YYYY-MM-DD HH:MM:SS)
标签
Designer 读取和写入 SPSS 变量标签。这些在“描述”字段中表示。