Amazon Redshift

连接类型

ODBC（64 位）

支持类型

读取和写入、数据库内

验证版本

数据库版本：1.0.35649

ODBC 客户端版本：1.5.2.1002

如需详细了解 Simba Athena ODBC 驱动程序，请参阅 Simba ODBC 文档。

注意

为避免在将工作流保存到 Server 时发生错误，请选中 Simba Amazon Redshift ODBC 驱动程序 DSN 设置中的密码加密对象：这台计算机的所有用户复选框。

用于连接的 Alteryx 工具

标准工作流处理

输入数据工具Input Data Tool

输出数据工具Output Data Tool

数据库内工作流处理

库内连接工具

Blue icon with database being plugged in.

数据流传入工具

Blue icon with a stream-like object flowing into a database.

Azure AD 身份验证

Alteryx 为 Redshift 启用企业级身份验证，允许您在 Redshift 中访问数据时利用 Azure Active Directory 标识。

先决条件：

Azure Active Directory 和 Amazon Redshift 之间的安全集成。
Azure AD 用户已设置对 AWS Redshift 实例的访问权限。

如需详细了解如何将 Azure AD 与 Redshift 集成，请参阅社区文章。

配置 ODBC 连接

在 ODBC 数据源管理程序中...

选择 Redshift 驱动程序，然后选择配置。
输入连接设置和凭证。
在其他选项区域中，选择将所有结果检索到内存选项。
注意
此设置会将整个数据集提取到物理内存中。如果物理内存不足，此设置将根据数据卷和可用物理内存进行更改，您可能需要让 DBA 参与推荐设置。
选择确定以保存连接。

配置 Amazon Redshift 批量连接

要通过“输出数据”工具使用批量连接...

选择写入文件或数据库下拉列表，然后选择其他数据库 > Amazon Redshift 批量。
选择数据源名称（或者选择 ODBC 管理员创建一个）。查看 ODBC 和 OLEDB 数据库连接。
（可选）输入用户名和密码。
在 AmazonS3 区域中，输入或粘贴 AWS 访问密钥和 AWS 密钥以访问要上传的数据。
在密钥加密下拉列表中，选择一个加密选项：
- 隐藏：使用最少的加密隐藏密码。
- 机器加密：计算机上的任何用户都可以完全使用连接。
- 用户加密：登录用户可以在任何计算机上使该连接。
在端点下拉列表中，选择默认值以允许 Amazon 根据您选择的存储桶自动确定端点。要为私人 S3 部署指定一个终端节点，或者如果您知道特定的存储桶区域，则可以选择一个终端节点（S3 区域），输入自定义终端节点，或从从十个先前输入的自定义终端节点中选择一个。
如果您选择的存储桶不在指定的端点区域中，则会发生以下错误：“您尝试访问的存储桶必须使用指定的端点进行寻址。请将以后的所有请求发送到此端点。”选择默认值以清除错误。
（可选）选择使用 Signature V4 进行身份验证，以使用 Signature Version 4 取代默认的 Signature Version 2。这将提高安全性，但连接速度可能会变慢。对于需要 Signature Version 4 的区域，此选项将自动启用。
需要 Signature Version 4 的区域：2014 年 1 月 30 日后创建的区域仅支持 Signature Version 4。这些区域需要 Signature Version 4 的身份验证：
- 美国东部（俄亥俄）地区
- 加拿大（中部）地区
- 亚太地区（孟买）地区
- 亚太地区（首尔）地区
- 欧盟（法兰克福）地区
- 欧盟（伦敦）地区
- 中国（北京）地区
选择一种服务器端加密方法以上传到加密的 Amazon S3 存储桶。如需详细了解 Amazon S3 加密方法，请参阅《Amazon Simple Storage Service 开发人员指南》。
- None (Default)：不使用加密方法。
- SSE-KMS：使用 AWS KMS 托管密钥的服务器端加密。酌情提供 KMS密钥ID。当您选择此方法时，使用 Signature V4 进行身份验证将默认启用。
在存储桶名称中输入存储数据对象的 AWS 存储桶的名称。

酌情选择使用 Redshift Spectrum 连接到 Spectrum 表。

字段映射

将数据批量加载到 Amazon Redshift 时，如果工作流输出中的字段顺序与 Redshift 数据库中的字段顺序不同，则数据将写入不正确的字段。要解决此问题：

选择输出数据工具中的附加字段映射选项来配置它，即使您没有更改默认设置。在输出数据工具的工作流 XML 中，这将填充 <AppendMapping mode="ByName" /> 标记。
将输出选项更改为覆盖表格（删除）。

配置输出选项

您可以选择指定或调整以下 Redshift 选项。如需了解详情，请参阅 Amazon Redshift 数据库开发人员指南。

注意

要使用输出数据工具创建 Spectrum 表，请指定架构和表格名称。

spectrum_schema.tablename

如果未为“分配样式”选择“键”，则忽略“分配键”。如果为“排序样式”选择了“无”，则忽略“排序键”。

主键：为“主键”选择列并调整列的顺序。
分配样式：选择 EVEN、KEY 或 ALL。
分配键：为“分配键”选择一列。
排序样式：选择无、复合或交错。
排序键：为“排序键”选择列并调整列的顺序。
启用 Vacuum 和 Analyze 操作：（仅限批量连接）默认情况下已启用。启用后，在将批量加载 APPEND 至 Redshift 数据库后，将执行 VACUUM 和 ANALYZE 维护命令。
批量加载数据块大小（1 MB 至 102400 MB）：为了提高上传性能，大型文件被拆分为指定整数大小的较小文件（以兆字节为单位）。默认值为 128。
启用反斜杠（\）作为转义字符：（仅限批量连接）默认情况下已启用。启用后，紧邻反斜杠字符的字符将作为列数据加载，即使该字符通常用于特殊用途（如分隔符、引号、嵌入换行符或转义字符）。

重要

标识符在数据库中将折叠成小写。在查询结果中，表格名称和列名称默认以小写形式返回。如需了解详情，请参阅 Amazon 名称和标识符文档。

已知问题

将记录插入 Amazon Redshift 表格时，如果该表格的列包含属性 IDENTITY(seed, step)，则要插入的第一列的值为 Null，而不是传递到输出数据工具的值。
Redshift Server 不支持在单个准备语句中执行多个查询。