Databricks Unity Catalog
连接类型 | ODBC(64 位) |
驱动程序配置要求 | 主机必须是 Databricks Unity Catalog 集群 JDBC/ODBC 服务器主机名。 同时支持 AWS 和 Azure。 |
支持类型 | 读取和写入、数据库内 |
验证版本 | Databricks 集群和 SQL Warehouse、Simba Apache Spark 驱动程序 2.6.23 |
驱动程序详细信息
数据库内处理需要 64 位数据库驱动程序。
用于连接的 Alteryx 工具
标准工作流处理
数据库内工作流处理
注意
Databricks Unity Catalog support is only supported using DCM.
Databricks Unity Catalog is only supported using DSN-less connections.
Writing to Databricks Unity Catalog is only supported using the In-DB tools.
We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool.
配置输入工具
该工具使用 DCM 中的 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接 技术。
确保 DCM 已启用。
在输入工具中,选择 设置连接 。
选择 数据源 选项卡。
选择 Databricks Unity Catalog 下的 快速连接 选项。
DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接 。
选择现有的 DCM 连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。
选择表格或指定查询 窗口将加载并允许选择表格。
配置库内连接
打开 库内连接管理器 。
在“数据源”下拉列表中选择 Databricks Unity Catalog 。
选择 新建 以创建新连接。
输入连接名称。
在 读取 选项卡上,选择 设置连接 以针对 Databricks Unity Catalog 打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接 。
选择现有连接或点击 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。
在“写入”选项卡上,选择 设置连接 以针对 Databricks 连接打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接 。
选择现有连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。
在“写入”选项卡上,选择 设置连接 以针对 Delta Lake 连接打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Delta Lake 连接。
选择现有连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。
选择 应用 和 确定 以保存连接并关闭窗口。
如果通过库内连接工具来访问库内连接管理器,则 选择表格或指定查询 窗口将加载并允许选择表格。
Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:
Information Schema (Default)
USE CATALOG for CATALOG
USE SCHEMA for SCHEMA
BROWSE (Default) for Corresponding tables
SELECT for Corresponding tables
在 DCM 中配置“Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接”
此连接用于从 Databricks Unity Catalog 读取数据。
打开数据连接管理器并导航到 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接
从输入工具或库内连接管理器,DCM 已经过预筛选
从 文件菜单 中,转至 文件 > 管理连接 > +新建 > Apache Spark > Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接
输入 数据源名称 。
输入 Databricks Unity Catalog 主机 名称。
端口默认设置为 443。根据需要进行更改。
输入 http 路径。http 路径是 Databricks 计算资源 URL。
选择 保存 以保存数据源。
选择 +连接凭证 。
选择 身份验证方法 。
要使用个人访问令牌,请选择 用户名和密码 作为身份验证方法,并将用户名设为“token”。
要使用 Azure AD,请参阅 Databricks Azure OAuth 身份验证 。
选择 现有凭据 或选择 创建新凭据 以创建新凭据,然后输入个人访问令牌或 Azure AD 的信息。
选择 链接 以将凭证链接到数据源,然后选择 连接 。
在 DCM 中配置“Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接”
此连接用于将数据写入 Databricks Unity Catalog。
打开数据连接管理器并导航到 Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接 。
从输入工具或库内连接管理器,DCM 已经过预筛选。
从 文件菜单 中,转至 文件 > 管理连接 > +新建 > Apache Spark > Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接 。
输入 数据源名称 。
输入 Databricks Unity Catalog 主机 名称。
端口默认设置为 443。根据需要进行更改。
输入 http 路径。http 路径是 Databricks 计算资源 URL。
输入 目录 。这将设置用于写入数据和创建表格的目录。
输入 架构 。这将设置用于写入数据和创建表格的架构。
选择 保存 以保存数据源。
选择 +连接凭证 以添加凭证。
选择 身份验证方法 。
要使用个人访问令牌,请选择 用户名和密码 作为身份验证方法,并将用户名设为“token”。
要使用 Azure AD,请参阅 Databricks Azure OAuth 身份验证 。
选择 现有凭据 或选择 创建新凭据 以创建新凭据,然后输入个人访问令牌或 Azure AD 的信息。
选择 链接 以将凭证链接到数据源。
选择 连接 以进行连接。
在 DCM 中配置 Delta Lake 连接
此连接用于在 AWS S3 或 ADLS 中暂存数据。
打开数据连接管理器并导航到 Delta Lake on AWS 或 Delta Lake on Azure
从输入工具或库内连接管理器,DCM 已经过预筛选。
从 文件菜单 中,转至 文件 > 管理连接 > +新建 > Delta Lake > Delta Lake on AWS/Delta Lake on Azure 。
对于 Delta Lake on AWS
输入 数据源名称 。
输入 端点 或保留为默认值。使用默认值时,Amazon 根据所选存储桶确定端点。
除非另有特别说明,否则应确保选中 使用 Signature V4 进行身份验证 。如果未选中,则使用 Signature V2。2014 年 1 月 30 日之后创建的区域仅支持 Signature Version 4。这些区域需要 Signature Version 4 的身份验证:
美国东部(俄亥俄州)地区、
加拿大(中部)地区、
亚太(孟买)地区、
亚太(首尔)地区、
欧盟(法兰克福)地区、
欧盟(伦敦)地区、
中国(北京)地区。
选择所需的“服务器端加密”级别,默认值为“无”。
无(默认值) :不使用加密方法。
SSE-KMS :使用 AWS KMS 托管密钥的服务器端加密。您还可以提供 KMS Key ID 。当您选择此方法时,必须选择 使用 Signature V4 进行身份验证 。
输入要用于暂存的 存储桶名称 。用户需要对存储桶具有读、写和删除权限。
对于 Delta Lake on Azure
输入 数据源名称 、 ADLS 容器 和 存储帐户 。
存储临时目录 是可选的。输入临时目录时,不要重复输入容器名称。如果此处输入的目录尚不存在,Alteryx 将创建一个。Alteryx 将使用每个暂存表格的表格名称创建一个子文件夹。
选择 保存 以保存数据源。
选择 +连接凭证 。
选择 身份验证方法 。
对于 Delta Lake on AWS,唯一的身份验证方法是 AWS IAM 访问密钥 。
对于 Delta Lake on Azure,您可以选择 共享访问密钥 或 Azure AD 身份验证。
选择 现有凭据 或 创建新凭据 以创建新凭据。
输入凭证名称和 AWS IAM 访问密钥或 Azure 共享密钥。
选择 链接 以将凭证链接到数据源。
选择 连接 。