Skip to main content

Databricks Unity Catalog

连接类型

ODBC(64 位)

驱动程序配置要求

主机必须是 Databricks Unity Catalog 集群 JDBC/ODBC 服务器主机名。

同时支持 AWS 和 Azure。

支持类型

读取和写入、数据库内

验证版本

Databricks 集群和 SQL Warehouse、Simba Apache Spark 驱动程序 2.6.23

驱动程序详细信息

数据库内处理需要 64 位数据库驱动程序。

用于连接的 Alteryx 工具

标准工作流处理

数据库内工作流处理

注意

Databricks Unity Catalog support is only supported using DCM.

Databricks Unity Catalog is only supported using DSN-less connections.

Writing to Databricks Unity Catalog is only supported using the In-DB tools.

We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool.

配置输入工具

该工具使用 DCM 中的 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接 技术。

  1. 确保 DCM 已启用。

  2. 在输入工具中,选择 设置连接

  3. 选择 数据源 选项卡。

  4. 选择 Databricks Unity Catalog 下的 快速连接 选项。

  5. DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

  6. 选择现有的 DCM 连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。

  7. 选择表格或指定查询 窗口将加载并允许选择表格。

配置库内连接

  1. 打开 库内连接管理器

  2. 在“数据源”下拉列表中选择 Databricks Unity Catalog

  3. 选择 新建 以创建新连接。

  4. 输入连接名称。

  5. 读取 选项卡上,选择 设置连接 以针对 Databricks Unity Catalog 打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

  6. 选择现有连接或点击 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。

  7. 在“写入”选项卡上,选择 设置连接 以针对 Databricks 连接打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接

  8. 选择现有连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。

  9. 在“写入”选项卡上,选择 设置连接 以针对 Delta Lake 连接打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Delta Lake 连接。

  10. 选择现有连接或选择 +新建 以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。

  11. 选择 应用 确定 以保存连接并关闭窗口。

  12. 如果通过库内连接工具来访问库内连接管理器,则 选择表格或指定查询 窗口将加载并允许选择表格。

Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:

  • Information Schema (Default)

  • USE CATALOG for CATALOG

  • USE SCHEMA for SCHEMA

  • BROWSE (Default) for Corresponding tables

  • SELECT for Corresponding tables

在 DCM 中配置“Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接”

此连接用于从 Databricks Unity Catalog 读取数据。

  1. 打开数据连接管理器并导航到 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

    • 从输入工具或库内连接管理器,DCM 已经过预筛选

    • 文件菜单 中,转至 文件 > 管理连接 > +新建 > Apache Spark > Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

  2. 输入 数据源名称

  3. 输入 Databricks Unity Catalog 主机 名称。

  4. 端口默认设置为 443。根据需要进行更改。

  5. 输入 http 路径。http 路径是 Databricks 计算资源 URL。

  6. 选择 保存 以保存数据源。

  7. 选择 +连接凭证

    • 选择 身份验证方法

    • 要使用个人访问令牌,请选择 用户名和密码 作为身份验证方法,并将用户名设为“token”。

    • 要使用 Azure AD,请参阅 Databricks Azure OAuth 身份验证

    • 选择 现有凭据 或选择 创建新凭据 以创建新凭据,然后输入个人访问令牌或 Azure AD 的信息。

  8. 选择 链接 以将凭证链接到数据源,然后选择 连接

在 DCM 中配置“Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接”

此连接用于将数据写入 Databricks Unity Catalog。

  1. 打开数据连接管理器并导航到 Apache Spark - Simba Databricks Unity Catalog ODBC 批量非 DSN 连接

    • 从输入工具或库内连接管理器,DCM 已经过预筛选。

    • 文件菜单 中,转至 文件 > 管理连接 > +新建 > Apache Spark > Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

  2. 输入 数据源名称

  3. 输入 Databricks Unity Catalog 主机 名称。

  4. 端口默认设置为 443。根据需要进行更改。

  5. 输入 http 路径。http 路径是 Databricks 计算资源 URL。

  6. 输入 目录 。这将设置用于写入数据和创建表格的目录。

  7. 输入 架构 。这将设置用于写入数据和创建表格的架构。

  8. 选择 保存 以保存数据源。

  9. 选择 +连接凭证 以添加凭证。

    • 选择 身份验证方法

    • 要使用个人访问令牌,请选择 用户名和密码 作为身份验证方法,并将用户名设为“token”。

    • 要使用 Azure AD,请参阅 Databricks Azure OAuth 身份验证

    • 选择 现有凭据 或选择 创建新凭据 以创建新凭据,然后输入个人访问令牌或 Azure AD 的信息。

  10. 选择 链接 以将凭证链接到数据源。

  11. 选择 连接 以进行连接。

在 DCM 中配置 Delta Lake 连接

此连接用于在 AWS S3 或 ADLS 中暂存数据。

  1. 打开数据连接管理器并导航到 Delta Lake on AWS Delta Lake on Azure

    1. 从输入工具或库内连接管理器,DCM 已经过预筛选。

    2. 文件菜单 中,转至 文件 > 管理连接 > +新建 > Delta Lake > Delta Lake on AWS/Delta Lake on Azure

  2. 对于 Delta Lake on AWS

    1. 输入 数据源名称

    2. 输入 端点 或保留为默认值。使用默认值时,Amazon 根据所选存储桶确定端点。

    3. 除非另有特别说明,否则应确保选中 使用 Signature V4 进行身份验证 。如果未选中,则使用 Signature V2。2014 年 1 月 30 日之后创建的区域仅支持 Signature Version 4。这些区域需要 Signature Version 4 的身份验证:

      • 美国东部(俄亥俄州)地区、

      • 加拿大(中部)地区、

      • 亚太(孟买)地区、

      • 亚太(首尔)地区、

      • 欧盟(法兰克福)地区、

      • 欧盟(伦敦)地区、

      • 中国(北京)地区。

    4. 选择所需的“服务器端加密”级别,默认值为“无”。

      • 无(默认值) :不使用加密方法。

      • SSE-KMS :使用 AWS KMS 托管密钥的服务器端加密。您还可以提供 KMS Key ID 。当您选择此方法时,必须选择 使用 Signature V4 进行身份验证

    5. 输入要用于暂存的 存储桶名称 。用户需要对存储桶具有读、写和删除权限。

  3. 对于 Delta Lake on Azure

    1. 输入 数据源名称 ADLS 容器 存储帐户

    2. 存储临时目录 是可选的。输入临时目录时,不要重复输入容器名称。如果此处输入的目录尚不存在,Alteryx 将创建一个。Alteryx 将使用每个暂存表格的表格名称创建一个子文件夹。

  4. 选择 保存 以保存数据源。

  5. 选择 +连接凭证

    1. 选择 身份验证方法

      • 对于 Delta Lake on AWS,唯一的身份验证方法是 AWS IAM 访问密钥

      • 对于 Delta Lake on Azure,您可以选择 共享访问密钥 Azure AD 身份验证。

    2. 选择 现有凭据 创建新凭据 以创建新凭据。

      • 输入凭证名称和 AWS IAM 访问密钥或 Azure 共享密钥。

  6. 选择 链接 以将凭证链接到数据源。

  7. 选择 连接