Unity Catalog do Databricks

Tipo de conexão	ODBC (64 bits)
Requisitos de configuração do driver	O host deve ser um hostname do Server JDBC/ODBC do cluster do Unity Catalog do Databricks. Compatível com AWS e Azure.
Tipo de suporte	Leitura e gravação; no banco de dados
Validado em	Cluster do Databricks e SQL Warehouse, Driver do Simba Apache Spark 2.6.23

Detalhes do driver

O processamento in-DB requer drivers de banco de dados de 64 bits.

Ferramentas do Alteryx usadas para conexão

Processamento de fluxos de trabalho padrão

Ferramenta Dados de Entrada

Processamento de fluxos de trabalho no banco de dados

Aviso

Databricks Unity Catalog support is only supported using DCM.

Databricks Unity Catalog is only supported using DSN-less connections.

Writing to Databricks Unity Catalog is only supported using the In-DB tools.

We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool. Blue icon with floppy disk. Ferramenta Gravar Dados In-DB

Configurar a ferramenta de entrada

A ferramenta usa a tecnologia de conexão ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks) no DCM.

Certifique-se de que o DCM está habilitado.
Na ferramenta de entrada, selecione Configurar uma conexão.
Selecione a guia Fonte de dados.
Selecione a opção Conexão rápida em Unity Catalog do Databricks.
O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks).
Escolha uma conexão do DCM existente ou clique em + Novo para criar uma nova conexão. Veja abaixo como configurar uma nova conexão usando o DCM.
A janela Escolher tabela ou especificar consulta é carregada e permite a seleção de tabelas.

Configurar conexão in-DB

Abra o Gerenciador de Conexões in-DB.
Selecione Unity Catalog do Databricks no menu suspenso "Fonte de dados".
Clique em Nova para criar uma nova conexão.
Insira um nome de conexão.
Na guia Leitura, selecione Configurar conexão para abrir o Gerenciador de Conexões do DCM para o Unity Catalog do Databricks. O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks).
Selecione uma conexão existente ou clique em + Novo para criar uma nova conexão. Veja abaixo como configurar uma nova conexão usando o DCM.
Na guia "Gravar", selecione Configurar conexão para abrir o Gerenciador de Conexões do DCM para a conexão do Databricks. O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões ODBC do Apache Spark em massa sem DSN com Simba (Unity Catalog do Databricks).
Selecione uma conexão existente ou clique em + Novo para criar uma nova conexão. Veja abaixo como configurar uma nova conexão usando o DCM.
Na guia "Gravar", selecione Configurar conexão para abrir o Gerenciador de Conexões do DCM para a conexão do Delta Lake. O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões do Delta Lake.
Selecione uma conexão existente ou clique em + Novo para criar uma nova conexão. Veja abaixo como configurar uma nova conexão usando o DCM.
Clique em Aplicar e OK para salvar a conexão e fechar a janela.
Se o Gerenciador de Conexões in-DB foi acessado através da ferramenta Conectar In-DB, a janela Escolher tabela ou especificar consulta é carregada e permite a seleção de tabelas.

Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:

Information Schema (Default)
USE CATALOG for CATALOG
USE SCHEMA for SCHEMA
BROWSE (Default) for Corresponding tables
SELECT for Corresponding tables

Configurar ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks) no DCM

Essa conexão é usada para ler dados do Unity Catalog do Databricks.

Abra o Gerenciador de Conexões de Dados e navegue até ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks)
- A partir de uma ferramenta de entrada ou do Gerenciador de Conexões in-DB, o DCM é pré-filtrado
- No menu Arquivo, vá para Arquivo > Gerenciar conexões > + Novo > Apache Spark > ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks)
Insira um Nome da fonte de dados.
Insira o nome do host do Unity Catalog do Databricks.
A porta está definida como 443 por padrão. Altere conforme necessário.
Insira o caminho http. O caminho http é o URL de recursos de computação do Databricks.
Selecione Salvar para salvar a fonte de dados.
Clique em + Conectar credencial.
- Selecione um Método de autenticação.
- Para usar um token de acesso pessoal, selecione Nome de usuário e senha como método de autenticação e escolha "token" como o nome de usuário.
- Para usar o Azure AD, consulte Autenticação OAuth para o Databricks Azure.
- Selecione uma Credencial existente ou clique em Criar nova credencial para criar uma nova credencial e insira o token de acesso pessoal ou as informações para o Azure AD.
Clique em Vincular para vincular a credencial à fonte de dados e clique em Conectar.

Configurar ODBC do Apache Spark em massa sem DSN com Simba (Unity Catalog do Databricks) no DCM

Essa conexão é usada para gravar dados no Unity Catalog do Databricks.

Abra o Gerenciador de Conexões de Dados e navegue até ODBC do Apache Spark em massa sem DSN com Simba (Unity Catalog do Databricks).
- A partir de uma ferramenta de entrada ou do Gerenciador de Conexões in-DB, o DCM é pré-filtrado.
- No menu Arquivo, vá para Arquivo > Gerenciar conexões > + Novo > Apache Spark > ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks).
Insira um Nome da fonte de dados.
Insira o nome do host do Unity Catalog do Databricks.
A porta está definida como 443 por padrão. Altere conforme necessário.
Insira o caminho http. O caminho http é o URL de recursos de computação do Databricks.
Insira o Catálogo. Isso define o catálogo que é usado para gravar dados e criar tabelas.
Insira o Esquema. Isso define o esquema que é usado para gravar dados e criar tabelas.
Selecione Salvar para salvar a fonte de dados.
Selecione + Conectar credencial para adicionar uma credencial.
- Selecione um Método de autenticação.
- Para usar um token de acesso pessoal, selecione Nome de usuário e senha como método de autenticação e escolha "token" como o nome de usuário.
- Para usar o Azure AD, consulte Autenticação OAuth para o Databricks Azure.
- Selecione uma Credencial existente ou clique em Criar nova credencial para criar uma nova credencial e insira o token de acesso pessoal ou as informações para o Azure AD.
Clique em Vincular para vincular a credencial à fonte de dados.
Selecione Conectar para conectar.

Configurar a conexão do Delta Lake no DCM

Essa conexão é usada para preparação de dados no AWS S3 ou ADLS.

Nesta secção: