Databricks Unity Catalog

Type de connexion	ODBC (64 bits)
Configuration requise pour le pilote	L'hôte doit correspondre à un nom d'hôte JDBC/ODBC Server du cluster Databricks Unity Catalog. Pris en charge pour AWS et Azure.
Type de prise en charge	Lecture et écriture, En base de données
Validé le	Cluster Databricks et SQL Warehouse, pilote Simba Apache Spark 2.6.23

Détails du pilote

Le traitement dans la base de données nécessite des pilotes de base de données de 64 bits.

Outils Alteryx utilisés pour la connexion

Traitement standard de workflow

Outil Entrée de données

Traitement de workflow en base de données

Avis

Databricks Unity Catalog support is only supported using DCM.

Databricks Unity Catalog is only supported using DSN-less connections.

Writing to Databricks Unity Catalog is only supported using the In-DB tools.

We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool. Blue icon with floppy disk. Outil Écrire des données en BDD

Configuration de l'outil Entrée

L'outil utilise la technologie de connexion Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog dans DCM.

Assurez-vous que DCM est activé.
Dans l'outil Entrée, sélectionnez Configurer une connexion .
Sélectionnez l'onglet Sources de données .
Sélectionnez l'option Connexion rapide sous Databricks Unity Catalog .
Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions à Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog.
Choisissez une connexion DCM existante ou sélectionnez +Nouveau pour créer une nouvelle connexion. Voir ci-dessous pour la configuration d'une nouvelle connexion à l'aide de DCM.
La fenêtre Choisir une table ou Spécifier une requête se charge et permet la sélection de tables.

Configurer une connexion en BDD

Ouvrez le Gestionnaire de connexions en BDD .
Sélectionnez Databricks Unity Catalog dans la liste déroulante Source de données.
Sélectionnez Nouveau pour créer une nouvelle connexion.
Entrez un nom de connexion.
Dans l'onglet Lire , sélectionnez Configurer la connexion pour ouvrir le gestionnaire de connexions DCM pour le Databricks Unity Catalog. Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions à Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog.
Sélectionnez une connexion existante ou cliquez sur +Nouveau pour créer une nouvelle connexion. Voir ci-dessous pour la configuration d'une nouvelle connexion à l'aide de DCM.
Dans l'onglet Écrire, sélectionnez Configurer la connexion pour ouvrir le gestionnaire de connexions DCM pour la connexion Databricks. Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions à Apache Spark ODBC en masse sans DSN avec Simba Databricks Unity Catalog .
Sélectionnez une connexion existante ou sélectionnez +Nouveau pour créer une nouvelle connexion. Voir ci-dessous pour la configuration d'une nouvelle connexion à l'aide de DCM.
Dans l'onglet Écrire, sélectionnez Configuration de la connexion pour ouvrir le gestionnaire de connexion DCM pour la connexion Delta Lake. Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions Delta Lake .
Sélectionnez une connexion existante ou sélectionnez +Nouveau pour créer une nouvelle connexion. Voir ci-dessous pour la configuration d'une nouvelle connexion à l'aide de DCM.
Sélectionnez Appliquer et OK pour enregistrer la connexion et fermer la fenêtre.
Si le gestionnaire de connexions en BDD a été accessible via l'outil Connecter en BDD, la fenêtre Choisir une table ou spécifier la requête se charge et permet la sélection de tables.

Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:

Information Schema (Default)
USE CATALOG for CATALOG
USE SCHEMA for SCHEMA
BROWSE (Default) for Corresponding tables
SELECT for Corresponding tables

Configurer Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog dans DCM

Cette connexion est utilisée pour lire les données issues de Databricks Unity Catalog.

Ouvrez le Gestionnaire de connexion de données et accédez à Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog
- À partir d'un outil d'entrée ou du gestionnaire de connexion en BDD, DCM est pré-filtré
- À partir du menu Fichier , accédez à la section Fichier > Gérer les connexions > +Nouveau > Apache Spark > Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog
Saisissez un nom de source de données .
Entrez le nom d' hôte Databricks Unity Catalog .
Le port est défini par défaut sur 443. Modifiez-le au besoin.
Entrez le chemin http. Le chemin http est l'URL des ressources de calcul Databricks.
Sélectionnez Enregistrer pour enregistrer la source de données.
Sélectionnez +Connecter les informations d'identification .
- Sélectionnez une Méthode d'authentification .
- Pour utiliser un jeton d'accès personnel, sélectionnez Nom d'utilisateur et mot de passe comme méthode d'authentification et définissez le nom d'utilisateur par « jeton ».
- Pour utiliser Azure AD, consultez Authentification Databricks Azure OAuth .
- Sélectionnez des informations d'identification existantes ou sélectionnez Créer Nouvelles informations d'identification pour créer de nouvelles informations d'identification et entrez le jeton d'accès personnel ou les informations pour Azure AD.
Sélectionnez Lier pour lier les informations d'identification à la source de données et sélectionnez Connecter .

Configuration d'Apache Spark ODBC en masse sans DSN avec Simba Databricks Unity Catalog dans DCM

Cette connexion est utilisée pour écrire des données dans Databricks Unity Catalog.

Ouvrez le Gestionnaire de connexions de données et accédez à Apache Spark ODBC en masse avec Simba Databricks Unity Catalog .
- À partir d'un outil Entrée ou Gestionnaire de connexion en DBB, DCM est pré-filtré.
- Dans le menu Fichier , accédez à la section Fichier > Gérer les connexions > +Nouveau > Apache Spark > Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog .
Saisissez un nom de source de données .
Entrez le nom d' hôte Databricks Unity Catalog .
Le port est défini par défaut sur 443. Modifiez-le au besoin.
Entrez le chemin http. Le chemin http est l'URL des ressources de calcul Databricks.
Entrez le Catalogue . Ceci définit le catalogue utilisé pour l'écriture de données et la création de tables.
Entrez le Schéma . Ceci définit le schéma utilisé pour l'écriture de données et la création de tables.
Sélectionnez Enregistrer pour enregistrer la source de données.
Sélectionnez +Connecter les informations d'identification pour ajouter des informations d'identification.
- Sélectionnez une Méthode d'authentification .
- Pour utiliser un jeton d'accès personnel, sélectionnez Nom d'utilisateur et mot de passe comme méthode d'authentification et définissez le nom d'utilisateur par « jeton ».
- Pour utiliser Azure AD, consultez Authentification Databricks Azure OAuth .
- Sélectionnez des informations d'identification existantes ou sélectionnez Créer Nouvelles informations d'identification pour créer de nouvelles informations d'identification et entrez le jeton d'accès personnel ou les informations pour Azure AD.
Sélectionnez Lier pour lier les informations d'identification à la source de données.
Sélectionnez Connecter pour vous connecter.

Configuration de connexion Delta Lake dans DCM

Cette connexion est utilisée pour préparer les données dans AWS S3 ou ADLS.

Dans cette section: