Databricks Unity Catalog

Verbindungstyp	ODBC (64 Bit)
Anforderungen an die Treiberkonfiguration	Der Host muss ein JDBC/ODBC-Serverhostname des Databricks Unity Catalog-Clusters sein. Unterstützt sowohl unter AWS als auch unter Azure.
Typ der Unterstützung	Lesen und Schreiben; In-DB
Validiert am	Databricks Cluster und SQL Warehouse, Simba Apache Spark Driver 2.6.23

Treiberdetails

Die In-DB-Verarbeitung erfordert 64-Bit-Datenbanktreiber.

Alteryx-Tools für die Verbindung

Standard-Workflow-Verarbeitung

Eingabedaten-Tool

In-DB-Workflow-Verarbeitung

Hinweis

Databricks Unity Catalog support is only supported using DCM.

Databricks Unity Catalog is only supported using DSN-less connections.

Writing to Databricks Unity Catalog is only supported using the In-DB tools.

We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool. Blue icon with floppy disk. In-DB-Daten-schreiben-Tool

Eingabe-Tool konfigurieren

Das Tool verwendet Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog Verbindungstechnologie in DCM.

Stellen Sie sicher, dass DCM aktiviert ist.
Wählen Sie im Eingabe-Tool die Option Eine Verbindung einrichten aus.
Wählen Sie die Registerkarte Datenquellen aus.
Wählen Sie die Option Schnellverbindung unter Databricks Unity Catalog aus.
Der DCM Connection Manager ist so vorgefiltert, dass nur Verbindungen vom Typ Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog angezeigt werden.
Wählen Sie eine vorhandene DCM-Verbindung aus, oder erstellen Sie mit +Neu eine neue Verbindung. Informationen zum Konfigurieren einer neuen Verbindung mit DCM finden Sie weiter unten.
Das Fenster Tabelle auswählen oder Abfrage angeben wird geladen und ermöglicht es Ihnen, Tabellen auszuwählen.

In-DB-Verbindung konfigurieren

Öffnen Sie den In-DB-Verbindungsmanager .
Wählen Sie Databricks Unity Catalog im Dropdown Datenquelle aus.
Wählen Sie Neu aus, um eine neue Verbindung zu erstellen.
Geben Sie einen Verbindungsnamen ein.
Wählen Sie auf der Registerkarte Lesen die Option Verbindung einrichten aus, um den DCM-Verbindungsmanager für Databricks Unity Catalog zu öffnen. Der DCM Connection Manager ist so vorgefiltert, dass nur Verbindungen vom Typ Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog angezeigt werden.
Wählen Sie eine vorhandene Verbindung aus, oder klicken Sie auf +Neu , um eine neue Verbindung zu erstellen. Informationen zum Konfigurieren einer neuen Verbindung mit DCM finden Sie weiter unten.
Wählen Sie auf der Registerkarte „Schreiben“ die Option Verbindung einrichten aus, um den DCM-Verbindungsmanager für die Databricks-Verbindung zu öffnen. Der DCM Connection Manager ist so vorgefiltert, dass nur Verbindungen vom Typ Apache Spark ODBC Bulk ohne DSN mit Simba Databricks Unity Catalog angezeigt werden.
Wählen Sie eine vorhandene Verbindung aus, oder erstellen Sie mit +Neu eine neue Verbindung. Informationen zum Konfigurieren einer neuen Verbindung mit DCM finden Sie weiter unten.
Wählen Sie auf der Registerkarte Schreiben die Option Verbindung einrichten aus , um den DCM Connection Manager für die Delta Lake-Verbindung zu öffnen. Der DCM Connection Manager ist so vorgefiltert, dass nur Delta Lake -Verbindungen angezeigt werden.
Wählen Sie eine vorhandene Verbindung aus, oder erstellen Sie mit +Neu eine neue Verbindung. Informationen zum Konfigurieren einer neuen Verbindung mit DCM finden Sie weiter unten.
Wählen Sie Anwenden und OK aus, um die Verbindung zu speichern und das Fenster zu schließen.
Wenn über das In-DB-verbinden-Tool auf den In-DB-Connections Manager zugegriffen wurde, wird das Fenster Tabelle auswählen oder Abfrage angeben geladen ermöglicht es Ihnen, Tabellen auszuwählen.

Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:

Information Schema (Default)
USE CATALOG for CATALOG
USE SCHEMA for SCHEMA
BROWSE (Default) for Corresponding tables
SELECT for Corresponding tables

Konfigurieren von Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog in DCM

Diese Verbindung wird zum Lesen von Daten aus Databricks Unity Catalog verwendet.

Öffnen Sie Data Connection Manager und navigieren Sie zu Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog
- Über ein Eingabe-Tool oder den In-DB Connection Manager wird DCM vorgefiltert
- Gehen Sie im Dateimenü auf Datei > Verbindungen verwalten > +Neu > Apache Spark > Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog
Geben Sie einen Datenquellennamen ein.
Geben Sie den Hostnamen für Databricks Unity Catalog ein.
Der Port ist standardmäßig auf 443 gesetzt. Bei Bedarf ändern.
Geben Sie den HTTP-Pfad ein. Der HTTP-Pfad ist die URL für die Computing-Ressourcen von Databricks.
Wählen Sie Speichern aus, um die Datenquelle zu speichern.
Wählen Sie +Anmeldedaten verbinden aus.
- Wählen Sie eine Authentifizierungsmethode aus.
- Um ein persönliches Zugriffstoken zu verwenden, wählen Sie Benutzername und Kennwort als Authentifizierungsmethode aus. Setzen Sie den Benutzernamen auf „Token“.
- Informationen zur Verwendung von Azure AD finden Sie unter Databricks Azure OAuth-Authentifizierung .
- Wählen Sie Vorhandene Anmeldedaten aus, oder nutzen Sie neue Anmeldedaten erstellen und geben Sie das persönliche Zugriffstoken bzw. die Informationen für Azure AD ein.
Wählen Sie Verknüpfen aus, um die Anmeldedaten mit der Datenquelle zu verknüpfen, und wählen Sie dann Verbinden aus.

Konfigurieren von Apache Spark ODBC Bulk ohne DSN mit Simba Databricks Unity Catalog in DCM

Diese Verbindung wird zum Schreiben von Daten in Databricks Unity Catalog verwendet.

Öffnen Sie Data Connection Manager und navigieren Sie zu Apache Spark ODBC Bulk ohne DSN mit Simba Databricks Unity Catalog .
- Über ein Eingabe-Tool oder den In-DB Connection Manager wird DCM vorgefiltert.
- Gehen Sie im Dateimenü auf Datei > Verbindungen verwalten > +Neu > Apache Spark > Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog .
Geben Sie einen Datenquellennamen ein.
Geben Sie den Hostnamen für Databricks Unity Catalog ein.
Der Port ist standardmäßig auf 443 gesetzt. Bei Bedarf ändern.
Geben Sie den HTTP-Pfad ein. Der HTTP-Pfad ist die URL für die Computing-Ressourcen von Databricks.
Geben Sie den Katalog ein. Legt den Katalog fest, der zum Schreiben von Daten und Erstellen von Tabellen verwendet wird.
Geben Sie das Schema ein. Legt das Schema fest, das zum Schreiben von Daten und Erstellen von Tabellen verwendet wird.
Wählen Sie Speichern aus, um die Datenquelle zu speichern.
Wählen Sie +Anmeldedaten verbinden aus, um Anmeldedaten hinzuzufügen.
- Wählen Sie eine Authentifizierungsmethode aus.
- Um ein persönliches Zugriffstoken zu verwenden, wählen Sie Benutzername und Kennwort als Authentifizierungsmethode aus. Setzen Sie den Benutzernamen auf „Token“.
- Informationen zur Verwendung von Azure AD finden Sie unter Databricks Azure OAuth-Authentifizierung .
- Wählen Sie Vorhandene Anmeldedaten aus, oder nutzen Sie neue Anmeldedaten erstellen und geben Sie das persönliche Zugriffstoken bzw. die Informationen für Azure AD ein.
Wählen Sie Verknüpfen aus, um die Anmeldedaten mit der Datenquelle zu verknüpfen.
Wählen Sie Verbinden aus, um eine Verbindung herzustellen.

Konfigurieren der Delta Lake-Verbindung in DCM

Diese Verbindung wird für das Staging von Daten in AWS S3 oder ADLS verwendet.

In diesem Abschnitt: