Databricks Unity Catalog

Tipo di connessione	ODBC (64 bit)
Requisiti di configurazione del driver	L'host deve essere un nome host del server JDBC/ODBC del cluster Databricks Unity Catalog. Supportato sia per AWS che per Azure.
Tipo di supporto	Lettura e scrittura, In-Database
Convalidato su	Cluster Databricks e SQL Warehouse, driver Simba per Apache Spark 2.6.23

Dettagli driver

L'elaborazione In-Database richiede driver di database a 64 bit.

Strumenti Alteryx utilizzati per Connect

Elaborazione del flusso di lavoro standard

Strumento Dati di input

Elaborazione del flusso di lavoro In-Database

Avviso

Databricks Unity Catalog support is only supported using DCM.

Databricks Unity Catalog is only supported using DSN-less connections.

Writing to Databricks Unity Catalog is only supported using the In-DB tools.

We support MergeInDB for Databricks Unity Catalog, go to Write Data In-DB Tool. Blue icon with floppy disk. Strumento Scrivi dati In-DB

Configurazione dello strumento di input

Lo strumento utilizza la tecnologia di connessione Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog in DCM.

Assicurati che DCM sia abilitato.
Nello strumento di input, seleziona Configura una connessione .
Seleziona la scheda Origini dati .
Seleziona l'opzione Connessione rapida in Databricks Unity Catalog .
DCM Connection Manager è prefiltrato per mostrare solo le connessioni Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog .
Scegli una connessione DCM esistente o seleziona + Nuova per creare una nuova connessione. Vedi di seguito per configurare una nuova connessione con DCM.
Viene caricata la finestra Scegli una tabella o specifica una query per la selezione di tabelle.

Configurazione della connessione In-DB

Apri In-DB Connection Manager .
Seleziona Databricks Unity Catalog nel menu a discesa delle origini dati.
Seleziona Nuova per creare una nuova connessione.
Inserisci un nome in Nome connessione.
Nella scheda Lettura , seleziona Configura connessione per aprire DCM Connection Manager per Databricks Unity Catalog. DCM Connection Manager è prefiltrato per mostrare solo le connessioni Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog .
Seleziona una connessione esistente o fai clic su + Nuova per creare una nuova connessione. Vedi di seguito per configurare una nuova connessione con DCM.
Nella scheda Scrittura, seleziona Configura connessione per aprire DCM Connection Manager per la connessione a Databricks. DCM Connection Manager è prefiltrato per mostrare solo le connessioni Apache Spark ODBC Bulk senza DSN con Simba Databricks Unity Catalog .
Seleziona una connessione esistente o scegli + Nuova per creare una nuova connessione. Vedi di seguito per configurare una nuova connessione con DCM.
Nella scheda Scrittura, seleziona Configura connessione per aprire DCM Connection Manager per la connessione a Delta Lake. DCM Connection Manager è prefiltrato per mostrare solo le connessioni Delta Lake .
Seleziona una connessione esistente o scegli + Nuova per creare una nuova connessione. Vedi di seguito per configurare una nuova connessione con DCM.
Seleziona Applica e OK per salvare la connessione e chiudere la finestra.
Se l'accesso a In-DB Connection Manager è stato eseguito con lo strumento Connetti In-DB, viene caricata la finestra Scegli una tabella o specifica una query per la selezione di tabelle.

Note: Databrick Unity Catalog requires the following permissions for least privileged access to READ:

Information Schema (Default)
USE CATALOG for CATALOG
USE SCHEMA for SCHEMA
BROWSE (Default) for Corresponding tables
SELECT for Corresponding tables

Configurazione di Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog in DCM

Questa connessione viene utilizzata per la lettura dei dati da Databricks Unity Catalog.

Apri Data Connection Manager (DCM) e passa ad Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog ,
- Da uno strumento di input o da In-DB Connection Manager, DCM è pre-filtrato.
- Dal menu File , vai a File > Gestisci connessioni > + Nuova > Apache Spark > Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog .
Inserisci un nome origine dati .
Immetti il nome dell' host Databricks Unity Catalog .
La porta è la 443 per impostazione predefinita. Cambiala se necessario.
Immetti il percorso http. Il percorso http è l'URL delle risorse di elaborazione di Databricks.
Seleziona Salva per salvare l'origine dati.
Seleziona + Connetti credenziale .
- Seleziona un metodo in Metodo di autenticazione .
- Per utilizzare un token di accesso personale, seleziona Nome utente e password come metodo di autenticazione e utilizza il nome utente "token".
- Per utilizzare Azure AD, consulta Autenticazione Azure OAuth di Databricks .
- Seleziona una credenziale esistente o scegli Crea nuova credenziale per creare una nuova credenziale e immetti il token di accesso personale o le informazioni per Azure AD.
Seleziona Collega per collegare la credenziale all'origine dati e scegli Connetti .

Configurazione di Apache Spark ODBC Bulk senza Bulk DSN con Simba Databricks Unity Catalog in DCM

Questa connessione viene utilizzata per la scrittura dei dati in Databricks Unity Catalog.

Apri Data Connection Manager (DCM) e passa ad Apache Spark Bulk ODBC senza DSN con Simba Databricks Unity Catalog .
- Da uno strumento di input o da In-DB Connection Manager, DCM è pre-filtrato.
- Dal menu File , vai a File > Gestisci connessioni > + Nuova > Apache Spark > Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog .
Inserisci un nome origine dati .
Immetti il nome dell' host Databricks Unity Catalog .
La porta è la 443 per impostazione predefinita. Cambiala se necessario.
Immetti il percorso http. Il percorso http è l'URL delle risorse di elaborazione di Databricks.
Immetti il Catalogo . In questo modo viene impostato il catalogo utilizzato per la scrittura dei dati e la creazione di tabelle.
Immetti lo Schema . In questo modo viene impostato lo schema utilizzato per la scrittura dei dati e la creazione di tabelle.
Seleziona Salva per salvare l'origine dati.
Seleziona + Connetti credenziale per aggiungere una credenziale.
- Seleziona un metodo in Metodo di autenticazione .
- Per utilizzare un token di accesso personale, seleziona Nome utente e password come metodo di autenticazione e utilizza il nome utente "token".
- Per utilizzare Azure AD, consulta Autenticazione Azure OAuth di Databricks .
- Seleziona una credenziale esistente o scegli Crea nuova credenziale per creare una nuova credenziale e immetti il token di accesso personale o le informazioni per Azure AD.
Seleziona Collega per collegare la credenziale all'origine dati.
Seleziona Connetti per connetterti.

Configurazione di una connessione Delta Lake in DCM

Questa connessione viene utilizzata per lo staging dei dati in AWS S3 o ADLS.