Skip to main content

Volumi Databricks

Tipo di connessione

ODBC (64 bit)

Requisiti di configurazione del driver

L'host deve essere un nome host del server JDBC/ODBC del cluster Databricks Unity Catalog.

Tipo di supporto

Scrittura In-Database

Convalidato su

Cluster Databricks e SQL Warehouse, driver Simba per Apache Spark 2.6.23.1039

Dettagli driver

L'elaborazione In-Database richiede driver di database a 64 bit.

Strumenti Alteryx utilizzati per Connect

Elaborazione del flusso di lavoro In-Database

Attenzione

  • I volumi Databricks sono supportati solo con DCM.

  • I volumi Databricks sono supportati solo con connessioni senza DSN.

  • I volumi Databricks sono supportati solo per Unity Catalog.

  • La scrittura in Databricks Unity Catalog è supportata solo con gli strumenti In-DB.

  • Alteryx supporta MergeInDB per Databricks Unity Catalog. Vai a Strumento Scrivi dati In-DB.

Configurazione della connessione In-DB

  1. Apri Gestisci connessioni In-DB.

  2. Seleziona Databricks Unity Catalog nel menu a discesa Origini dati.

  3. Seleziona Nuova per creare una nuova connessione.

  4. Inserisci un nome in Nome connessione.

  5. Nella scheda Lettura, seleziona Configura connessione per aprire DCM Connection Manager per Databricks Unity Catalog. DCM Connection Manager è prefiltrato per mostrare solo le connessioni Apache Spark ODBC senza DSN con Simba Databricks Unity Catalog.

  6. Seleziona una connessione esistente o scegli + Nuova per creare una nuova connessione. Accedi a Databricks Unity Catalog per configurare una nuova connessione con DCM.

  7. Nella scheda Scrittura, seleziona Databricks UC Volumes Bulk Loader (Avro) nel menu a discesa.

  8. Seleziona Configura connessione per aprire DCM Connection Manager per la connessione Databricks. DCM Connection Manager è prefiltrato per mostrare solo le connessioni Apache Spark ODBC Bulk senza DSN con Databricks UC Volumes.

  9. Seleziona una connessione esistente o scegli + Nuova per creare una nuova connessione. Vedi di seguito per configurare una nuova connessione con DCM.

  10. Seleziona Applica e OK per salvare la connessione e chiudere la finestra.

  11. Se l'accesso a In-DB Connection Manager è stato eseguito con lo strumento Connetti In-DB, viene caricata la finestra Scegli una tabella o specifica una query per la selezione di tabelle.

Configurazione di Apache Spark ODBC Bulk senza DSN con Databricks UC Volumes in DCM

Questa connessione viene utilizzata per la scrittura dei dati in Databricks Unity Catalog tramite lo staging dei volumi.

  1. Apri Data Connection Manager e vai a Apache Spark ODBC Bulk senza DSN con Databricks UC Volumes.

    - Da uno strumento di input o da In-DB Connection Manager, DCM è pre-filtrato.

    - Dal menu File, vai a File > Gestisci connessioni > + Nuova > Apache Spark > Apache Spark ODBC Bulk senza DSN con Databricks UC Volumes.

  2. Inserisci un nome origine dati.

  3. Immetti il nome dell'host Databricks Unity Catalog.

  4. La porta è la 443 per impostazione predefinita. Cambiala se necessario.

  5. Immetti il percorso http. Il percorso http è l'URL delle risorse di elaborazione di Databricks.

  6. Immetti il Catalogo. In questo modo viene impostato il catalogo utilizzato per la scrittura dei dati e la creazione di tabelle.

  7. Immetti lo Schema. In questo modo viene impostato lo schema utilizzato per la scrittura dei dati e la creazione di tabelle.

  8. Immetti il percorso completo per il volume Databricks nel formato /Volumes/<catalog>/<schema>/<volume>/<path/to/folder>.

  9. Seleziona Salva per salvare l'origine dati.

  10. Seleziona + Connetti credenziale per aggiungere una credenziale.

    1. Seleziona un metodo in Metodo di autenticazione.

    2. Per utilizzare un token di accesso personale, seleziona Nome utente e password come metodo di autenticazione e utilizza il nome utente "token".

    3. Per utilizzare Azure AD, consulta Autenticazione Oauth di Azure Databricks.

    4. Seleziona una credenziale esistente o scegli Crea nuova credenziale per creare una nuova credenziale e immetti il token di accesso personale o le informazioni per Azure AD.

  11. Seleziona Collega per collegare la credenziale all'origine dati.

  12. Seleziona Connetti.