Apache Spark Su Databricks

Versione:
2023.1
Last modified: December 08, 2021

Strumenti Alteryx utilizzati per la connessione

Elaborazione del flusso di lavoro nel database

Link
Blue icon with database being plugged in.

Strumento Connetti In-DB

Link
Blue icon with a stream-like object flowing into a database.

Strumento Flusso Di Dati Nello StrumentoData Stream In Tool

Link
Apache Spark Code Tool Icon

Strumento Codice Apache Spark

Connettersi ad Apache Spark trascinando uno strumento Connect In-DB o lo strumento Apache Spark Code nell'area di disegno. Crea una nuova connessione a Databricks usando il driver Apache Spark su Databricks. Utilizzare le istruzioni riportate di seguito per configurare la connessione. Per altre informazioni, vedere la documentazione di Databricks.See Databricks documentation for more information.

Configurare la finestra Connessione Databricks

Per connettersi a Databricks e creare una stringa di connessione Alteryx:

  1. Inserisci il tuo ID account Databricks.
  2. Incolla il Token Databricks generato nelle impostazioni utente di Databricks. I token possono scadere e revocare.
  3. Fare clic su Connetti. In Designer visualizza un elenco di cluster Databricks a cui connettersi. Se la connessione non riesce, provare a immettere nuovamente le credenziali.
  4. Selezionare un cluster Databricks a cui connettersi.
  5. Selezionare un tipo di sessione . Selezionare una delle opzioni seguenti a seconda del codice che si sta scrivendo:
    • Scala
    • Python
    • R
  6. Facoltativamente, digitare un nome di esecuzione descrittivo per il processo in modo da poterlo identificare in un secondo momento. I nomi di esecuzione consentono agli utenti di distinguere un processo da un altro sul server. Il nome predefinito è Senza titolo se lasciato vuoto.
  7. Impostare il timeout in numero di minuti. Questo è il numero di minuti di mancata attività prima dell'arresto del processo. Se si immette 15 minuti, il processo può essere inattivo senza alcuna attività per 15 minuti prima del timeout. Per altre informazioni, vedere la documentazione di Databricks.See Databricks documentation for more information.
  8. Aggiungere librerie oltre al set di librerie già fornito per scrivere codice personalizzato.

     

    Tipo di file

    Descrizione

    vaso

    Java ARchive

    uovo

    Formato di distribuzione importabile a file singolo per i progetti correlati a Python

    Pipig

    Python Package Index è un repository di software per Python

    Maven

    un repository per file e artefatti.

    Cran

    Pacchetto di file R

    Fare clic sull'icona """ per aggiungere una riga. Fare clic su Salva per salvare le impostazioni di configurazione della libreria in un file. Utilizzare l'icona Cartella file per individuare un file di configurazione salvato. Per eliminare una riga, passa il mouse sopra di essa e seleziona l'icona del cestino.

  9. In Databricks Connectionfare clic su OK .
  10. In Gestisci connessioni nel databasefare clic su OK per creare una stringa di connessione Alteryx. 
Questa pagina è stata utile?

Si sono verificati problemi con il tuo prodotto Alteryx? Visita la community Alteryx o contatta il supporto. Non riesci a inviare questo modulo? Inviaci un'e-mail.