Apache Spark Su Databricks
Driver Details
Strumenti Alteryx utilizzati per la connessione
Elaborazione del flusso di lavoro nel database
Connettersi ad Apache Spark trascinando uno strumento Connect In-DB o lo strumento Apache Spark Code nell'area di disegno. Crea una nuova connessione a Databricks usando il driver Apache Spark su Databricks. Utilizzare le istruzioni riportate di seguito per configurare la connessione. Per altre informazioni, vedere la documentazione di Databricks.See Databricks documentation for more information.
Configurare la finestra Connessione Databricks
Per connettersi a Databricks e creare una stringa di connessione Alteryx:
- Inserisci il tuo ID account Databricks.
- Incolla il Token Databricks generato nelle impostazioni utente di Databricks. I token possono scadere e revocare.
- Fare clic su Connetti. In Designer visualizza un elenco di cluster Databricks a cui connettersi. Se la connessione non riesce, provare a immettere nuovamente le credenziali.
- Selezionare un cluster Databricks a cui connettersi.
- Selezionare un tipo di sessione . Selezionare una delle opzioni seguenti a seconda del codice che si sta scrivendo:
- Scala
- Python
- R
- Facoltativamente, digitare un nome di esecuzione descrittivo per il processo in modo da poterlo identificare in un secondo momento. I nomi di esecuzione consentono agli utenti di distinguere un processo da un altro sul server. Il nome predefinito è Senza titolo se lasciato vuoto.
- Impostare il timeout in numero di minuti. Questo è il numero di minuti di mancata attività prima dell'arresto del processo. Se si immette 15 minuti, il processo può essere inattivo senza alcuna attività per 15 minuti prima del timeout. Per altre informazioni, vedere la documentazione di Databricks.See Databricks documentation for more information.
- Aggiungere librerie oltre al set di librerie già fornito per scrivere codice personalizzato.
Tipo di file
Descrizione
vaso
Java ARchive
uovo
Formato di distribuzione importabile a file singolo per i progetti correlati a Python
Pipig
Python Package Index è un repository di software per Python
Maven
un repository per file e artefatti.
Cran Pacchetto di file R
Fare clic sull'icona """ per aggiungere una riga. Fare clic su Salva per salvare le impostazioni di configurazione della libreria in un file. Utilizzare l'icona Cartella file per individuare un file di configurazione salvato. Per eliminare una riga, passa il mouse sopra di essa e seleziona l'icona del cestino.
- In Databricks Connectionfare clic su OK .
- In Gestisci connessioni nel databasefare clic su OK per creare una stringa di connessione Alteryx.