Apache Spark Sur Databricks
Driver Details
Outils Alteryx utilisés pour la connexion
Traitement de workflow dans la base de données
Connectez-vous à Apache Spark en faisant glisser un outil Connect in-dB ou l'outil Apache Spark code sur le canevas. Créez une nouvelle connexion à Databricks à l'aide du pilote Apache Spark on Databricks. Utilisez les instructions ci-dessous pour configurer la connexion. Voir la documentation Databricks pour plus d'informations.
Configurer la fenêtre de connexion Databricks
Pour vous connecter à Databricks et créer une chaîne de connexion Alteryx:
- Entrez votre ID de compte Databricks.
- Collez le jeton Databricks que vous avez généré dans vos paramètres d'utilisateur Databricks. Les jetons peuvent expirer et être révoqués.
- Cliquez sur Connect. Designer affiche une liste de clusters Databricks auxquels se connecter. Si la connexion n'est pas réussie, essayez de nouveau d'entrer vos informations d'identification.
- Sélectionnez un cluster Databricks à qui vous connecter.
- Sélectionnez un type de session . Sélectionnez l'une des suivantes selon le code que vous écrivez:
- Scala
- Python
- R
- En option, tapez un nom descriptif Run pour le travail afin que vous puissiez l'identifier plus tard. Les noms d'exécution aident les utilisateurs à distinguer un travail d'un autre sur le serveur. Le nom est par défaut à Untitled s'il est laissé vide.
- Définir le délai d'arrêt en plusieurs minutes. Il s'agit du nombre de minutes de non-activité avant l'arrêt du travail. Si vous entrez 15 minutes, le travail peut rester inactif sans aucune activité pendant 15 minutes avant qu'il ne soit sorti. Voir la documentation Databricks pour plus d'informations.
- Ajoutez des bibliothèques en plus de l'ensemble de bibliothèques qui est déjà fourni pour écrire votre propre code.
Type de fichier
Description
Pot
Java Archive
oeuf
Format de distribution importable à fichier unique pour les projets liés à python
PyPi
Python package index est un référentiel de logiciels pour Python
Maven
un référentiel pour les fichiers et les artefacts.
CRAN R package de fichiers
Cliquez sur l'icône "+" pour ajouter une ligne. Cliquez sur Enregistrer pour enregistrer les paramètres de configuration de la bibliothèque dans un fichier. Utilisez l'icône du dossier de fichier pour localiser un fichier de configuration enregistré. Pour supprimer une ligne, survolez-la, puis sélectionnez l'icône Corbeille.
- Dans Databricks Connection, cliquez sur OK .
- Dans Gérer lesconnexions In-DB, cliquez sur OK pour créer une chaîne de connexion Alteryx.