Apache Spark Sur Databricks

Version:
2022.3
Last modified: December 08, 2021

Outils Alteryx utilisés pour la connexion

Traitement de workflow dans la base de données

Link
Blue icon with database being plugged in.

Outil Connecter En BDD

Link
Blue icon with a stream-like object flowing into a database.

Outil Entrée Du Flux De Données

Link
Apache Spark Code Tool Icon

Outil De Code Spark Apache

Connectez-vous à Apache Spark en faisant glisser un outil Connect in-dB ou l'outil Apache Spark code sur le canevas. Créez une nouvelle connexion à Databricks à l'aide du pilote Apache Spark on Databricks. Utilisez les instructions ci-dessous pour configurer la connexion. Voir la documentation Databricks pour plus d'informations.

Configurer la fenêtre de connexion Databricks

Pour vous connecter à Databricks et créer une chaîne de connexion Alteryx:

  1. Entrez votre ID de compte Databricks.
  2. Collez le jeton Databricks que vous avez généré dans vos paramètres d'utilisateur Databricks. Les jetons peuvent expirer et être révoqués.
  3. Cliquez sur Connect. Designer affiche une liste de clusters Databricks auxquels se connecter. Si la connexion n'est pas réussie, essayez de nouveau d'entrer vos informations d'identification.
  4. Sélectionnez un cluster Databricks à qui vous connecter.
  5. Sélectionnez un type de session . Sélectionnez l'une des suivantes selon le code que vous écrivez:
    • Scala
    • Python
    • R
  6. En option, tapez un nom descriptif Run pour le travail afin que vous puissiez l'identifier plus tard. Les noms d'exécution aident les utilisateurs à distinguer un travail d'un autre sur le serveur. Le nom est par défaut à Untitled s'il est laissé vide.
  7. Définir le délai d'arrêt en plusieurs minutes. Il s'agit du nombre de minutes de non-activité avant l'arrêt du travail. Si vous entrez 15 minutes, le travail peut rester inactif sans aucune activité pendant 15 minutes avant qu'il ne soit sorti. Voir la documentation Databricks pour plus d'informations.
  8. Ajoutez des bibliothèques en plus de l'ensemble de bibliothèques qui est déjà fourni pour écrire votre propre code.

     

    Type de fichier

    Description

    Pot

    Java Archive

    oeuf

    Format de distribution importable à fichier unique pour les projets liés à python

    PyPi

    Python package index est un référentiel de logiciels pour Python

    Maven

    un référentiel pour les fichiers et les artefacts.

    CRAN

    R package de fichiers

    Cliquez sur l'icône "+" pour ajouter une ligne. Cliquez sur Enregistrer pour enregistrer les paramètres de configuration de la bibliothèque dans un fichier. Utilisez l'icône du dossier de fichier pour localiser un fichier de configuration enregistré. Pour supprimer une ligne, survolez-la, puis sélectionnez l'icône Corbeille.

  9. Dans Databricks Connection, cliquez sur OK .
  10. Dans Gérer lesconnexions In-DB, cliquez sur OK pour créer une chaîne de connexion Alteryx. 
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.