Databricks

Version:
2023.1
Last modified: August 11, 2021
Driver Configuration Requirements

L’hôte doit correspondre à un nom d’hôte JDBC/ODBC Server du cluster Databricks.

Pour obtenir des performances optimales, vous devez activer l’option Fast SQLPrepare dans les Options avancées du pilote afin de permettre à Alteryx de récupérer les métadonnées sans exécuter une requête.

Pour utiliser le Générateur de requêtes visuelles, sélectionnez l’option Obtenir les tables avec la requête dans les Options avancées du pilote.

Type of Support

Lecture et écriture, En base de données

Validated On

Databricks version 2.18, pilote Simba Apache Spark 2.06.16

Outils Alteryx utilisés pour la connexion

Traitement Workflow standard

Traitement En base de données Workflow

Link
Blue icon with database being plugged in.

Outil Connecter En BDD

Link
Blue icon with a stream-like object flowing into a database.

Outil Entrée Du Flux De Données

Si vous avez des problèmes avec la lecture ou l'écriture de caractères Unicode®, accédez au pilote ODBC Simba Impala. Sous Options avancées, sélectionnez l'option "utiliser les types SQL Unicode".

Prise en charge de la lecture

Installez et configurez le pilote ODBC Apache Spark :

  • Spark Server Type: sélectionnez le type de serveur approprié pour la version d'Apache Spark que vous exécutez. Si vous exécutez Apache Spark 1.1 ou une version ultérieure, sélectionnez Apache SparkThriftServer.
  • Mécanisme d'authentification: consultez le guide d'installation téléchargé avec le pilote Simba Apache Spark pour configurer ce paramètre en fonction de votre configuration.

Pour configurer les options avancées du pilote, consultez le guide d'installation téléchargé avec le pilote Simba Apache Spark.

Prise en charge de l’écriture

Pour les flux de travail standard et En base de données, utilisez Outil Entrée du flux de données pour écrire dans les Databricks. L’écriture est prise en charge grâce au Chargeur en masse Databricks.

Dans l' > onglet gérer l'écriture des connexions dans la base de données

Configurez l'onglet Write

  1. Sélectionnez Databricks Bulk Loader (Avro) ou DatabricksBulk Loader (CSV). Pour écrire une table contenant des noms de champs totalisant plus de 4 000 caractères, utilisez CSV au lieu d’Avro.
  2. Sélectionnez la liste déroulante chaîne de connexion , puis sélectionnez Nouvelle connexion Databricks.
  3. Sélectionnez une source de données ODBC existante ou sélectionnezODBC Admin pour en créer une.
  4. Indiquez un nom d’utilisateur et un mot de passe. Ces champs ne peuvent pas être vides.
  5. Spécifiez l'URL Databricks
    https://abc-abc123-123a.cloud.databricks.com
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.