Apache Spark ODBC

Version:
2022.3
Last modified: August 11, 2021

For more information about the Simba Spark ODBC driver, see the Installation and Configuration Guide on Simba portal.

Outils Alteryx utilisés pour la connexion

    Traitement standard de workflow

    Traitement de workflow en base de données

    Link
    Blue icon with database being plugged in.

    Outil Connecter En BDD

    Link
    Blue icon with a stream-like object flowing into a database.

    Outil Entrée Du Flux De Données

    Pour utiliser Apache Spark ODBC, vous devez avoir activé Apache Spark SQL. Toutes les distributions Hadoop ne supportent pas Apache Spark. Si vous ne parvenez pas à vous connecter à l'aide d'Apache Spark ODBC, contactez votre fournisseur Hadoop pour savoir comment configurer le serveur Apache Spark correctement.

    Si vous avez des problèmes avec la lecture ou l'écriture de caractères Unicode ®, accédez au pilote ODBC Simba Impala. Sous Options avancées, sélectionnez l'option "utiliser les types Unicode SQL".

    Prise en charge de la lecture

    Installez et configurez le pilote Apache Spark ODBC:

    • Type de serveur Spark: Sélectionnez le type de serveur approprié pour la version d'Apache Spark que vous exécutez. Si vous exécutez Apache Spark 1,1 et ultérieur, sélectionnez Apache SparkThriftServer.
    • Mécanisme d'authentification: Consultez le guide d'installation téléchargé avec le pilote Simba Apache Spark pour configurer ce paramètre en fonction de votre configuration.

    Pour configurer les options avancées du pilote, reportez-vous au Guide d'installation téléchargé avec le pilote d'allumage Simba Apache.

    Prise en charge de l’écriture

      • Pour les flux de travail standard et dans la base de données, utilisez le data Stream In Tool pour écrire à Apache Spark. Prise en charge en écriture via HDFS.
      • Si vous écrivez avec HDFS Avro, vous devez sélectionner l'option de port Par défaut WebHDFS (50070) dans la fenêtre HDFS Avro Connection properties.

      Pour écrire une table contenant des noms de champs totalisant plus de 4 000 caractères, utilisez CSV au lieu d’Avro.

      Cette page vous a-t-elle été utile ?

      Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.