Skip to main content

Apache Spark ODBC

Verbindungstyp

ODBC (64 Bit)

Anforderungen an die Treiberkonfiguration

Für eine optimale Leistung müssen Sie die Option „Schnelles SQLPrepare“ in den erweiterten Treiberoptionen aktivieren, damit Alteryx Metadaten abrufen kann, ohne eine Abfrage auszuführen.

Treiberdetails

Die In-DB-Verarbeitung erfordert 64-Bit-Datenbanktreiber.

Typ der Unterstützung

Lesen und Schreiben; In-DB

Validiert auf

Datenbankversion: 2.3.1.3.0.1.0-187

ODBC-Clientversion: 2.6.18.1030

Weitere Informationen zum Simba Athena ODBC-Treiber finden Sie in der Simba ODBC -Dokumentation.

Alteryx-Tools für die Verbindung

Standard-Workflow-Verarbeitung

Eingabedaten-Tool Input Data Tool

Input Data Tool Icon

In-DB-Workflow-Verarbeitung

Blue icon with database being plugged in.
Blue icon with a stream-like object flowing into a database.

Zur Verwendung von Apache Spark ODBC muss Apache Spark SQL aktiviert sein. Nicht alle Hadoop-Distributionen unterstützen Apache Spark. Wenn Sie sich nicht mit Apache Spark ODBC verbinden können, kontaktieren Sie Ihren Hadoop-Anbieter für Anweisungen zur korrekten Einrichtung des Apache Spark-Servers.

Wenn Sie Probleme beim Lesen oder Schreiben von Unicode®-Zeichen haben, greifen Sie auf den Simba Impala ODBC-Treiber zu. Wählen Sie unter „Erweiterte Optionen“ die Option „SQL Unicode-Typen verwenden“ aus.

Unterstützung für Lesen

Installieren und konfigurieren Sie den Apache Spark ODBC-Treiber:

  • Spark-Servertyp : Wählen Sie den passenden Servertyp für die Version von Apache Spark aus, die Sie ausführen. Wenn Sie Apache Spark 1.1 und höher ausführen, wählen Sie den Apache SparkThriftServer aus.

  • Authentifizierungsmechanismus : Im zusammen mit dem Simba Spark-Treiber heruntergeladenen Installationshandbuch finden Sie auf Ihren Einstellungen basierende Informationen zur Konfiguration dieser Einstellung.

Informationen zur Einrichtung der erweiterten Treiberoptionen finden Sie im Installationshandbuch, das Sie mit dem Simba Apache Spark-Treiber heruntergeladen haben.

Unterstützung für Schreiben

  • Verwenden Sie sowohl für Standard- als auch für In-DB-Workflows das Eingehender-Datenstrom-Tool , um in Apache Spark zu schreiben. Schreiben wird über HDFS unterstützt.

Einschränkungen

Cloudera hat die Unterstützung für Spark Thrift JDBC/ODBC-Server mit Cloudera Enterprise Version CDH 6.0 eingestellt. Weitere Informationen finden Sie in der Dokumentation zu Cloudera: Nicht unterstützte Funktionen in CDH 6.0.1 | 6.x | Cloudera-Dokumentation sowie unter Nicht unterstützte Schnittstellen und Funktionen .