Apache Spark ODBC

Versione:
2023.1
Last modified: August 11, 2021

For more information about the Simba Spark ODBC driver, see the Installation and Configuration Guide on Simba portal.

Strumenti Alteryx utilizzati per la connessione

Elaborazione del flusso di lavoro standard

Elaborazione del flusso di lavoro nel database

Link
Blue icon with database being plugged in.

Strumento Connetti In-DB

Link
Blue icon with a stream-like object flowing into a database.

Strumento Flusso Di Dati Nello StrumentoData Stream In Tool

Per utilizzare Apache Spark ODBC, è necessario che Apache Spark SQL sia abilitato. Non tutte le distribuzioni Hadoop supportano Apache Spark. Se non è possibile connettersi utilizzando Apache Spark ODBC, contattare il fornitore Hadoop per istruzioni su come configurare correttamente il server Apache Spark.

In caso di problemi con la lettura o la scrittura di caratteri Unicode®, accedere al driver ODBC Simba Impala. In Opzioni avanzate selezionare l'opzione "Usa tipi Unicode SQL".

Leggi il supporto

Installare e configurare il driver ODBC Apache Spark:

  • Tipo di server Spark: Selezionare il tipo di server appropriato per la versione di Apache Spark in esecuzione. Se si esegue Apache Spark 1.1 e versioni successive, selezionare Apache SparkThriftServer.
  • Meccanismo di autenticazione: Vedere la guida all'installazione scaricata con il driver Simba Apache Spark per configurare questa impostazione in base alla configurazione.

Per configurare le opzioni avanzate del driver, vedere la guida all'installazione scaricata con il driver Simba Apache Spark.

Supporto per la scrittura

  • Per i flussi di lavoro standard e nel database, usare lo strumento Flusso di dati nello strumento per scrivere in Apache Spark.For both standard and in-database workflows, use the Data Stream In Tool to write to Apache Spark. Il supporto di scrittura è tramite HDFS.
  • Se si scrive con HDFS Avro, è necessario selezionare l'opzione Porta WebHDFS predefinita (50070) nella finestra delle proprietà Connessione HDFS Avro.

Per scrivere una tabella con nomi di campo per un totale di oltre 4000 caratteri, utilizzare CSV anziché Avro.

Questa pagina è stata utile?

Si sono verificati problemi con il tuo prodotto Alteryx? Visita la community Alteryx o contatta il supporto. Non riesci a inviare questo modulo? Inviaci un'e-mail.