Skip to main content

Apache Spark ODBC

接続タイプ

ODBC (64ビット)

ドライバー設定要件

最適なパフォーマンスを得るには、ドライバの高度なオプションでFast SQLPrepareオプションを有効にして、クエリを実行せずにAlteryxがメタデータを取得できるようにする必要があります。

ドライバーの詳細

インデータベース処理には、64ビットのデータベースドライバが必要です。

サポートのタイプ

読み込み&書き込み、インデータベース

検証済み

データベースバージョン: 2.3.1.3.0.1.0-187

ODBCクライアントバージョン: 2.6.18.1030

Simba Athena ODBCドライバーの詳細については、 Simba ODBC のドキュメントを参照してください。

接続に使用する Alteryx ツール

標準的なワークフロー処理

インデータベースのワークフロー処理

Apache Spark ODBCを使用するには、Apache Spark SQLを有効にする必要があります。すべてのHadoopディストリビューションがSparkをサポートしているわけではありません。Apache Spark ODBCを使用して接続できない場合は、Apache Sparkサーバーの正しい設定方法について、Hadoopベンダーに問い合わせてください。

Unicode®文字の読み書きに問題がある場合は、Simba Impala ODBCドライバーにアクセスしてください。[詳細オプション] で、[SQL Unicodeタイプを使用] オプションを選択します。

サポートを読み込む

Apache Spark ODBCドライバーをインストールして設定する:

  • Sparkサーバータイプ : 実行しているApache Sparkのバージョンに適したサーバータイプを選択します。Apache Spark 1.1以降を実行している場合は、Apache SparkThriftServerを選択します。

  • 認証メカニズム : Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照し、お使いのセットアップに基づいてこの設定を行います。

ドライバーの [高度なオプション] をセットアップするには、Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照してください。

書き込みサポート

  • 標準ワークフローとインデータベースワークフローの両方で、 データストリーム入力ツール を使用してApache Sparkに書き込みます。書き込みサポートはHDFS経由です。

制限事項

Clouderaは、Cloudera EnterpriseバージョンCDH 6.0でSpark Thrift JDBC/ODBCサーバーのサポートを終了しました。詳細については、Clouderaドキュメント「 Unsupported Features in CDH 6.0.1 | 6.x | Cloudera Documentation (CDH 6.0.1でサポートされていない機能 | 6.x | Clouderaドキュメント) 」と「 Unsupported Interfaces and Features (サポートされていないインターフェースと機能) 」を参照してください。