Apache Spark ODBC

接続タイプ	ODBC (64ビット)
ドライバー設定要件	最適なパフォーマンスを得るには、ドライバの高度なオプションでFast SQLPrepareオプションを有効にして、クエリを実行せずにAlteryxがメタデータを取得できるようにする必要があります。
ドライバーの詳細	インデータベース処理には、64ビットのデータベースドライバが必要です。
サポートのタイプ	読み込み&書き込み、インデータベース
検証済み	データベースバージョン: 2.3.1.3.0.1.0-187 ODBCクライアントバージョン: 2.6.18.1030

Simba Athena ODBCドライバーの詳細については、 Simba ODBC のドキュメントを参照してください。

接続に使用する Alteryx ツール

標準的なワークフロー処理

データ入力ツール

インデータベースのワークフロー処理

Apache Spark ODBCを使用するには、Apache Spark SQLを有効にする必要があります。すべてのHadoopディストリビューションがSparkをサポートしているわけではありません。Apache Spark ODBCを使用して接続できない場合は、Apache Sparkサーバーの正しい設定方法について、Hadoopベンダーに問い合わせてください。

Unicode®文字の読み書きに問題がある場合は、Simba Impala ODBCドライバーにアクセスしてください。[詳細オプション] で、[SQL Unicodeタイプを使用] オプションを選択します。

サポートを読み込む

Apache Spark ODBCドライバーをインストールして設定する:

Sparkサーバータイプ : 実行しているApache Sparkのバージョンに適したサーバータイプを選択します。Apache Spark 1.1以降を実行している場合は、Apache SparkThriftServerを選択します。
認証メカニズム : Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照し、お使いのセットアップに基づいてこの設定を行います。

ドライバーの [高度なオプション] をセットアップするには、Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照してください。

書き込みサポート

標準ワークフローとインデータベースワークフローの両方で、データストリーム入力ツールを使用してApache Sparkに書き込みます。書き込みサポートはHDFS経由です。

制限事項

Clouderaは、Cloudera EnterpriseバージョンCDH 6.0でSpark Thrift JDBC/ODBCサーバーのサポートを終了しました。詳細については、Clouderaドキュメント「 Unsupported Features in CDH 6.0.1 | 6.x | Cloudera Documentation (CDH 6.0.1でサポートされていない機能 | 6.x | Clouderaドキュメント) 」と「 Unsupported Interfaces and Features (サポートされていないインターフェースと機能) 」を参照してください。