Apache Spark ODBC
接続タイプ | ODBC (64ビット) |
ドライバー設定要件 | 最適なパフォーマンスを得るには、ドライバの高度なオプションでFast SQLPrepareオプションを有効にして、クエリを実行せずにAlteryxがメタデータを取得できるようにする必要があります。 |
ドライバーの詳細 | インデータベース処理には、64ビットのデータベースドライバが必要です。 |
サポートのタイプ | 読み込み&書き込み、インデータベース |
検証済み | データベースバージョン: 2.3.1.3.0.1.0-187 ODBCクライアントバージョン: 2.6.18.1030 |
Simba Athena ODBCドライバーの詳細については、 Simba ODBC のドキュメントを参照してください。
接続に使用する Alteryx ツール
標準的なワークフロー処理
インデータベースのワークフロー処理
Apache Spark ODBCを使用するには、Apache Spark SQLを有効にする必要があります。すべてのHadoopディストリビューションがSparkをサポートしているわけではありません。Apache Spark ODBCを使用して接続できない場合は、Apache Sparkサーバーの正しい設定方法について、Hadoopベンダーに問い合わせてください。
Unicode®文字の読み書きに問題がある場合は、Simba Impala ODBCドライバーにアクセスしてください。[詳細オプション] で、[SQL Unicodeタイプを使用] オプションを選択します。
サポートを読み込む
Apache Spark ODBCドライバーをインストールして設定する:
Sparkサーバータイプ : 実行しているApache Sparkのバージョンに適したサーバータイプを選択します。Apache Spark 1.1以降を実行している場合は、Apache SparkThriftServerを選択します。
認証メカニズム : Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照し、お使いのセットアップに基づいてこの設定を行います。
ドライバーの [高度なオプション] をセットアップするには、Simba Apache Sparkドライバーと共にダウンロードされたインストールガイドを参照してください。
書き込みサポート
標準ワークフローとインデータベースワークフローの両方で、 データストリーム入力ツール を使用してApache Sparkに書き込みます。書き込みサポートはHDFS経由です。
制限事項
Clouderaは、Cloudera EnterpriseバージョンCDH 6.0でSpark Thrift JDBC/ODBCサーバーのサポートを終了しました。詳細については、Clouderaドキュメント「 Unsupported Features in CDH 6.0.1 | 6.x | Cloudera Documentation (CDH 6.0.1でサポートされていない機能 | 6.x | Clouderaドキュメント) 」と「 Unsupported Interfaces and Features (サポートされていないインターフェースと機能) 」を参照してください。