Apache Spark ODBC
连接类型 | ODBC(64 位) |
驱动程序配置要求 | 为获得最佳性能,必须在驱动程序“高级选项”中启用“Fast SQLPrepare”选项,以允许 Alteryx 在不运行查询的情况下检索元数据。 |
驱动程序详细信息 | 数据库内处理需要 64 位数据库驱动程序。 |
支持类型 | 读取和写入,数据库内 |
验证版本 | 数据库版本:2.3.1.3.0.1.0-187 ODBC 客户端版本:2.6.18.1030 |
有关 Simba Athena ODBC 驱动程序的更多信息,请参阅 Simba ODBC 文档。
用于连接的 Alteryx 工具
标准工作流处理
数据库内工作流处理
要使用 Apache Spark ODBC,必须启用 Apache Spark SQL。并非所有 Hadoop 发行版都支持 Apache Spark。如果无法使用 Apache Spark ODBC 进行连接,请联系您的 Hadoop 供应商,获取有关如何正确设置 Apache Spark 服务器的说明。
如果在读写 Unicode® 字符时遇到问题,请访问 Simba Impala ODBC 驱动程序。在“高级选项”下,选择“使用 SQL Unicode 类型”选项。
读取支持
安装并配置 Apache Spark ODBC 驱动程序:
Spark 服务器类型 :为您正在运行的 Apache Spark 版本选择相应的服务器类型。如果运行的是 Apache Spark 1.1 及更高版本,请选择 Apache SparkThriftServer。
身份验证机制 :请参阅随 Simba Apache Spark 驱动程序下载的安装指南,以便根据您的设置进行配置。
要设置驱动程序“高级选项”,请参阅随 Simba Apache Spark 驱动程序下载的安装指南。
写入支持
对于标准工作流和数据库内工作流,使用 数据流传入工具 写入 Apache Spark。通过 HDFS 提供写入支持。
限制
Cloudera 企业版 CDH 6.0 终止了对 Spark Thrift JDBC/ODBC 服务器的支持。更多详细信息,请参阅 Cloudera 文档: CDH 6.0.1 不支持的功能 | 6.x | Cloudera 文档 以及 不支持的界面和功能 。