Databricks

Tipo de soporte: Leer y escribir; En base de datos
Validado en: La versión 2,18 de los bricks; Simba Apache Spark driver 1.00.09
Tipo de conexión: ODBC (32 y 64 bit)
Detalles del conductor: El controlador ODBC se puede descargar aquí.

El procesamiento En base de datos requiere controladores de base de datos de 64 bits.

Requisitos de configuración del controlador:

El host debe ser un host de servidor JDBC/ODBC del clúster de los bricks.

Para obtener un rendimiento óptimo, debe habilitar la opción Fast SQLPrepare dentro de las opciones avanzadas del controlador para permitir que Alteryx recupere los metadatos sin ejecutar una consulta.

Para utilizar Visual Query Builder, seleccione la opción obtener tablas con consulta dentro de las opciones avanzadas del controlador.

Herramientas Alteryx utilizadas para conectar

Detalles adicionales

Si tiene problemas para leer o escribir caracteres Unicode ®, acceda al controlador ODBC de Simba Impala. En opciones avanzadas, seleccione la opción "usar tipos de Unicódigo de SQL".

Soporte de Read

Instale y configure el controlador ODBC de Apache Spark:

  • Tipo de servidor de chispa: Seleccione el tipo de servidor adecuado para la versión de Apache Spark que esté ejecutando. Si está ejecutando Apache Spark 1,1 y posterior, seleccione Apache SparkThriftServer.
  • Mecanismo de autenticación: consulte la guía de instalación descargada con el controlador de chispas Simba Apache para configurar esta configuración basándose en su configuración.

Para configurar las opciones avanzadas del controlador, consulte la guía de instalación descargada con el controlador de chispas Simba Apache.

Soporte de Write

Para flujos de trabajo estándar y en base de datos, utilice el Secuencia de datos en la herramienta para escribir en Bricks. La ayuda de la escritura está vía el cargador a granel de los bricks.

En la ficha administrar conexiones en dB > Write:

  1. Seleccione el cargador a granel de los bricks de los ladrillos (Avro) o el cargador a granel de los bricks (CSV).
  2. Para escribir una tabla con nombres de campo que tengan un total de más de 4000 caracteres, utilice CSV en lugar de Avro.

  3. Seleccione la cadena de conexión desplegable y, a continuación, seleccione nueva conexión de los bricks.
  4. Seleccione un origen de datos ODBC existente o haga clic en administrador de ODBC para crear uno.
  5. Especifique un nombre de usuario y una contraseña. Estos campos no pueden estar en blanco.
  6. Especifique la URL de bricks

    https://ABC-ABC123-123A.Cloud.databricks.com