Apache Spark en Databricks

Utilice estas instrucciones para saber cómo conectarse a los ladrillos de información y crear una cadena de conexión Alteryx.

Tipo de soporte: En base de datos
Validado en: Apache Spark 2,0, 2,1 y 2,2
Distribuciones validadas en: Databricks
Tipo de conexión: Servidor Rest/HTML
Detalles del servidor: La información de los bricks se puede encontrar aquí.

Herramientas Alteryx utilizadas para conectar

Detalles adicionales

Conéctese a Apache Spark arrastrando una herramienta Connect in-dB o la herramienta código de chispas de Apache en el lienzo. Cree una nueva conexión a los bricks de los metamotores utilizando el controlador Apache Spark en Bricks. Utilice las siguientes instrucciones para configurar la conexión. para obtener más información, consulte la documentación de bricks.

Configurar la ventana de conexión de los bricks

Para conectarse a los bricks de metaAlteryx y crear una cadena de conexión:

  1. Ingrese su ID de cuenta de bricks .
  2. Pegue el token de bricks que generó en la configuración de usuario de bricks. Los tokens pueden caducar y ser revocados.
  3. Haz clic en Conectar. El diseñador muestra una lista de clústeres de bricks para conectarse. Si la conexión no es satisfactoria, intente volver a introducir sus credenciales.
  4. Seleccione un clúster de bricks para conectarse.
  5. Seleccione un tipo de sesión. Seleccione una de las siguientes opciones según el código que esté escribiendo:
    • Scala
    • Python
    • R
  6. Opcionalmente, escriba un nombre de ejecución descriptivo para el trabajo de modo que pueda identificarlo más adelante. Los nombres de ejecución ayudan a los usuarios a distinguir un trabajo de otro en el servidor. El nombre se omite sin título si se deja en blanco.
  7. Configure el tiempo de espera en número de minutos. Este es el número de minutos de no actividad antes de que se detenga el trabajo. Si ingresa 15 minutos, el trabajo puede permanecer inactivo sin ninguna actividad durante 15 minutos antes de que el tiempo salga. para obtener más información, consulte la documentación de bricks.
  8. Añada bibliotecas además del conjunto de bibliotecas que ya está proporcionado para escribir su propio código.

    Tipo de archivo

    Descripción

    Tarro

    Archivo Java

    Huevo

    Formato de distribución importable de un solo archivo para proyectos relacionados con Python

    PyPi

    Python Package index es un repositorio de software para Python

    Maven

    un repositorio para archivos y artefactos.

    Cran

    R paquete de archivos

  9. Haga clic enelicono "+" para agregar una fila. Haga clic en Guardar para guardar la configuración de la biblioteca en un archivo. Utilice el icono de carpeta de archivos para localizar un archivo de configuración guardado. Para eliminar una fila, sitúela sobre ella y, a continuación, seleccione el icono papelera.

  10. En la conexión de bricks, haga clic en Aceptar .
  11. En Administrar conexiones en dB, haga clic en Aceptar para crear una cadena de conexión Alteryx.