Apache Spark Direct

Tipo de soporte:	En base de datos
Validado en:	Apache Livy 0,3; Chispa 1,6, 2,0, 2,1, y 2,2 de Apache
Distribuciones validadas en:	Hortonworks 2.6 +; Cloudera 5.7 +
Tipo de conexión:	Servidor Rest/HTML
Detalles del servidor:	La información de descarga de Apache Livy se puede encontrar aquí.

Herramientas Alteryx utilizadas para conectar

Herramienta Conexión en BDD, Secuencia de datos en la herramientay Herramienta de código de chispa de Apache (procesamiento de flujo de trabajo en base de datos)

Detalles adicionales

Conéctese a Apache Spark arrastrando una herramienta Connect in-dB o la herramienta código de chispas de Apache en el lienzo. Cree una nueva conexión Livy usando el controlador de Apache Spark Direct. Utilice las siguientes instrucciones para configurar la conexión.

Configurar la ventana de conexión Livy

Para conectarse al servidor Livy y crear una cadena de conexión Alteryx:

Añada una nueva conexión en-dB, estableciendo el origen de datos en Apache Spark Direct. Para obtener más información sobre la configuración de una conexión en-dB, consulte Herramienta Conexión en BDD.

En la ficha Read, el controlador se bloqueará a Apache Spark Direct. Haga clic en la flecha desplegable cadena de conexión y seleccione nueva conexión de base de datos.

Configure la ventana de conexión Livy .

Configuración del servidor Livy: Seleccione su preferencia de seguridad:

Pruebe la conexión opcionalmente:

Seleccione la versión de Apache Spark utilizada en el clúster.
Seleccione el tipo de conexión Kerberos.
Haga clic en prueba.

Defina el modo de conexión en el idioma de codificación que se usará en la herramienta código de chispas de Apache.

Conexión HDFS

Opciones avanzadas

Versión de Apache Spark	Valor
2,0-2,1	com. Bricks: Spark-avro_ 2.11:3.2.0; com. brickings: Spark-csv_ 2.11:1.5.0
2,2	com. Bricks: Spark-avro_ 2.11:4.0.0; com. brickings: Spark-csv_ 2.11:1.5.0

Seleccione Aceptar para crear la conexión directa de Apache Spark.