Apache Spark Direct

Prise en charge : En base de données
Validé le : Apache livy 0,3; Apache Spark 1,6, 2,0, 2,1 et 2,2
Distributions validées le : Hortonworks 2.6+; Cloudera 5.7+
Type de connexion : Serveur REST/HTML
Détails du serveur : Apache livy télécharger des informations peuvent être trouvées ici.

Outils Alteryx utilisés pour la connexion

Détails supplémentaires

Connectez-vous à Apache Spark en faisant glisser un outil Connect in-dB ou l'outil Apache Spark code sur le canevas. Créez une nouvelle connexion livy à l'aide du pilote Apache Spark direct. Utilisez les instructions ci-dessous pour configurer la connexion.

Configurer la fenêtre de connexion livy

Pour vous connecter au serveur livy et créer une chaîne de connexion Alteryx:

Ajoutez une nouvelle connexion in-dB, en définissant la source de données sur Apache Spark direct. Pour plus d'informations sur la configuration d'une connexion in-dB, voir Outil Connecter en BDD.

Sur l' onglet lire, le pilote sera verrouillé à Apache Spark direct. Cliquez sur la flèche déroulante chaîne de connexion et sélectionnez nouvelle connexion de base de données.

Configurez la fenêtre de connexion livy .

Configuration du serveur livy: sélectionnez votre préférence de sécurité:

À titre facultatif, testez la connexion :

  • Sélectionnez la version Apache Spark utilisée sur votre cluster.
  • Sélectionnez le type de connexion Kerberos.
  • Cliquez sur test.

Réglez le mode de connexion sur le langage de codage à utiliser dans l'outil Apache Spark code.

Sélectionnez OK pour créer votre connexion Apache Spark direct.