Lo Strumento Codice di Apache Spark è un editor di codice che crea un contesto Apache Spark ed esegue i comandi Apache Spark direttamente da Alteryx Designer. Questo strumento utilizza il linguaggio di programmazione R.
Per ulteriori informazioni, consulta Apache Spark Direct, Apache Spark on Databricks e Apache Spark su Microsoft Azure HDInsight.
Connettiti direttamente al cluster Apache Spark.
Trascina uno Strumento Connetti In-DB o uno Strumento Flusso di dati in entrata sull'area di disegno.
Seleziona la freccia del menu a discesa Nome connessione e scegli Gestisci connessione.
In alternativa, collegati direttamente allo Strumento Codice di Apache Spark.
Trascina lo strumento Codice di Apache Spark sull'area di disegno.
In Connessione dati, seleziona la freccia del menu a discesa Nome connessione e seleziona Gestisci connessione.
Entrambi i metodi visualizzano la finestra Gestisci connessioni In-DB. In Gestisci connessioni In-DB, seleziona un'origine dati.
Una volta stabilita una connessione Apache Spark Direct, si attiva l'editor di codice. Utilizza Inserisci codice per generare funzioni di modello nell'editor di codice.
Importa libreria crea un'istruzione di importazione.
import package
Leggi dati crea una funzione readAlteryxData per restituire i dati in entrata come Apache SparkSQL DataFrame.
valdataFrame = readAlteryxData(1)
Scrivi dati crea una funzione writeAlteryxData per generare un dataframe Apache SparkSQL.
writeAlteryxData(dataFrame, 1)
Messaggio log crea una funzione logAlteryxMessage per scrivere una stringa nel log come messaggio.
logAlteryxMessage("Example message")
Avviso log crea una funzione logAlteryxWarning per scrivere una stringa nel log come avviso.
logAlteryxWarning("Example warning")
Errore log crea una funzione logAlteryxError per scrivere una stringa nel log come errore.
logAlteryxError("Example error")
Importa libreria crea un'istruzione di importazione.
from module import library
Leggi dati crea una funzione readAlteryxData per restituire i dati in entrata come Apache SparkSQL DataFrame.
dataFrame= readAlteryxData(1)
Scrivi dati crea una funzione writeAlteryxData per generare un dataframe Apache SparkSQL.
writeAlteryxData(dataFrame, 1)
Messaggio log crea una funzione logAlteryxMessage per scrivere una stringa nel log come messaggio.
logAlteryxMessage("Example message")
Avviso log crea una funzione logAlteryxWarning per scrivere una stringa nel log come avviso.
logAlteryxWarning("Example warning")
Errore log crea una funzione logAlteryxError per scrivere una stringa nel log come errore.
logAlteryxError("Example error")
Importa libreria crea un'istruzione di importazione.
library(jsonlite)
Leggi dati crea una funzione readAlteryxData per restituire i dati in entrata come Apache SparkSQL DataFrame.
dataFrame<- readAlteryxData(1)
Scrivi dati crea una funzione writeAlteryxData per generare un dataframe Apache SparkSQL.
writeAlteryxData(dataFrame, 1)
Messaggio log crea una funzione logAlteryxMessage per scrivere una stringa nel log come messaggio.
logAlteryxMessage("Example message")
Avviso log crea una funzione logAlteryxWarning per scrivere una stringa nel log come avviso.
logAlteryxWarning("Example warning")
Errore log crea una funzione logAlteryxError per scrivere una stringa nel log come errore.
logAlteryxError("Example error")
Utilizza Importa codice per inserire il codice creato esternamente.
Da file apre un file Explorer da sfogliare per cercare il file.
Da Jupyter Notebook apre un file Explorer da sfogliare per cercare il file.
Da URL fornisce un campo per digitare o incollare una posizione del file.
Seleziona l'icona a forma di ingranaggio per modificare gli aspetti estetici dell'editor di codice.
Utilizza i pulsanti Dimensione testo per aumentare o ridurre le dimensioni del testo nell'editor.
Utilizza Tema colore per alternare tra uno schema di colori scuro e uno chiaro.
Seleziona Manda a capo le righe lunghe consente di visualizzare righe lunghe all'interno della finestra dell'editor di codice anziché richiedere uno scorrimento orizzontale.
Seleziona Mostra numeri linea per visualizzare i numeri di linea per l'editor.
Seleziona il canale di output che desideri gestire. Modifica manualmente il tipo di dati Apache Spark Data dei dati esistenti.
Seleziona l'icona Più per aggiungere una riga.
Immetti il Nome campo.
Seleziona il tipo di dati Apache Spark .
Immetti la Dimensione in bit.