Apache Sparkコードツールは、Apache Sparkコンテキストを作成し、Alteryx Designerから直接Apache Sparkコマンドを実行するコードエディターです。このツールはRプログラミング言語を使用します。
詳細については、Apache Spark Direct、Apache Spark on Databricks、Apache Spark on Microsoft Azure HDInsightを参照してください。
Apache Spark クラスターに直接接続します。
接続In-DBツールまたはデータストリーム入力ツールをキャンバスにドラッグします。
[接続名]ドロップダウン矢印を選択して、[接続の管理]を選択します。
Apache Sparkコードツールと直接接続します。
Apache Sparkコードツールをキャンバス上にドラッグします。
[データ接続]で、[接続名]ドロップダウン矢印をクリックして、[接続の管理]を選択します。
どちらの方法でも、In-DB 接続の管理 ウィンドウが表示されます。In-DB 接続の管理 で、データソースを選択します。
Apache Spark ダイレクト接続が確立された状態で、コードエディター がアクティブになります。コードを挿入 を使用して、コードエディターでテンプレート関数を生成します。
ライブラリのインポート は、インポートステートメントを作成します。
インポートパッケージ
データの読み込み は、readAlteryxData 関数を作成して、入力データを Apache SparkSQL DataFrame として返します。
valdataFrame = readAlteryxData(1)
データの書き込み は、writeAlteryxData 関数を作成して、Apache SparkSQL DataFrame を出力します。
writeAlteryxData(dataFrame, 1)
ログメッセージ は、logAlteryxMessage 関数を作成して、文字列をメッセージとしてログに書き込みます。
logAlteryxMessage("Example message")
ログの警告 は、logAlteryxWarning 関数を作成して、警告として文字列をログに書き込むみます。
logAlteryxWarning("Example warning")
ログエラーは、logAlteryxError関数を作成して、文字列をエラーとしてログに書き込みます。
logAlteryxError("Example error")
ライブラリのインポート は、インポートステートメントを作成します。
モジュールインポートライブラリから
データの読み込み は、readAlteryxData 関数を作成して、入力データを Apache SparkSQL DataFrame として返します。
dataFrame= readAlteryxData(1)
データの書き込み は、writeAlteryxData 関数を作成して、Apache SparkSQL DataFrame を出力します。
writeAlteryxData(dataFrame, 1)
ログメッセージ は、logAlteryxMessage 関数を作成して、文字列をメッセージとしてログに書き込みます。
logAlteryxMessage("Example message")
ログの警告 は、logAlteryxWarning 関数を作成して、警告として文字列をログに書き込むみます。
logAlteryxWarning("Example warning")
ログエラーは、logAlteryxError関数を作成して、文字列をエラーとしてログに書き込みます。
logAlteryxError("Example error")
ライブラリのインポート は、インポートステートメントを作成します。
ライブラリ(jsonlite)
データの読み込み は、readAlteryxData 関数を作成して、入力データを Apache SparkSQL DataFrame として返します。
dataFrame<- readAlteryxData(1)
データの書き込み は、writeAlteryxData 関数を作成して、Apache SparkSQL DataFrame を出力します。
writeAlteryxData(dataFrame, 1)
ログメッセージ は、logAlteryxMessage 関数を作成して、文字列をメッセージとしてログに書き込みます。
logAlteryxMessage("Example message")
ログの警告 は、logAlteryxWarning 関数を作成して、警告として文字列をログに書き込むみます。
logAlteryxWarning("Example warning")
ログエラーは、logAlteryxError関数を作成して、文字列をエラーとしてログに書き込みます。
logAlteryxError("Example error")
コードのインポートを使用して、外部で作成されたコードを取得します。
ファイルから は、ファイルエクスプローラーを開いてファイルを参照します。
Jupyter Notebook から は、ファイルエクスプローラーを開いてファイルを参照します。
URLから は、ファイルの場所を入力または貼り付けるフィールドを提供します。
歯車アイコンを選択すると、コードエディターの表示面が変更されます。
テキストサイズ ボタンを使用して、エディター内のテキストのサイズを変更できます。
カラーテーマ を使用して、暗い配色と明るい配色を切り替えます。
長い線を折り返す を選択すると、水平スクロールを要求する代わりに、コードエディターウィンドウ内に長い線が表示されたままになります。
行番号を表示する を選択すると、エディターの行番号が表示されます。
管理する出力チャネルのメタ情報を選択します。既存のデータの Apache Spark データ型 を手動で変更します。
プラスアイコンを選択して、データ行を追加します。
フィールド名 を入力します。
Apache Spark データ型 を選択します。
サイズ をビット単位で入力します。