インデータベースの概要

インデータベース内処理により、データをデータベースから移動せずにデータの大きなセットに対して混合と分析が可能になり、処理のために個別環境にデータを移動する必要のある従来の分析メソッドに比べてパフォーマンスが大幅に向上します。

データベースで分析を実行すると、処理時間を節約できます。 Alteryx Designerをインターフェースとして使用することで、インデータベースワークフローは標準的なワークフローと容易に統合され、データ混合と分析を追加で行うことが可能になります。

空間オブジェクトは現在、[インデータベース]ツールではサポートされていません。

サポートされているデータベース

ドライバのサポート

インデータベース処理には、64ビットデータベースドライバを組み込んだ64ビットAlteryxが必要です。
Alteryx Serverでワークフローを実行するには、ODBCドライバをSystem DSNとして構成する必要があります。インデータベース処理の場合は、ODBC接続がシステムDSNとして構成されていることに加えて、接続タイプを「システム」にする必要があります。

インデータベースサポート	予測インデータベースのサポート
Amazon Redshift
Apache Spark ODBC
Cloudera Impala
Databricks
EXASOL
Hive
HP Vertica
IBM Netezza
Microsoft Analytics Platform System
Microsoft Azure SQL Database
Microsoft Azure SQL Data Warehouse
Microsoft SQL Server 2008、2012、2014、2016	はい (2016)
MySQL
Oracle	はい
Pivotal Greenplum
PostgreSQL
SAP Hana
Snowflake
Teradata	はい

参照：サポートされたデータソース Alteryx でサポートされているデータプラットフォームの完全なリストについて。

参照：予測分析データベース内の予測サポートの詳細については。

インデータベースツール

	ツール名	ツールの説明
	閲覧(In-DB)ツール	In-DBワークフローの任意のポイントでデータを確認します。注: 各 DB の参照は、データベースクエリをトリガーし、パフォーマンスに影響を与える可能性があります。
	接続(In-DB)ツール	In-DBワークフローのデータベース接続を確立します。
	データストリームインツール	標準ワークフローのデータをIn-DBワークフローに取り込みます。
	データストリームアウトツール	レコードをソートするオプションで、In-DBワークフローから標準のワークフローにデータをストリームします。
	動的入力(In-DB)ツール	In-DBの接続名とクエリフィールドを標準のデータストリームから取り出し、In-DBのデータストリームに入力します。
	動的出力(In-DB)ツール	In-DBワークフローに関する情報を予測In-DBの標準ワークフローに出力します。
	フィルタ(In-DB)ツール	データベースのネイティブ言語（SQLなど）を使用して、基本フィルタまたはカスタム式を使用してIn-DBレコードをフィルタリングします。
	式(In-DB)ツール	データベースのネイティブ言語（SQLなど）を用いた式によってIn-DBデータストリーム内のフィールドを作成または更新します。
	ジョイン(In-DB)ツール	内部または外部結合を実行して、共通フィールドに基づいて2つのIn-DBデータストリームを結合します。
	マクロ入力(In-DB)ツール	マクロにIn-DB入力接続を作成し、プレースホルダ値を設定します。
	マクロ出力(In-DB)ツール	マクロにIn-DB出力接続を作成します。
	サンプル(In-DB)ツール	In-DBデータストリームをレコードの数または割合で制限します。
	選択(In-DB)ツール	In-DBワークフローでフィールドの選択、選択解除、並べ替え、名前の変更を行います。
	サマライズ(In-DB)ツール	グループ化、集計、カウント、特徴のあるフィールドのカウントなどによるサマライズIn-DBデータ出力には、計算結果のみが含まれます。
	転置(In-DB)ツール	In-DBワークフローでデータテーブルの向きをピボットします。垂直軸に水平データフィールドが表示されるようにデータを変換します。
	ユニオン(In-DB)ツール	フィールド名または位置に基づいて、類似の構造を持つ2つ以上のIn-DBデータストリームを結合します。出力には、各列に各入力のデータが格納されます。
	書き込みデータ(In-DB)ツール	In-DBデータストリームをデータベース内で直接テーブルを作成または更新する際に使用します。

インデータベース予測ツール

	ツール名	ツールの説明
	ブーストモデルツール	ブーストモデルはフリードマンの勾配ブースティングメソッドに基づいて、一般化されたブースト回帰モデルを作成します。
	決定木ツール	[決定木]ツールは一連のif-then分割ルールを組み立ててモデルを作成する基準を最適化し、1つ以上の予測変数を使用してターゲット変数を予測します。
	フォレストモデルツール	フォレストモデルツールは1つのモデルを作成し、1つ以上の予測変数に基づいて、ターゲット変数を予測する一連の決定木モデルを構築します。
	線形回帰ツール	[線形回帰]ツールは線形機能を組み立ててモデルを作成し、1つ以上の予測変数に基づいてターゲット変数を予測します。
	ロジスティック回帰	[ロジスティック回帰]ツールは、ターゲットバイナリ変数(yes / no、pass / failなど)を1つ以上のプレディクタ変数に関連付けるモデルを作成し、ターゲット変数それぞれに対して2つの可能な応答の推定確率を取得します。
	スコアリングツール	[スコアリング]ツールはモデルを評価して予測フィールド、またはスコアリングを作成し、モデルによって予測された値の精度を推定します。

ツールのバージョンを変更する

インデータベースでサポートされる予測ツールが別のIn-DBツールを使用してキャンバスに配置されると、予測ツールはIn-DBバージョンに自動的に変更されます。ツールのバージョンを手動で変更するには：

ツールを右クリックします。
ポイントしてツールバージョンを選択します。
ツールの別のバージョンをクリックします。

参照：予測分析データベース内の予測サポートの詳細については。

インデータベースツールアンカーと接続

インデータベースワークフロー処理はデータベース内で行われるため、[インデータベース]ツールは標準のAlteryxツールと互換性がありません。いくつかの視覚インジケータは接続互換性を示します。

標準的なツールは、緑の矢印のアンカーを使用して別のツールに接続します。接続は1行として表示されます。

[インデータベース]ツールは、青い四角形のデータベースアンカーを使用して、別の[インデータベース]ツールに接続します。 2つの[インデータベース]ツール間の接続は、二重線として表示されます。インデータベース処理の性質上、接続の進捗接続進捗状況状況は表示されません。

標準のツールを[インデータベース]ツールに接続するには、[動的入出力]ツールまたは[データストリーム]ツールを使用します。

データベース内の仕組み

データは[データストリームイン]と[データストリームアウト]ツールを使用して、または[接続(In- DB)]ツールを使用してデータベースに直接接続することで、インデータベースワークフローに流れ込んだり、または流れ出していきます。 [データストリームイン]と[データストリームアウト]ツールはIn-DBアンカーを使用して[In-DB]ツールに接続し、標準のワークフローアンカーを使用して標準のワークフローツールに接続します。

[接続(In-DB)]ツールを使用してデータベースへの接続を定義するか、または[データストリームイン]ツールを使用して、標準ワークフローからデータをデータベースの一時テーブルにストリーミングします。
他の[インデータベース]ツールをワークフローに接続してデータを処理します。
[書き込みデータ(In-DB)]ツールを使用して、インデータベースのテーブルを作成または更新したり、または[データストリームアウト]ツールを使用してIn-DBの結果を標準処理用のワークフローにストリーミングします。
ワークフローを実行して、データプラットフォーム内のデータを処理します。完全なインデータベースワークフローが処理されるまで、結果はAlteryx Engineに返されません。

インデータベースパフォーマンスの利点

大量のデータがデータベースの内および外でストリーミングされると、ワークフロー処理に時間がかかることがあります。インデータベース処理を使用すると、ワークフローを高速化できます。

たとえば、標準のワークフローでは、大きなデータベーステーブルがメモリに引き込まれ、小さなスプレッドシートで結合されます。実行時間の大部分は、データベースレコードへのにストリーミングに費やされます。インデータベースワークフローでは、小さなスプレッドシートがデータベースにストリーミングされ、実行時間が大幅に短縮されます。

よくある質問

[接続(In-DB)]ツールを使用してインデータベースワークフローを開始するにはどのような権限が必要ですか？

基本的なデータベースにアクセスするには、読取り権限が必要です。

[]書き込み(In-DB)]ツールを使用してデータベースにデータを出力するには、どのような権限が必要ですか？

データベースにテーブルを作成するには、書き込み権限が必要です。

[データストリームイン]ツールによって作成された一時テーブルはどうなりますか？

一時テーブルは、実行の終了時に削除されます。 [データストリームイン]ツールの実行中にAlteryxがクラッシュした場合、インデータベースワークフローを次に実行すると、それまでの3日間でデータベース内のAlteryxによって作成されたすべての一時ファイルが消去されます。

一時テーブルを作成できないのはなぜですか？

セッション間で一時テーブルを見えるようにするには、ワークフローの最後で結局は削除される永久テーブルを作成する必要があります。データベースからデータにストリーミングし、データベースにデータを書き込むには「作成」権限を持つ必要があります。例外はMicrosoft SQL Serverです。

データベースタイムアウトに対する基本的なルールはインデータベースの処理の間維持されますか、それともAlteryxはまたはこれらを変更または回避するのですか？

基本的なルールは、標準の[入力データ]ツールと[出力データ]ツールを介したデータベース接続と同じように、プロセス中も維持されます。データベースのタイムアウトがある場合や、実行可能な日ごとのクエリの数に制限がある場合は、データベースへの接続に影響が及びます。

SQLステートメントはインデータベースワークフローに対してどのように作成されるのですか？

選択ステートメントは[接続(In-DB)]ツールによってトリガーされ、追加のクエリはダウンストリームツールによって作成され、このクエリ内にネストされます。次の3つのツールのいずれかを追加すると、クエリが完了し、基になるデータベースに送信されます。-db での書き込み、データストリームアウト、ブラウズ-db。

[接続(In-DB)]ツールの[クエリ]ボックスに独自のSQLステートメントを入力し、選択ステートメントに埋め込むこともできます。

SQLステートメントはいつ処理されますか？

基本的なデータベースのSQLクエリは、各閲覧(In-DB)、データストリームアウト、または[書き込みデータ(In-DB)]ツールの実行時にトリガーされます。

閲覧のキャッシイングはどのように有効になっていますか？

[データ閲覧(In DB)]ツールはワークブックの実行時に、.yxdbファイルとしてデータをキャッシュするように構成できます。

データがキャッシュされると、ワークフローが再実行され、データベース接続またはクエリ(閲覧するレコードの数を含む)が変更されていない場合、クエリは再実行されません。代わりに、データはキャッシュから引き出されされます。

出力メッセージは、データがキャッシュされたかどうかを示します。このリンクをクリックすると、データ結果が.yxdbファイルとして個別のウィンドウに表示されます。

[入力データ]ツールのキャッシングとインデータベースワークフローのキャッシングの違いは何ですか？

[入力データ]ツールの「キャッシュデータ」オプションを使用すると、データベースからAlteryxへの冗長なデータ転送が抑えられ、ワークフローの実行にかかる時間を大幅に短縮できます。

[データ閲覧(In-DB)]ツールで「キャッシュを有効にする」オプションを使用すると、ワークフローの基礎的なデータベースへの冗長クエリの送信が抑えらえます。「キャッシュを有効にする」オプションは、デフォルトでオンになっています。

インデータベースのキャッシュはいつ使用されますか？

インデータベースのキャッシュは、アップストリームツールに変更を加えることなくワークフローが再実行されるたびに使用されます。アップストリームツールを変更すると新しいクエリがトリガーされ、新しいキャッシュが作成されます。

「最初の[100]レコードを閲覧する」オプションは、ワークフローによって処理されるデータの量に影響をあたえますか？

いいえ、[最初の[100]レコードを閲覧する]オプションは、[閲覧(In-DB)]ツールに表示されるレコード数のみを制限します。ワークフローの他のツールは、任意のポイントで通過するレコードの数を処理します。

エラー "不整合なデータ型: 予期された CLOB" とはどういう意味ですか?

フィールドにはCLOB / LOBデータ型があり、フィルタまたは[式]ツールの比較演算子のほとんどでは機能しません。このエラーは、たとえデータが比較と一致したとしても、列が返されないことを反映しています。これは、LOBデータとの比較をサポートしていないため、SQLおよびOracleでは予想される行動です。