Alteryx データベースファイル形式
Alteryxのデータベースファイル形式YXDBは、データフィールド、値、空間オブジェクトを保持できるファイルタイプです。YXDB形式は、サイズ制限がなく、非常に高速で圧縮が可能で、データのソースとデータの作成方法を参照する追加のメタデータが含まれているため、Alteryxでの読み取り/書き込みに最も効率的なファイル形式です。行数やファイルサイズに制限はありませんが、64ビット環境では1つのセルについて2GBのサイズ制限があります。すべてのAlteryx製品は、YXDBファイルの読み書きをサポートしています。
YXDBファイルが最も効率的な入出力ファイルタイプであるのはなぜですか?
YXDBファイルは、Alteryxの内部処理とまったく同じ列の型、構造、形式を使用するため、このソフトウェアでの使用に最適です。行の制限がないため、20億を超える行を処理することができます。多くの行をサポートするテキスト以外のファイル形式はありません。
YBDBファイルは圧縮されていますか?
はい、最大圧縮ではなく最大速度を実現するために最小限に圧縮されます。空間指数がある場合、その圧縮はそれほど目立つことがありません。空間指数がない場合、圧縮効率が非常に高くなる場合もあります。
空間オブジェクトを含むファイル内のデータを変換したいが、その空間オブジェクトを操作しない場合でも、YXDBを使用するのが最も効率的ですか?
はい。しかしこの場合、詳細オプションで空間指数を無効にすれば、それを作成するための時間とスペースを無駄にすることはありません。
YXDBファイルには他にどのような情報が格納されていますか?
AlteryxがYXDBファイルに書き込むとき、ソースと説明列のデータがファイルに保存されるので、フィールドがどのように作成されたか、または基礎となるデータ値のビンテージがどのようになっているかを常に知ることができます。このメタデータの例については、 フィールド情報ツール を参照してください。
ソース : フィールドの元になったツール、ファイル、またはプロセスが含まれています。また、プラグインの特定のデータセットなど、追加のメタ情報を含む場合もあります。メタ情報を報告するツールの例: Allocate入力ツール 、 Allocate付加ツール 、 CASSツール 、 フォーミュラツール 、 ストリートジオコーダーツール 、Guzzlerを使用するツール( 商圏分析ツール 、 距離ツール 、 最寄り地点検索ツール など)。
説明 : 情報が含まれる場合と含まれない場合があります。Allocateツールからデータが付加された場合、より長くわかりやすいフィールド名がここに含まれます。さらに、ユーザーは自分自身のフィールド記述を セレクトツール によって追加でき、この情報はフィールドに関連付けられたままになります。
使用ケースの例
問題
2つのSQLクエリといくつかのワークフローがあり、2番目のデータセットは同じで、レコードが3百万件あります。2番目のデータセットを同じワークフローまたは別のワークフローで再利用して、selectステートメントを何度も実行する必要がないようにする方法はありますか?
解答
ワークフロー内でデータの中間ストレージが必要な場合は、 データ出力ツール を使用してYXDB形式に書き込みます。最初のワークフローで、クエリのすべてのデータを格納するYXDBファイルに書き込むことができます。次に、そのYXDBを他のワークフローの入力データとして使用します。このようにして、静的データセットから作業して開発できます。ワークフローをライブデータ接続に切り替えたい場合は、他のワークフローから データ入力ツール をコピーするだけです。
また、1つのワークフロー内でデータを再利用するだけの場合は、 ワークフローのキャッシュと実行 機能を検討してください。