カルガリーローダーツール
カルガリーローダーを使用すると、ユーザーはあらゆる種類の入力ファイルから カルガリーデータベース (* cydb) を作成できます。 入力ファイルに含まれる各フィールドは、 カルガリーデータベースのパフォーマンスを最大化するためにインデックスを作成します。
バージョン情報
Alteryx 5.0リリース以降、カルガリーのインデックスは大文字と小文字を区別しません。 5.0より前のバージョンで作成されたカルガリーデータベースでも、大文字と小文字が区別されます。
ツールを設定する
ルートファイル名: カルガリーデータベースの名前とファイルの場所を指定するために使用される 領域。 すべてのカルガリーデータベースにはファイル拡張子*.cydbがあります。
[基本のカルガリーデータベース、または1つ以上の標準インデックスを読み込む]か [単一の高度なインデックスを 読み込む] かを選択できます。
フィールド: フィールド領域には、入力ファイルに含まれているデータのすべての列が表示されます。
右側にオプション ボタンがあります。 オプション には以下が含まれます:
データ: [データ]列で選択されたフィールドは、取得に使用できます。 カルガリーデータベースに含めるデータを 手動で選択/選択解除したり、 データフィールドの横のチェックボックスをオフにします。
- 選択 選択: 分析用にすべてのデータフィールドを選択します。
- すべての 選択を解除: 1ステップですべてのデータフィールドを解除します。 これは、 ワークフローを実行するためにいくつかのフィールドのみを選択したい場合に役立ちます。
インデックス: [インデックス]列で選択されたフィールドはクエリで使用できます。 カルガリーデータベースで作成されるインデックスを 手動で選択/選択解除したり、データフィールドの横のチェックボックスをオフにします。
- 選択 選択: 分析用にすべてのデータフィールドを選択します。
- すべての 選択を解除: 1ステップですべてのデータフィールドを解除します。 これは、 ワークフローを実行するためにいくつかのフィールドのみを選択したい場合に役立ちます。
- 高選択性 インデックス: 住所や名前などの固有レコードを含むフィールドには、 高選択性インデックスが使用されます。
- 低選択性インデックス: 性別や州の略語などの反復データを含むフィールドには、 低選択性インデックスが使用されます。
フィールドは、空間インデックス、または非空間インデックスのいずれかに設定できます。 非空間インデックスを作成するには、2つの異なるモードが あります:
カルガリーローダーツールが 入力フィールドに含まれているデータに基づいて適切なインデックスモード (高または低選択性) を自動的に適用する[自動モード] を選択できます。 550以上の固有値を持つすべてのフィールドが高選択性まで自動検出されます。 カルガリーローダーは、適切なインデックスを特定するために、 最初の100万レコードに対して高と低の両方の選択性インデックスを 構築します。 データの性質が 最初の100万れこーど内で大きく変化した場合、自動モードは誤って適切なインデックスモードを 割り当てる可能性があります。
非空間インデックスでは、NULL 値を使用できます。
ポイントレベルの空間インデックスのみが サポートされています。 NULLおよび0,0ポイントは空間的にインデックス付けできません。
高度なインデックスを使用すると、 カルガリーデータベースに Contains、または Raw インデックスを作成できます。
含まれる インデックス:表形式フィールド全体で指定された値を検索します。 指定された値は、フィールド内の任意の場所に配置できます。
Raw インデックス: テーブル内の複数のフィールドに対して、1つのインデックスを 作成するために使用される標準インデックス用の特別なビルドモード。
テーブルに person 1 から person 6 のフィールドが含まれている場合は、 すべての6人のフィールドからすべての名前を含むインデックスを作成できます。 これにより、 名前の値が存在するユーザーフィールドに関係なく、1つの名前で検索を実行し、 一致のあるすべてのレコードを取得できます。
ルートファイル 名: 高度なインデックスを作成するカルガリーデータベースを指定します。 入力のファイルパスの場所を入力するか、 [参照] をクリックしてファイルの場所に移動します。
インデックス名: ルートファイル名と同じ場所に保存する高度なインデックスの名前を 指定します。
- ソースフィールド: 高度なインデックスを作成する入力データベースからフィールドを 指定します。
- 高度なインデックスモード: 高度なインデックスの種類 (ContainsまたはRaw)を指定します。
Raw インデックスの場合、 レコード ID と選択性である 0ベースのレコードフィールドを指定する必要があります: :高い、低い、または自動。
このファイルを 使用するためにはライセンスが必要です:このチェックボックスは、主に内部 使用のためのものです。 カルガリーのデータベースをロードするときにライセンスファイルを作成する権利がない限り、 このチェックボックスをオンにしないでください。