
カルガリーローダーツール
カルガリーローダーを使用すると、任意のタイプの入力ファイルからカルガリーデータベース(*.cydb)を作成できます。 入力ファイルに含まれる各フィールドは、カルガリーデータベースのパフォーマンスを最大限にするためにインデックス付けすることができます。
Alteryx 5.0リリース以降、カルガリーのインデックスは大文字と小文字を区別しません。 5.0より前のバージョンで作成されたカルガリーデータベースでも、大文字と小文字が区別されます。
ツール設定
ルートファイル名: カルガリーデータベースの名前とファイルの場所を指定するために使用される領域。 すべてのカルガリーデータベースにはファイル拡張子*.cydbがあります。
基本 CalgaryDB または 1 つ以上の標準インデックスを読み込むか、単一のアドバンスド インデックスを読み込むかを選択できます。
ロードベース CalgaryDB および/または 1 つ以上の標準インデックス
フィールド: [フィールド] 領域には、入力ファイルに含まれるすべてのデータ列が表示されます。
右側に [オプション] ボタンがあります。 オプション は次のとおりです。
データ: [データ] 列で選択したフィールドを取得できます。 データ フィールドの横にあるチェック ボックスをオンまたはオフにすることで、Calgary データベースに含めるデータを手動で選択または選択解除できます。
- すべて選択: 分析用のすべてのデータ フィールドを選択します。
- すべて選択解除: すべてのデータフィールドを 1 回のステップで選択解除します。 これは、ワークフローから実行するいくつかのフィールドのみを選択したい場合に便利です。
インデックス: [インデックス] 列で選択したフィールドは、クエリで使用できます。 データ フィールドの横にあるチェック ボックスをオンまたはオフにすると、Calgary データベースに作成するインデックスを手動で選択または選択解除できます。
- すべて選択: 分析用のすべてのデータ フィールドを選択します。
- すべて選択解除: すべてのデータフィールドを 1 回のステップで選択解除します。 これは、ワークフローから実行するいくつかのフィールドのみを選択したい場合に便利です。
フィールドは、空間インデックスまたは非空間インデックスのいずれかに設定できます。 非空間インデックスを作成するには、2つの異なるモードがあります:
- 高選択率インデックス: アドレスや名前など、非常にユニークなレコードを含むフィールドには、高選択率インデックスが使用されます。
- 低選択度指数: 性別や州の省略形などの反復データを含むフィールドには、低選択度指数が使用されます。
入力フィールドに含まれるデータに基づいて、カルガリーローダーツールが自動的に適切なインデックスモード(高または低選択率)を適用する自動モードを選択できます。 550を超えるユニークな値を持つすべてのフィールドは高選択性で自動検出されます。 カルガリーローダーは、適用する適切なインデックスを特定するために、最初の100万レコードの高選択性および低選択性インデックス両方の作成を開始します。 データの性質が最初の 100 万レコード内で大きく変化した場合、自動モードでは正しいインデックス モードが正しく割り当てされない可能性があります。
非空間インデックスではNULL値を使用できます。
ポイントレベルの空間インデックスのみがサポートされています。 NULLおよび0,0ポイントは空間的にインデックス付けできません。
単一の高度なインデックスを読み込む
詳細索引を使用すると、カルガリーデータベースにイントラクティインデックスまたは生インデックスを作成できます。
インデックスを含む: 指定した値を表形式フィールド全体で検索します。 指定された値は、フィールド内の任意の場所に配置できます。
Raw インデックス: テーブル内の複数のフィールドに対して 1 つのインデックスを作成するために使用される標準インデックスの特別な構築モード。
テーブルに [人 1~ 人 6] のフィールドが含まれている場合は、インデックスを作成して、6 人のフィールドすべてのすべての名前を含めることができます。 これにより、1 つの名前で検索を実行し、Name 値が存在する Person フィールドに関係なく一致するすべてのレコードを取得できます。
ルート ファイル名: 詳細インデックスを作成するカルガリー データベースを指定します。 入力のファイルパスの場所を入力するか、[閲覧]をクリックしてファイルの場所に移動します。
インデックス名: ルートファイル名と同じ場所に保存する拡張インデックスの名前を指定します。
- ソースフィールド: 高度なインデックスを作成する入力データベースのフィールドを指定します。
- 詳細インデックスモード: 作成する高度なインデックスの種類を指定します。
ローインデックスの場合は、レコード ID である 0 ベースのレコードフィールドと選択度 (高、低、自動) を指定する必要があります。
このファイルを使用するためにライセンスを要求する: このチェック ボックスは主に内部使用用です。 ライセンスファイルを作成する権限を持っていない限り、カルガリーデータベースを読み込むときにこのボックスをチェックしないでください。
カルガリーローダーでのローインデックスの構築を参照してください。