
基本データプロファイルツール
バージョン:
2023.1
Last modified: March 10, 2022
基本データプロファイルツールは、データを分析し、データの各列(フィールド)にメタデータを提供します。
基本データプロファイルツールを使用して、データの概要またはプロファイルを表示し、さらなる分析のために情報を出力します。データプロファイルの視覚的な表示を見るには、メタデータに加えて、閲覧ツールを使用します。「参照ツール」を参照するを参照するを参照する。
ツール設定
オプションの構成オプションのいずれかを実行します。
- 正確なカウントの制限:最適なパフォーマンスを向上するには、既定の制限を使用することをお勧めします。制限を増やすと、より多くのデータのプロファイル情報が表示されます。データ内でAlteryxに識別させたいユニークな値の最大数を入力するか、クリックして選択します。
- すべての一意の値 (文字) を返すサイズ制限:最適なパフォーマンスを向上するには、既定の制限を使用することをお勧めします。制限を増やすと、より多くのデータのプロファイル情報が表示されます。値がユニークであるかどうかを判断するために、Alteryxにチェックさせたい文字の最大数を入力するか、クリックして選択します。
- メトリック単位の使用:メトリック単位を使用する場合に選択します。このオプションは、空間データにのみ適用されます。
出力を表示
接続ツールのデータのタイプに応じて、結果ウィンドウのデータプロファイル情報が異なります。データ型の一覧については、データ型を参照してください。
結果は垂直方向にリスト化されます。スクロールして、データの各列のメタデータを表示します。
文字列データ
列に文字列値が含まれている場合は、次のメタデータが提供されます:
- 名前: 列名。
- データ型: 選択した列のデータ型。
- サイズ:この列の各レコードに予約されたメモリの量。
- ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
- 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
- ヌル:空の値を除く null の列内の値の数。
- 非Null: 空の値を含む、列内の非 Null エントリの数。
- ブランク:空の値の数。
- 先頭の空白を持つ値:値の前に空白を持つ文字列値の数。問題を解決するには、データクレンジングツールまたは式ツールトリム関数を使用します。「データ クレンジング ツールと数式ツール」を参照してください。
- 末尾の空白を持つ値:値の後に空白を持つ文字列値の数。
- 両方の空白を持つ値:値の前後に空白を持つ文字列値の数。
- 平均長さ:列内の値の平均長さ。
- 最長の長さ:列内で最も長い値の文字数。
- 最長値:列内の最も長い値。
- 最短 (非ブランク) の長さ:列内の最短値の文字数。
- 最短値:列の最短値。
- 最小値:アルファベット順に並べ替えられた列の最初の文字列エントリ。
- 最大数:アルファベット順に並べ替えられた列の最後の文字列エントリ。
- ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
- 一意の値:列内のすべての一意の値。
数値データ
列に数値が含まれている場合は、次のメタデータが提供されます:
- 名前: 列名。
- データ型: 選択した列のデータ型。
- サイズ:この列の各レコードに予約されたメモリの量。
- ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
- 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
- ヌル:空の値を除く null の列内の値の数。
- 非Null: 空の値を含む、列内の非 Null エントリの数。
- 最小値:列内の最小値。
- 最大数:列の最大値。
- 平均:列内の値の平均値。
- 標準偏差:値がグラフに分散している方法の尺度。
- 分散:乱数のセットが平均からどの程度分散しているかの尺度。
- ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
- 一意の値:列内のすべての一意の値。
- 25パーセンタイル:データの下位または前半の中央値。
- 50パーセンタイル:データの中央値。
- 75パーセンタイル:データの上または 2 番目の中央値。
- ヒストグラム:均等にグループ化されたデータに分類される列内の値の数。各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。各グループにはそれぞれ23、15、および0の項目があります。
- 誤差幅:計算値の下および上の値の可能な範囲。
日付/時刻データ
列に日付/時刻データが含まれている場合、次のメタデータが提供されます:
- 名前: 列名。
- データ型: 選択した列のデータ型。
- サイズ:この列の各レコードに予約されたメモリの量。
- ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
- 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
- ヌル:空の値を除く null の列内の値の数。
- 非Null: 空の値を含む、列内の非 Null エントリの数。
- 日付ヒストグラム:(日付データのみ)均等にグループ化されたデータに分類される列内の値の数。各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。各グループにはそれぞれ23、15、および0の項目があります。
- 最小値:列内の最小値。
- 最大数:列の最大値。
- ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
- 一意の値:列内のすべての一意の値。
空間オブジェクトデータ
列に空間オブジェクトが含まれている場合は、次のメタデータが提供されます:
- 名前: 列名。
- データ型: 選択した列のデータ型。
- サイズ:この列の各レコードに予約されたメモリの量。
- ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
- 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
- ヌル:空の値を除く null の列内の値の数。
- 非Null: 空の値を含む、列内の非 Null エントリの数。
- 平均サイズ (バイト数): このオブジェクトが占有するメモリ内の平均サイズ。
- 最大サイズ (バイト数): 列内の最大オブジェクトのメモリ内のサイズ。
- カウントポイント: ポイントである列内の空間オブジェクトの数。
- カウントライン: 列内の線である空間オブジェクトの数。
- ポリポリラインのカウント: ポリラインである列内の空間オブジェクトの数。
- 長方形の数: 四角形である列内の空間オブジェクトの数。
- ポリゴンを数える: ポリゴンである列内の空間オブジェクトの数。
- マルチポイントのカウント: 複数点である列内の空間オブジェクトの数。
- 部品の平均数:列内の空間オブジェクト内の部品の平均数。
- 部品の最大数:列内の空間オブジェクト内の最大数のパーツ。
- 平均ポイント数:列内の空間オブジェクト内のポイントの平均数。
- 最大ポイント数:列内の空間オブジェクト内のポイントの最大数。
- 最長の長さ:列内の空間オブジェクトの最長。
- 最大面積:平方マイルまたは平方キロメートルで最大の面積。