Basic Data Profile Tool Icon

基本データプロファイルツール

Version:
Current
Last modified: May 02, 2020

基本データプロファイルツールは、データを分析し、データの各列(フィールド)にメタデータを提供します。

基本データプロファイルツールを使用して、データの概要またはプロファイルを表示し、さらなる分析のために情報を出力します。データプロファイルの視覚的な表示を見るには、メタデータに加えて、閲覧ツールを使用します。「参照ツール」を参照するを参照するを参照する。

ツール設定

オプションの構成オプションのいずれかを実行します。

  • 正確なカウントの制限:最適なパフォーマンスを向上するには、既定の制限を使用することをお勧めします。制限を増やすと、より多くのデータのプロファイル情報が表示されます。データ内でAlteryxに識別させたいユニークな値の最大数を入力するか、クリックして選択します。
  • すべての一意の値 (文字) を返すサイズ制限:最適なパフォーマンスを向上するには、既定の制限を使用することをお勧めします。制限を増やすと、より多くのデータのプロファイル情報が表示されます。値がユニークであるかどうかを判断するために、Alteryxにチェックさせたい文字の最大数を入力するか、クリックして選択します。
  • メトリック単位の使用:メトリック単位を使用する場合に選択します。このオプションは、空間データにのみ適用されます。

出力を表示

接続ツールのデータのタイプに応じて、結果ウィンドウのデータプロファイル情報が異なります。データ型の一覧については、データ型を参照してください。

結果は垂直方向にリスト化されます。スクロールして、データの各列のメタデータを表示します。

文字列データ

列に文字列値が含まれている場合は、次のメタデータが提供されます:

  • 名前: 列名。
  • データ型: 選択した列のデータ型。
  • サイズ:この列の各レコードに予約されたメモリの量。
  • ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
  • ヌル:空の値を除く null の列内の値の数。
  • 非Null: 空の値を含む、列内の非 Null エントリの数。
  • ブランク:空の値の数。
  • 先頭の空白を持つ値:値の前に空白を持つ文字列値の数。問題を解決するには、データクレンジングツールまたは式ツールトリム関数を使用します。「データ クレンジング ツール数式ツール」を参照してください。
  • 末尾の空白を持つ値:値の後に空白を持つ文字列値の数。
  • 両方の空白を持つ値:値の前後に空白を持つ文字列値の数。
  • 平均長さ:列内の値の平均長さ。
  • 最長の長さ:列内で最も長い値の文字数。
  • 最長値:列内の最も長い値。
  • 最短 (非ブランク) の長さ:列内の最短値の文字数。
  • 最短値:列の最短値。
  • 最小値:アルファベット順に並べ替えられた列の最初の文字列エントリ。
  • 最大数:アルファベット順に並べ替えられた列の最後の文字列エントリ。
  • ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
  • 一意の値:列内のすべての一意の値。

数値データ

列に数値が含まれている場合は、次のメタデータが提供されます:

  • 名前: 列名。
  • データ型: 選択した列のデータ型。
  • サイズ:この列の各レコードに予約されたメモリの量。
  • ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
  • ヌル:空の値を除く null の列内の値の数。
  • 非Null: 空の値を含む、列内の非 Null エントリの数。
  • 最小値:列内の最小値。
  • 最大数:列の最大値。
  • 平均:列内の値の平均値。
  • 標準偏差:値がグラフに分散している方法の尺度。
  • 分散:乱数のセットが平均からどの程度分散しているかの尺度。
  • ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
  • 一意の値:列内のすべての一意の値。
  • 25パーセンタイル:データの下位または前半の中央値。
  • 50パーセンタイル:データの中央値。
  • 75パーセンタイル:データの上または 2 番目の中央値。
  • ヒストグラム:均等にグループ化されたデータに分類される列内の値の数。各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。各グループにはそれぞれ23、15、および0の項目があります。
  • 誤差幅:計算値の下および上の値の可能な範囲。

日付/時刻データ

列に日付/時刻データが含まれている場合、次のメタデータが提供されます:

  • 名前: 列名。
  • データ型: 選択した列のデータ型。
  • サイズ:この列の各レコードに予約されたメモリの量。
  • ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
  • ヌル:空の値を除く null の列内の値の数。
  • 非Null: 空の値を含む、列内の非 Null エントリの数。
  • 日付ヒストグラム:(日付データのみ)均等にグループ化されたデータに分類される列内の値の数。各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。各グループにはそれぞれ23、15、および0の項目があります。
  • 最小値:列内の最小値。
  • 最大数:列の最大値。
  • ユニーク:フィールド内の一意の値の数。ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。参照: ユニークツール
  • 一意の値:列内のすべての一意の値。

空間オブジェクトデータ

列に空間オブジェクトが含まれている場合は、次のメタデータが提供されます:

  • 名前: 列名。
  • データ型: 選択した列のデータ型。
  • サイズ:この列の各レコードに予約されたメモリの量。
  • ソース:列の原点。これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明:列の説明 (使用可能な場合)。説明がない場合は[Null]です。
  • ヌル:空の値を除く null の列内の値の数。
  • 非Null: 空の値を含む、列内の非 Null エントリの数。
  • 平均サイズ (バイト数):   このオブジェクトが占有するメモリ内の平均サイズ。
  • 最大サイズ (バイト数): 列内の最大オブジェクトのメモリ内のサイズ。
  • カウントポイント:  ポイントである列内の空間オブジェクトの数。
  • カウントライン:  列内の線である空間オブジェクトの数。
  • ポリポリラインのカウント:   ポリラインである列内の空間オブジェクトの数。
  • 長方形の数:   四角形である列内の空間オブジェクトの数。
  • ポリゴンを数える:  ポリゴンである列内の空間オブジェクトの数。
  • マルチポイントのカウント: 複数点である列内の空間オブジェクトの数。
  • 部品の平均数:列内の空間オブジェクト内の部品の平均数。
  • 部品の最大数:列内の空間オブジェクト内の最大数のパーツ。
  • 平均ポイント数:列内の空間オブジェクト内のポイントの平均数。
  • 最大ポイント数:列内の空間オブジェクト内のポイントの最大数。
  • 最長の長さ:列内の空間オブジェクトの最長。
  • 最大面積:平方マイルまたは平方キロメートルで最大の面積。
Was This Helpful?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support.