Basic Data Profile Tool Icon

基本データプロファイルツール

バージョン:
Current
Last modified: September 25, 2020

基本データプロファイルツールを使用して、データの概要またはプロファイルを表示し、さらなる分析のために情報を出力します。 基本データプロファイルツールは、データを分析し、データの各列(フィールド)にメタデータを提供します。 データプロファイルの視覚的な表示を見るには、メタデータに加えて、閲覧ツールを使用します。 参照: 閲覧ツール

ツール設定

オプションの構成オプションのいずれかを実行します。

  • 正確なカウントの制限: 最適なパフォーマンスを得るためには、既定の制限を使用することをお勧めします。 制限を増やすと、より多くのデータのプロファイル情報が表示されます。 テキストを入力するか、アップ/ダウン ボタンを使用して、データ内で Alteryx で識別する一意の値の最大数を選択します。
  • すべての一意値を返すサイズ制限 (文字): 最適なパフォーマンスを得るには、デフォルトの制限値を使用することをお勧めします。 制限を増やすと、より多くのデータのプロファイル情報が表示されます。 テキストを入力するか、上/下ボタンを使用して、値が一意かどうかを判断するために Alteryx で値をチェックインする最大文字数を選択します。
  • メートル単位を使用: メートル単位を使用する場合に選択します。 このオプションは、空間データにのみ適用されます。

出力の表示

接続ツールのデータのタイプによって、[結果] ウィンドウのデータ プロファイル情報は異なります。 データ型の一覧については、データ型 を参照してください。

結果は垂直方向にリスト化されます。 スクロールして、データの各列のメタデータを表示します。

文字列データ

列に文字列値が含まれている場合、このメタデータが提供されます。

  • 名前 : 列名。
  • データ型 : 選択された列のデータ型。
  • サイズ : この列の各レコードに対して予約されているメモリの量。
  • ソース: 列の原点。 データ ソースの名前またはデータが保存される場所へのパスを指定できます。
  • 説明: 列の説明 (可能な場合)。 説明がない場合は[Null]です。
  • null : 空の値を除く、null の列の値の数。
  • null 以外の : 空の値を含む、列内の null 以外のエントリの数。
  • 空白: 空の値の数。
  • 先頭の空白を持つ値 : 値の前に空白がある文字列値の数。 問題を解決するには、データクレンジングツールまたは式ツールトリム関数を使用します。 データ クレンジング ツールおよび式ツールを参照してください。
  • 末尾の空白を持つ値 : 値の後に空白がある文字列値の数。
  • 両方の空白を持つ値: 値の前後に空白文字を含む文字列値の数。
  • 平均長さ : 列の値の平均長。
  • 最長の長さ : 列の最長値の文字数。
  • 最長値 : 列の最長値。
  • 最短 (空白でない) の長さ : 列の最短値の文字数。
  • 最短値 : 列の最短値。
  • 最小: アルファベット順に並べ替えられた列の最初の文字列エントリ。
  • Maximum: アルファベット順に並べ替えられた列の最後の文字列エントリ。
  • ユニーク : フィールド内の一意の値の数。 ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。 参照: ユニークツール
  • 一意の値: 列内のすべての一意の値。

数値データ

列に数値が含まれている場合、このメタデータが提供されます。

  • 名前 : 列名。
  • データ型 : 選択された列のデータ型。
  • サイズ : この列の各レコードに対して予約されているメモリの量。
  • ソース: 列の原点。 これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明: 列の説明 (可能な場合)。 説明がない場合は[Null]です。
  • null : 空の値を除く、null の列の値の数。
  • null 以外の : 空の値を含む、列内の null 以外のエントリの数。
  • 最小 : 列の最小値。
  • 最大 : 列の最大値。
  • 平均 : 列の値の平均値。
  • 標準偏差 : 値がグラフにどの程度分散されているかを測定します。
  • 分散 : 乱数の集合が平均からどの程度分散しているかの尺度。
  • ユニーク : フィールド内の一意の値の数。 ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。 参照: ユニークツール
  • 一意の値: 列内のすべての一意の値。
  • 25 パーセンタイル : データの下、または最初の半分の中央値。
  • 50 パーセンタイル : データの中央値。
  • 75 パーセンタイル: データの上または 2 番目の中央値。
  • ヒストグラム: 均等にグループ化されたデータに分類される列の値の数。 各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。 グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。 1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。 各グループにはそれぞれ23、15、および0の項目があります。
  • 誤差のマージン: 計算値の下または上の値の範囲。

日付/時刻データ

列に日付/時刻データが含まれている場合、このメタデータが提供されます。

  • 名前 : 列名。
  • データ型: 選択した列のデータ型。
  • サイズ : この列の各レコードに対して予約されているメモリの量。
  • ソース : 列の原点。 これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明 : 列の説明 (可能な場合)。 説明がない場合は[Null]です。
  • NullS : 空の値を除く null の列の値の数。
  • null 以外の : 空の値を含む、列内の null 以外のエントリの数。
  • 日付ヒストグラム: (日付データの場合のみ) 列内の値の数が均等にグループ化されたデータに分類されます。 各グループは、コロンで区切られたグループの開始値と値のカウントによって示されます。 グループには、次のグループの開始値までで、その開始値を含まない値が含まれます。 1:23, 2:15,3:0は、1、2および3から始まる3つのグループを示します。 各グループにはそれぞれ23、15、および0の項目があります。
  • 最小 : 列の最小値。
  • 最大 : 列の最大値。
  • ユニーク : フィールド内の一意の値の数。 ユニークツールを使用して、ユニークかつ重複したエントリの完全な数を表示します。 参照: ユニークツール
  • 一意の値: 列内のすべての一意の値。

空間オブジェクト データ

列に空間オブジェクトが含まれている場合、このメタデータが提供されます。

  • 名前 : 列名。
  • データ型 : 選択された列のデータ型。
  • サイズ : この列の各レコードに対して予約されているメモリの量。
  • ソース: 列の原点。 これは、データソースの名前またはデータが保存される場所へのパスになります。
  • 説明: 列の説明 (可能な場合)。 説明がない場合は[Null]です。
  • null : 空の値を除く、null の列の値の数。
  • null 以外の : 空の値を含む、列内の null 以外のエントリの数。
  • 平均サイズ (バイト): このオブジェクトが占有するメモリの平均サイズ。
  • 最大サイズ (バイト):   列内の最大のオブジェクトのメモリ内のサイズ。
  • カウント ポイント:   ポイントである列内の空間オブジェクトの数。
  • [Count Line]:   列内の線分の空間オブジェクトの数。
  • [ポリポリラインの数] : 列内のポリラインである空間オブジェクトの数。
  • 長方形の数: 列内の四角形である空間オブジェクトの数。
  • ポリゴン数:   列内のポリゴンである空間オブジェクトの数。
  • マルチポイント数 :   列内の複数ポイントの空間オブジェクトの数。
  • 平均パーツ数: 列内の空間オブジェクト内の平均パート数。
  • 最大パーツ数: 列内の空間オブジェクト内の最大のパーツ数。
  • 平均ポイント数: 列内の空間オブジェクト内の平均ポイント数。
  • [最大ポイント数]: 列内の空間オブジェクト内の最大のポイント数。
  • 最長長 :列内の空間オブジェクトの長さが最も長い。
  • 最大面積: 平方マイルまたは平方キロメートルで最大の面積。
役に立ちましたか?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support. Can't submit this form? Email us.