フィールド要約ツール
フィールドサマリーツールは、データを分析し、選択した列のデータの記述統計を含む要約レポートを作成します。
フィールドサマリーツールを使用して、データを把握し、データ管理に関する推奨事項を受け取ることができます。
このツールでは、数値、文字列、空間、および日付/時刻がサポートされています。 それぞれのデータタイプにユニークな説明的な統計情報が提供されています。 参照: データ型 データの種類の詳細については。
ツールを設定する
出力に含める列のサンプルをすべて、一部、またはランダムに選択します。
このツールでサポートされていないデータ (ブールデータなど) を含む列は、ツールの構成時に選択できます。ただし、この列は分析されず、ツール出力にも含まれません。
- 製品概要情報のフィールドを選択: 分析する列を選択し、出力に含めます。
- all: データ内のすべての列をクリックして選択します。
- [なし]: 以前に選択した列の選択を解除します。
- [入力データのサンプル]: [すべて選択] または [特定の列] ではなく、出力に列のサンプルを含める場合に選択します。
- ランダム N レコード: 出力に含めるレコードの数を選択します。
- レコードのランダム N%: 出力に含める受信レコードの割合を選択します。
出力を見る
フィールド要約ツールには3つの出力があります:
- Oアンカー: データを管理するための備考欄の推奨事項とともに、選択した列の説明的な統計を持つ Alteryx データストリーム。
- Rアンカー: 列のデータを管理するための推奨事項 (「解説」を参照) と共に、選択した列の散布と説明の統計情報を含む静的レポート。 レポートを表示するには、参照ツールを追加して、R出力に接続します。 参照: 閲覧ツール。
- 私はアンカー: インタラクティブなダッシュボードは、各列の拡張可能なパネルで構成される。 レポートを表示するには、閲覧ツールを追加して、I出力に接続します。 参照: 閲覧ツール。 各パネルは、ヒストグラムまたはカラムチャートと要約統計量で構成されています。
- パネルの上にカーソルを乗せると、追加のアイコンが表示されます。
- 情報アイコンをクリックして、追加の情報を表示します
- 拡大アイコンをクリックすると、詳細ビューでレポートが開きます。
- プロットのバーの上にカーソルを乗せると、詳細が表示されます。
- 表示する変数を選択して、小さい列のセットにフォーカスします。
- パネルをアルファベット順または欠損値のパーセンテージでソートします。
- パネルの上にカーソルを乗せると、追加のアイコンが表示されます。
出力で使用できる記述的な統計は、分析のために選択された列のデータのタイプによって異なります。 結果は水平方向にリスト化されます。 左から右へスクロールすると、各データタイプの統計情報が表示されます。
列に数値データが含まれている場合、次の統計が提供されます:
- Min: データの最小値。
- Max: データの最大値。
- メジアン: データの中央値。
- Std. Dev: 値がどの程度分散されているかをデータに測定します。
- [欠落率]: データ内の null 値の割合。
- 一意の値: データ内の一意の値の数。
- 意味: データの平均。
- レイアウト: 参照ツールを追加して R 出力に接続すると、統計情報が視覚的な形式で表示されます。 参照: 閲覧ツール。
- 注釈: データを管理するための推奨事項 (使用可能な場合)。
列に文字列データが含まれている場合、次の統計が提供されます:
- [欠落率]: データ内の null 値の割合。
- 一意の値: データ内の一意の値の数。
- 最短値: データの短い (長さ) 文字列値。
- 最長値: データの最長 (長さ) 文字列値。
- 最小値の数: 最低値と等しい値の数。
- [最大値の数]: 最大値と等しい値の数。
- 注釈: データを管理するための推奨事項 (使用可能な場合)。
列に空間データが含まれている場合、次の統計が提供されます:
- [欠落率]: データ内の null 値の割合。
- オブジェクトタイプ: データ内の空間オブジェクトのタイプ (ポイントまたはポリゴンなど)。
- 平均面積(平方マイル): データ内の値の平均面積 (平方マイル)。
- 平均の長さ(マイルス): データ内の値の平均の長さ (マイル)。
- Avg Num 点: ポイントであるデータの平均値の数。
- 注釈: データを管理するための推奨事項 (使用可能な場合)。
列に日付/時刻データが含まれている場合、次の統計値が提供されます:
- [欠落率]: データ内の null 値の割合。
- 一意の値: データ内の一意の値の数。
- 最新の日付: データ内の最新の、またはほとんどの将来の日付。
- 最も早い日付: データの最も早い日付。
- 間隔: データ内の日付の間隔 (たとえば、月次)。
- 注釈: データを管理するための推奨事項 (使用可能な場合)。