
フィールド要約ツール
バージョン:
2023.1
Last modified: September 25, 2020
[フィールドの概要] ツールを使用して、データを分析し、選択した列のデータの説明統計を含むサマリー レポートを作成します。 このツールを使用してデータに関する洞察を得て、データ管理に関する推奨事項を受け取ります。
このツールでは、数値、文字列、空間、および日付/時刻のデータがサポートされています。 それぞれのデータタイプにユニークな説明的な統計情報が提供されています。 データの種類の詳細については、「データ型」を参照してください。
ツール設定
概要情報を生成するフィールドを選択する : 概要情報を生成するフィールド (列) に関連付けられているチェックボックスをオンにします。
サンプル入力データ: このチェックボックスをオンにすると、レコードのランダムサンプルが取得されます。 これにより、データセットが大きい場合にワークフローの実行時間を短縮できます。 ワークフローを実行するたびに、異なるデータ サンプルが表示されます。 サンプリング オプションは 2 つあります。
- ランダム N レコード: ランダムにサンプリングする レコード数 を指定します。
- レコードのランダムな N%: ランダムにサンプリングする レコードの割合 を指定します。
出力の表示
[フィールドサマリー]ツールには、次の3つの出力があります。
- アンカー : 選択した列の説明統計と、データ管理の推奨情報を含む Alteryx データ ストリーム。
- R アンカー: 選択した列の散布図と記述統計と、列のデータを管理するための推奨事項 (解説を参照) を含む静的レポート。 レポートを表示するには、参照ツールを追加して R 出力に接続します。 参照: 閲覧ツール
- I アンカー: 各列の展開可能なパネルで構成される対話型ダッシュボード。 レポートを表示するには、参照ツールを追加し、I 出力に接続します。 参照: 閲覧ツール 各パネルは、ヒストグラムグラフまたは縦棒グラフと要約統計量で構成されます。
- パネルの上にカーソルを乗せると、追加のアイコンが表示されます。
- 追加情報を表示するには、情報アイコンを選択します
- 展開アイコンを選択すると、詳細ビューでレポートが開きます。
- プロットのバーの上にカーソルを乗せると、詳細が表示されます。
- 表示する変数を選択 すると、より小さな列のセットに焦点を当てます。
- パネルをアルファベット順に並べ替えたり、欠損値のパーセンテージで並べ替えます。
- パネルの上にカーソルを乗せると、追加のアイコンが表示されます。
出力で使用できる記述的な統計は、分析のために選択された列のデータのタイプによって異なります。 結果は水平方向にリスト化されます。 左から右へスクロールすると、各データタイプの統計情報が表示されます。
数値データ
列に数値データが含まれている場合、次の統計情報が提供されます。
- 最小: データの最小値。
- 最大: データの最大値。
- 中央値: データの中央値。
- 標準 Dev.: データで値がどのように分散しているかの尺度。
- 欠損率: null のデータ値の割合。
- 一意の値: データ内の一意の値の数。
- 平均: データの平均です。
- レイアウト: 参照ツールを追加して R 出力に接続し、統計情報を視覚的な形式で表示します。 参照: 閲覧ツール
- 備考: データを管理するための推奨事項 (可能な場合)。
文字列データ
列に文字列データが含まれている場合、次の統計情報が提供されます。
- 欠損率: null のデータ値の割合。
- 一意の値: データ内の一意の値の数。
- 最短の値: データ内の最短 (長さ) 文字列値。
- 最長値 : データ内の最長 (長さ) 文字列値。
- 最小値の数: 最小値と等しい値の数。
- [最大値の数]: 最大値と等しい値の数。
- 備考: データを管理するための推奨事項 (可能な場合)。
空間データ
列に空間データが含まれている場合、次の統計情報が提供されます。
- 欠損率: null のデータ値の割合。
- オブジェクト タイプ: データ内の空間オブジェクトのタイプ (ポイントまたはポリゴンなど)。
- 平均面積 (Sq マイル): データ内の値の平均面積 (平方マイル)。
- 平均長さ (マイル): データ内の値の平均長さ (マイル)。
- 平均数ポイント: データ内の平均ポイント数です。
- 備考: データを管理するための推奨事項 (可能な場合)。
日付/時刻データ
列に日付/時刻データが含まれている場合、次の統計情報が提供されます。
- 欠損率: null のデータ値の割合。
- 一意の値: データ内の一意の値の数。
- 最新の日付: データの最新の日付、または最も将来の日付。
- 最も早い日付: データの最も早い日付。
- 間隔: データ内の日付の間隔 (月単位など)。
- 備考: データを管理するための推奨事項 (可能な場合)。