データ調査

データ調査ツールカテゴリには、予測分析プロジェクトで使用するデータを理解するためのツールと、予測分析のための特殊なデータサンプリングタスクを実行するためのツールが含まれています。

割当解析ツール: 関連付け分析ツールは、データベース内のどのフィールドが互いに変量関連付けを持つかを決定します。

基本データプロファイルツール: 基本データプロファイルツールは、データ型、min、max、平均、欠落値の数などの基本的なメタデータを出力します。

分割表ツール: 代替テーブルツールでは、選択したフィールドに基づいて代替テーブルが作成され、フィールド値のすべての組み合わせが [頻度] および [パーセント] 列で一覧表示されます。

分散型分析ツール: 分布解析ツールは、入力データに1つまたは複数の分布を適合させ、適合度の高い統計量に基づいてそれらを比較します。

フィールド要約ツール: フィールドサマリーツールは、データを分析し、選択した列のデータの説明的な統計情報を含むサマリーレポートを作成します。 フィールドサマリーツールを使用して、データを把握し、データ管理に関する推奨事項を受け取ることができます。

度数分布表ツール: 周波数テーブルツールは、選択したフィールドの周波数解析を生成します。 出力には、フィールドの各値の頻度とパーセンテージで選択したフィールドの概要が含まれます。

ヒートプロットツール: 熱プロットツールは、熱プロットカラーマップを使用して、連続する数値変数または順序付けられたカテゴリの2つの変数のジョイント分布を表示します。

ヒストグラムツール: ヒストグラムツールは、一連の連続する値の範囲にあるレコードの頻度を示すことによって、数値フィールドのヒストグラムプロットを提供します。 また、平滑化された経験的密度プロットも提供します。 密度プロットが選択されていない場合は周波数が表示され、このオプションが選択されている場合は確率が表示されます。

重要度重みツール: [重要度ウェイト] ツールには、予測モデルで使用する変数セットを選択するためのメソッドが用意されており、各予測対象がターゲット変数にどの程度関連しているかに基づいています。

ピアソン相関ツール: ピアソン相関ツールは、2つの変数と共変性の間の線形依存性を測定します。

平均プロットツール: [手段のプロット] ツールは、カテゴリフィールドと共に応答フィールドとして (バイナリカテゴリフィールドをゼロと1つの値のセットに変換した) 数値またはバイナリカテゴリフィールドを受け取り、各カテゴリーの応答フィールドの平均をプロットします (レベルカテゴリフィールドの s)。

散布図ツール: 散布ツールは、マージンに箱型図、線形回帰直線、非パラメトリック回帰による滑らかな曲線、平滑化された条件拡散、外れ値同定、および回帰直線を含むオプションを使用して、拡張散布図] を行います。

スピアマン相関ツール: Spearman 相関ツールは、任意の単調関数が変数間の関係の特定の性質について他の仮定をすることなく、2つの変数間の関係を記述することがどれだけうまく評価する。

バイオリンプロットツール: ヴァイオリンプロットツールは、単一の数値変数の分布を表示し、分布の密度を伝えます。