割当解析ツール

割当解析ツールを使用すると、ユーザーはデータベース内のどのフィールドが相互に2変量の関連を持つかを判断できます。 評価は、ピアソンの積率("通常の")相関係数、スピアマンの順位相関係数、**またはヘフディングのD統計***に基づくことができます(逆U字形などの非単調関係を見つけることができるノンパラメトリック検定として)。 さらに、各関連指標の統計的有意性が決定されます。

このツールは、常に完全な関係のセットを提供し、オプションで、関心のあるターゲットフィールドの詳細な分析および他の数値変数との関係を提供することができます。 関心のあるターゲットフィールドは、数値変数またはバイナリカテゴリ変数のいずれかとすることができます。 バイナリカテゴリ変数がターゲットフィールドとして使用されている場合は、フィールドがターゲットレベルに対応するレベルを持つ場合に値1を帰属するゼロ-1の数値フィールドに変換され、それ以外の場合はゼロ値が代入されます。

このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには 。 参照: 予測ツールのダウンロードとご利用にアクセスしてください

ツールを設定する

  1. より詳細な分析のためにフィールドをターゲットにする: これにより、データ内の1つのフィールドとその他のフィールドについて、より集中的に分析を実行できます。 これは、分析の目的が、後続の予測モデルで使用するフィールドのセットを決定することである場合に特に便利です。 このオプションが選択されている場合は、数値またはバイナリカテゴリのどちらでもかまいません、ターゲットフィールドの名前を指定する必要があります。 フィールドがバイナリカテゴリの場合は、このフィールドの値を1としてコード化し、もう一方の値をゼロとしてコード化します。 提供されたフィールドがカテゴリに属し、2つを超える異なる値を含む場合、エラーが返されます。
  2. サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。

  3. フィールド (2 つ以上を選択): 関連付け分析のフィールドを選択します。 "ターゲット" フィールドが選択されている場合、それは自動的にこのリストに含まれます。 非ターゲットフィールドは数値である必要があります。
  4. アソシエーションの測定:ピアソンの積モーメント相関、Spearman 順位相関、またはHoeffding の D 統計 のいずれかを選択します。

出力を見る

Rアンカー: レポート出力には、ピアソン相関分析を含む3つのテーブルが含まれています: フィールドトランス、完全相関行列、および対応する p 値の行列の集中分析。

私はアンカー: 対話型のレポートには、マウスの位置に基づいて変更散布と相関行列が含まれています。

ピアソンのRの重要な値のテーブル