
アソシエーション分析ツール
バージョン:
2023.1
Last modified: August 25, 2022
アソシエーション分析ツールを使用して、データベース内のどのフィールドに二変量の関連性があるかを判別します。 評価は、ピアソン積率相関係数、スピアマンの順位相関係数、またはヘフディングの D 統計に基づくことができます (逆U字形などの非単調関係を見つけることができるノンパラメトリック検定)。さらに、各関連指標の統計的有意性が決定されます。
このツールは、常に完全な関係のセットを提供し、オプションで、関心のあるターゲットフィールドの詳細な分析および他の数値変数との関係を提供することができます。関心のあるターゲットフィールドは、数値変数またはバイナリカテゴリ変数のいずれかとすることができます。バイナリカテゴリ変数がターゲットフィールドとして使用されている場合、フィールドがターゲットレベルに対応するレベルを持つ場合に値 1 を帰属する 0 から 1 の数値フィールドに変換され、それ以外の場合はゼロの値が代入されます。
このツールは R ツールを使用します。オプション > 予測ツールをダウンロード の順に進み、Alteryx Downloads and Licenses ポータルにサインインして、R と R ツール で使用されるパッケージをインストールします。参照: 予測ツールのダウンロードとご利用
ツール設定
- より詳細な分析のためにフィールドをターゲットにする: これにより、データ内の関心のある 1 つのフィールドと他のフィールドのより集中した分析を実行できます。これは、分析の目的が、後続の予測モデルで使用するフィールドのセットを決定することである場合に特に便利です。このオプションを選択した場合は、ターゲットフィールドの名前を指定する必要があります。これは、数値またはバイナリのカテゴリのいずれかです。フィールドがバイナリカテゴリの場合、このフィールドの値を 1 として再コーディングし、他の値をゼロとしてコード化することを選択します。提供されたフィールドがカテゴリに属し、2 つを超える異なる値を含む場合、エラーが返されます。
サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、ランタイム時に例外を引き起こす可能性があります。 - フィールド (2つ以上選択): アソシエーション分析のフィールドを選択します。「ターゲット」フィールドを選択すると、自動的にこのリストに含まれます。非ターゲットフィールドは数値である必要があります。
- 関連性の尺度: 次のいずれかを選択してください。
出力の表示
- R アンカー: レポート出力には、ピアソン相関分析を構成する以下の 3 つのテーブルが含まれます。
- Focused Analysis of Field Trans
- Full Correlation Matrix
- Matrix of Corresponding P-Values.
- I アンカー: インタラクティブレポートには、マウスの位置に基づいて変化する散布図行列が含まれています。