ピアソン相関ツール
[ピアソン相関]ツールは、2つの変数XとYの相関線形依存)を測定するために(積率相関係数(PMCCと呼ばれることがあり、通常rで示される)を使用し、+1と-1の間の値を与えます。 これは、2つの変数間の線形依存の強さの測定として科学で広く使用されています。
相関 (しばしば相関係数、ρとして測定される) は、2つのランダム変数間の線形関係の強度および方向を示します。 相関値は、-1.00(完全な負の相関)から+1.00(完全な正の相関)の範囲にあります。 ゼロは相関が全くないことを示します。
相関係数は、2つの変数の共分散をそれらの標準偏差の積で割ることによって得られます。
ツールを設定する
- 選択した変数の相関関係を生成: 入力ストリームから2つ以上のフィールドを選択して、相関関係を実行します。 フィールドは数値でなければなりません。
- 実行する計算のタイプを指定します。 選択肢は次のとおりです:
- 相関関係の計算: ピアソンの相関関係を測定します。
- 共分散の計算: 異なるフィールド間の共分散を測定します。 共分散のタイプは「サンプル共分散」であり、Excel統計式「共変量」と同じです。
サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。
[ピアソン相関係数]ツールでは、非Null値を期待します。 データに null がある場合は、その値を使用することをお勧めします。 iインピュテーションツール 最初に null を置換します。
*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient