分散型分析ツール
分散型分析ツールを使用すると、1つまたは複数の分布を入力データに収め、それらを多くの適合度検定*統計に基づいて比較することができます。 これらのテストの結果の統計的有意性(p値)に基づいて、ユーザーはどの分布がデータを最もよく表すかを決定することができる。
分散型分析ツールは、データの全体的な性質を理解し、それを分析する方法を決定する際に役立ちます。 例えば、正規分布に適合するデータは、線形回帰に適している可能性がありますが、ガンマ分布データはガンマ回帰ツールによる分析に適している可能性があります。
このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには Rツール。 参照: 予測ツールをダウンロードして使用する。
ツールを設定する
[構成] タブを使用して、配賦分析の必須コントロールを設定します。
- 分析用のフィールドを選択: 入力データから分析用のフィールドを選択します。
- 比較する分布を選択: 比較する1つまたは複数の分布を選択します。 分布のオプションは次のとおりです:
- Normal: 一般的に発生する連続的な確率分布で、自然界と社会科学の両方で、実数値のランダム変数 (正と負の両方の値を取ることができる連続したランダム変数) を表すためによく使用されます。
- 対数: 対数が通常分布しているランダム変数の連続的な確率分布。 この分布は、成長速度やサイズ分布などの自然現象の記述によく適しています。 さらに、それは十分に大きな人口における所得分布を記述するためにしばしば使用されます。
- ワイブル: 指数分布に密接に関連する比較的柔軟な分布。 それは、何らかの種類の "故障" 率、例えばランダムな機械的故障、死亡率、解約率、機械的摩耗率などを記述するデータで頻繁に見られます。
- ガンマ: 非整数、非負の低い値でのケースの有意な濃度によって特徴付けられる連続的な確率分布はまた、はるかに高い値の妥当な可能性を可能にしながら。 ガンマ分布は幅広い用途を持ち、個人ごとに測定された保険金請求の平均サイズなど、ケースごとの総計(または平均)金額を表すデータで一般に見られます。
対数、ワイブル、ガンマ分布は、非負のデータに対してのみ機能します。
サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。
グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。
- [印刷サイズ]: グラフのサイズに対してインチまたはセンチメートルを選択します。
-
グラフ解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。
出力を見る
ヒストグラム、テスト結果の基本要約統計量、適合度統計、分布あたりのデータ分位数、および分布パラメータを含む一連のレポートスニペット。
* ダゴスティーノ、r.、スティーブンス、修士 (1986) 適合技術の良さ。