Distribution Analysis Tool Icon

分布分析ツール

バージョン:
Current
Last modified: September 25, 2020

分布分析ツールを使用して、1 つ以上の分布を入力データに適合させ、適合度の適合度* 統計の数に基づいて比較します。 これらの検定の結果の統計的有意性(p値)に基づいて、どの分布がデータを最もよく表しているかを判断できます。

分散型分析ツールは、データの全体的な性質を理解し、それを分析する方法を決定する際に役立ちます。 たとえば、正規分布に適合するデータは線形回帰に適している可能性が高く、ガンマ分布データはガンマ回帰ツールを使用した分析に適している可能性があります。

このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用されるパッケージをインストールします。 参照: 予測ツールのダウンロードとご利用

ツール設定

構成タブ

[構成]タブを使用して、分布分析の必須コントロールを設定します。

  1. 分析するフィールドを選択: 分析用に入力するデータからフィールドを選択します。
  2. 比較する分布を選択する: 比較する分布を 1 つ以上選択します。 配布オプションは次のとおりです。
    • 正規: 自然科学と社会科学の両方で、実数値のランダム変数(すなわち、正と負の両方の値を取ることができる連続的なランダム変数)を表すためによく使用される、一般的に発生する連続確率分布。
    • 対数正規数 : 対数が正規分布している確率変数の連続確率分布。 この分布は、成長速度やサイズ分布などの自然現象の記述によく適しています。 さらに、それは十分に大きな人口における所得分布を記述するためにしばしば使用されます。
    • ワイブル: 指数分布と密接に関連する比較的柔軟な分布。 ランダムな機械的故障、死亡率、解約、機械的摩耗率など、何らかの「故障」率を記述するデータによく見られます。
    • ガンマ: 非整数、非負の低い値でのケースの有意な集中によって特徴づけられる連続確率分布であり、また、はるかに高い値の合理的な可能性を可能にします。 ガンマ分布は幅広い用途を持ち、一般的には、個人ごとに測定される保険金請求の平均サイズなど、ケースごとの集計金額(または平均)を記述するデータに含まれます。

対数、ワイブル、ガンマ分布は、非負のデータに対してのみ機能します。

サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。

[グラフィックス オプション] タブ

[グラフィックス オプション]タブを使用して、グラフィック出力のコントロールを設定します。

  • プロットサイズ: グラフのサイズに 対してインチ または センチメートル を選択し、[ 幅][高さ] の値を設定します。
  • グラフ解像度: 1x (96 dpi) 、2x (192 dpi)、または3x (288 dpi)の点/インチでグラフの解像度を選択します。 2x (192 dpi)
    • 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。
    • 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

出力の表示

ヒストグラム、テスト結果の基本要約統計量、適合度統計、分布あたりのデータ分位数、および分布パラメータを含む一連のレポートスニペット。

*ダゴスティーノ、R.、 スティーブンス、M.A.(1986)フィット技術の良さ。

役に立ちましたか?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support. Can't submit this form? Email us.