Distribution Analysis Tool Icon

分散型分析ツール

Version:
Current
Last modified: May 02, 2020

分散型分析ツールを使用すると、1つまたは複数の分布を入力データに収め、それらを多くの適合度検定*統計に基づいて比較することができます。これらのテストの結果の統計的有意性(p値)に基づいて、ユーザーはどの分布がデータを最もよく表すかを決定することができる。

分散型分析ツールは、データの全体的な性質を理解し、それを分析する方法を決定する際に役立ちます。例えば、正規分布に適合するデータは、線形回帰に適している可能性がありますが、ガンマ分布データはガンマ回帰ツールによる分析に適している可能性があります。

このツールはRツールを使用します。オプション > 予測ツールのダウンロードに移動し、Alteryx ダウンロードとライセンスポータルにサインインして、R ツールで使用されるパッケージと R ツールをインストールします。参照: 予測ツールのダウンロードとご使用

ツール設定

[構成] タブを使用して、配賦分析の必須コントロールを設定します。

  1. 分析フィールドを選択します。分析用の受信データからフィールドを選択します。
  2. 比較する分布を選択: 比較する1つまたは複数の分布を選択します。分布のオプションは次のとおりです:
    • 通常:実値のランダム変数(つまり、正と負の両方の値を取ることができる連続ランダム変数)を表すために自然科学と社会科学の両方でよく使用される一般的に発生する連続確率分布。
    • ログノーマル:対数が通常分布するランダム変数の連続確率分布。この分布は、成長速度やサイズ分布などの自然現象の記述によく適しています。さらに、それは十分に大きな人口における所得分布を記述するためにしばしば使用されます。
    • ワイブル:指数分布に密接に関連する比較的柔軟な分布。それは、何らかの種類の "故障" 率、例えばランダムな機械的故障、死亡率、解約率、機械的摩耗率などを記述するデータで頻繁に見られます。
    • ガンマ:非整数、負でない低い値で有意な濃度のケースを特徴とする連続確率分布は、はるかに高い値の合理的な可能性を可能にします。ガンマ分布は幅広い用途を持ち、個人ごとに測定された保険金請求の平均サイズなど、ケースごとの総計(または平均)金額を表すデータで一般に見られます。
      対数、ワイブル、ガンマ分布は、非負のデータに対してのみ機能します。
    • サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。

グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。

  • プロットサイズ:グラフのサイズに対してインチまたはセンチメートルを選択します。
  • グラフの解像度: グラフの解像度を 1 インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi) で選択します。解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

出力を表示する

ヒストグラム、テスト結果の基本要約統計量、適合度統計、分布あたりのデータ分位数、および分布パラメータを含む一連のレポートスニペット。

* ダゴスティーノ、r.、スティーブンス、修士 (1986) 適合技術の良さ。

Was This Helpful?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support.