ガンマ回帰ツール

ガンマ回帰ツールは、ターゲット変数に影響を及ぼすことが予想される1つまたは複数の変数(予測変数)に、ガンマ分布で厳密に正の関心のある変数(目標変数)を関連付けます。

多くのアプリケーションでは、ターゲット変数の値は常に厳密に正(つまり、決して0または負ではありません)ですが、観測値の低い範囲に集中する傾向がありますが、少数のケースでは大きな値を採用します。 この性質のターゲット変数は、従来の線形回帰モデルの基礎となる正規性の仮定と一致しないデータ生成プロセスを表します。 しかし、値は常に正であり、常に整数ではないので、ポアソン分布または負の二項分布に基づくプロセスに従いません。 これらは、ガンマ分布に基づくプロセスと一致しており、線形回帰と同様の方法で一般化線形モデルフレームワーク を使用して推定することができます。

このツールでは、入力データが通常のAlteryxデータストリームからのものであれば、オープンソースのR glm関数がモデル推定に使用されます。 入力がいずれかから来る場合 XDF入力ツール または XDF出力ツール、モデル推定には Revo スカラー rxGlm 関数が使用されます。 Revo スカラーベースの機能を使用する利点は、それがはるかに大きい (メモリのうち) データセットを分析することができますが、XDF ファイルを作成するために追加のオーバーヘッドのコストで、いくつかのモデルの診断出力を作成することが出来ないということです これは、オープンソースの R 関数で使用できます。

このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには Rツール。 参照: 予測ツールをダウンロードして使用する

入力を接続する

1つ以上の可能なプレディクタフィールドとともに関心のあるターゲットフィールドを含むAlteryxデータストリームまたはXDFメタデータストリーム。

ツールを設定する

[構成] タブを使用して、ガンマ回帰のコントロールを設定します。

  • モデル名: 後で識別できるように、各モデルに名前を指定する必要があります。 モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。 その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
  • ターゲット変数を選択: 予測したいデータストリームからフィールドを選択します。
  • 予測変数を選択: ターゲット変数の値が "原因" であると考えられるデータストリームのフィールドを選択します。
  • サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。

  • モデルの種類: ログ、逆、および id のオプションを持つドロップダウンボックス。 このオプションは、一般化された線形モデルを推定する際にガンマファミリーで使用されるリンク関数を決定します。
  • モデル推定でサンプリングウェイトを使用する(オプション)...: チェックボックスをクリックし、データストリームからウェイトフィールドを選択して、サンプリングウェイトを使用するモデルを推定します。

グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。

  • グラフ解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

出力を見る

  • Oアンカー: モデル名を持つシリアル化されたモデルのテーブルから成ります。
  • Rアンカー: ガンマ回帰ツールによって生成されるレポートスニペット (統計サマリー、逸脱のタイプ II 分析 (ANOD)、および基本的な診断プロット) から成ります。 モデル入力がXDF出力またはXDF入力ツールからのものである場合、逸脱度のタイプII分析テーブルおよび基本診断プロットは生成されません。