
ガンマ回帰ツール
ガンマ回帰ツールは、ターゲット変数に影響を及ぼすことが予想される1つまたは複数の変数(予測変数)に、ガンマ分布で厳密に正の関心のある変数(目標変数)を関連付けます。
多くのアプリケーションでは、ターゲット変数の値は常に厳密に正(つまり、決して0または負ではありません)ですが、観測値の低い範囲に集中する傾向がありますが、少数のケースでは大きな値を採用します。 この性質のターゲット変数は、従来の線形回帰モデルの基礎となる正規性の仮定と一致しないデータ生成プロセスを表します。 しかし、値は常に正であり、常に整数ではないので、ポアソン分布または負の二項分布に基づくプロセスに従いません。 これらはガンマ分布に基づくプロセスと一致しており、 一般化線形モデルフレームワークを介して線形回帰に似た方法を使用して推定できます。
このツールでは、入力データが通常のAlteryxデータストリームからのものであれば、オープンソースのR glm関数がモデル推定に使用されます。 入力が XDF 入力ツール または XDF 出力ツールから取得される場合、モデル推定には Revo ScaleR rxGlm 関数が使用されます。 Revo ScaleR ベースの関数を使用する利点は、はるかに大きな (メモリ不足の) データセットを分析できますが、追加のオーバーヘッドが発生して XDF ファイルを作成でき、オープン ソース R 関数で使用可能なモデル診断出力の一部を作成できないことです。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、Rと R ツールで使用されるパッケージをインストールします。 参照: 予測ツールのダウンロードとご利用
入力を接続する
1つ以上の可能なプレディクタフィールドとともに関心のあるターゲットフィールドを含むAlteryxデータストリームまたはXDFメタデータストリーム。
ツール設定
ガンマ回帰のコントロールを設定するには、[ 構成] タブを使用します。
- モデル名: 後で識別できるように、各モデルに名前を指定する必要があります。 モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。 その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
- ターゲット変数を選択: 予測したいデータストリームからフィールドを選択します。
- 予測変数を選択: ターゲット変数の値が "原因" であると考えられるデータストリームのフィールドを選択します。 サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。
- モデルタイプ: ログ、逆、および ID のオプションを含むドロップダウンボックス。 このオプションは、一般化された線形モデルを推定する際にガンマファミリーで使用されるリンク関数を決定します。
- モデル推定にサンプリング加重を使用しますか? (オプション)。 このチェックボックスをオンにし、データストリームからウェイトフィールドを選択して、サンプリングウェイトを使用するモデルを推定します。
[グラフィックス オプション]タブを使用して、グラフィック出力のコントロールを設定します。
- グラフ解像度: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) の点/インチでグラフの解像度を選択します。
- 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。
- 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。
出力の表示
- アンカー : モデル名を持つシリアル化されたモデルのテーブルで構成されます。
- R アンカー: ガンマ回帰ツールによって生成されたレポート スニペットで構成されます: 統計サマリー、逸脱のタイプ II 分析 (ANOD)、および基本診断プロット。 モデル入力がXDF出力またはXDF入力ツールからのものである場合、逸脱度のタイプII分析テーブルおよび基本診断プロットは生成されません。