
ニューラルネットワークツール
[ニューラルネットワーク]ツールは、単一の非表示層のあるフィードフォワードパーセプトロンニューラルネットワークモデルを作成します。 非表示層のニューロンはロジスティック(S字形としても知られる)活性化関数を使用し、出力活性化関数はターゲットフィールドの性質に依存します。 具体的には、バイナリ分類問題(たとえば、顧客が購入するまたは購入しない確率)の場合、使用される出力活性化関数はロジスティックで、多項分類問題(たとえば、顧客がオプションA、B、またはCを選択する確率)の場合、使用される出力活性化関数はソフトマックスで、回帰問題(ターゲットが連続した数値フィールドである)の場合、出力に対して線形活性化関数が使用されます。
ニューラルネットワークは、予測モデリングのための第1の機械学習アルゴリズム(従来の統計的アプローチとは対照的)を表します。 このメソッドの背後にある動機は、脳内のニューロンの構造を模倣することです(この故に、メソッドの名前)。 ニューラルネットワークの基本構造には、1つ以上の「非表示」層に供給される一連の入力(予測フィールド)が含まれ、各非表示層には1つ以上の「ノード」(「ニューロン」としても知られている)があります。
第1の非表示層で、入力は(各ノードの各入力に割り当てられた重みを用いて)線形結合され、「活性化関数」が予測の加重線形結合に適用されます。 2番目以降の非表示層では、前の非表示層のノードからもたらされる出力は、非表示層の各ノードにおいて(またしても前の非表示層から各ノードに割り当てられた重みで)線形結合され、活性化関数は加重線形結合に適用されます。 最後に、最終的な非表示層のノードからもたらされる結果は、ターゲットタイプと一致する活性化関数を使用する最終的な出力層に結合されます。
推定(または、ニューラルネットワーク文献の語彙における「学習」)には、モデルの目的関数を最小にする各入力または前の層ノードの値に対する1セットの重みを見つけることが含まれます。 連続数値フィールドの場合、これは、最終的なモデルの予測の二乗誤差の合計を実際の値と比較して最小にすることを意味しますが、分類ネットワークは、二項分類問題および多項分類問題の両方についてエントロピー測定を最小化しようとします。 上記のように、[ニューラルネットワーク]ツール(Rネットパッケージに依存する)は、単一の非表示層(任意の数のノードを有することができる)のみを可能にし、非表示層ノードにおいては常にロジスティック伝達関数を使用します。 これらの制限にもかかわらず、私たちの研究は、nnetパッケージが現時点ではRで利用可能な最も強固なニューラルネットワークパッケージであることを示しています。
より現代的な統計的学習方法([ブースト]、[フォレスト]、および[スプライン]モデルツールによって生成されたモデルなど)は、通常は、ニューラルネットワークモデルと比較してより大きな予測効力を提供しますが、(事前に決定できない)ある特定のアプリケーションでは、ニュートラルネットワークモデルの方が分類モデルと回帰モデルの両方で他のメソッドよりも優れています。 また、金融リスク評価などの一部の分野では、ニューラルネットワークモデルが広く受け入れられている「標準」方式と考えられています。このツールは R ツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用されるパッケージをインストールします。 「予測ツールのダウンロードと使用」を参照してください。
ツール設定
- モデル名: 後で識別できるように、各モデルに名前を付ける必要があります。 モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。 その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
- ターゲット変数を選択します。 予測するデータ ストリームからフィールドを選択します。 このターゲットは文字列型でなければなりません。
- 予測変数を選択します。 ターゲット変数の値が「原因」と思われるデータ・ストリームからフィールドを選択します。
サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム系例外を引き起こす可能性があります。 - モデル推定でサンプリングウェイトを使用する(オプション): このチェック ボックスをクリックし、データ ストリームからウェイト フィールドを選択して、サンプリング ウェイトを使用するモデルを推定します。
- 非表示層のノード数: モデルの単一の隠れ層内のノード (ニューロン) の数。 デフォルトは10です。
- 効果プロットを含める: オンにすると、予測変数とターゲットの関係をグラフィカルに示すエフェクトプロットが生成され、他の予測変数の効果を平均化します。 生成するプロットの数は、「プロットに含まれるフィールドの重要度の最小レベル」によって制御されます。これは、特定フィールドに対して限界効果プロットを生成するために、そのフィールドがモデルに寄与する必要があるモデルの全予測累乗のパーセンテージを示すものです。 この選択の値が高いほど、生成される限界効果プロットの数が少なくなります。
- カスタムスケーリング/正規化...: 入力(予測フィールド)が異なるスケール(たとえば、1~7人の世帯に存在する家族の数に結合された7000~100万の範囲の収入)にある場合、モデルの重みの最適化の基礎となるニューメリックメソッドが問題となることがあります。
- なし: 既定。
- Zスコア: すべての予測フィールドは、平均が 0、標準偏差が 1 になるようにスケーリングされます。
- 単位間隔: すべての予測フィールドは、最小値が 0、最大値が 1 になるようにスケーリングされ、その他の値はすべて 0 から 1 の間になります。
- ゼロの中心: すべての予測変数フィールドは、最小値が負の値と最大値が 1 に設定され、その他の値はすべて負と正の値の間になるようにスケーリングされます。
- 重量減衰: 減衰の重みによって、推定プロセスの反復 ("エポック" とも呼ばれます) ごとに新しい重み値の移動が制限されます。 減衰重みの値はゼロと1の間にくる必要があります。値が大きいほど、重みの可能な移動の制限が大きくなります。 一般に、0.01と0.2との間の減量値はしばしば良好に機能します。
- ゼロの周りの初期(ランダム)重みの+/- 範囲: 各隠しノードの入力変数に与えられた重みは、乱数を使用して初期化されます。 このオプションにより、使用する乱数の範囲を設定できます。 通常、値は0.5の近くなるようにする必要があります。 ただし、すべての入力変数のサイズが大きい場合は、値を小さくするほうが効果的です。 0の値は、実際には特殊な値で、ツールが入力データを与えられた良好な構成値を見つられるようにします。
- モデルで使用できるウェイトの最大数: このオプションは、隠れ層に多数の予測フィールドとノードがある場合に関連します。 重み付けの数を減らすとモデル推定が高速化し、アルゴリズムが(グローバルな最適化とは対照的に)重みのための局所的最適を見つける機会を減少させます。 モデルから除外された重みは、暗黙的にゼロに設定されます。
- モデル推定の最大反復回数: この値は、以前のウェイト セットに対するモデルウェイトセットの改善点を見つけようとするアルゴリズムの試行回数を制御します。 反復回数が最大になる前に重みに改善が見られない場合、アルゴリズムは終了し、最良の重みセットを返します。 このオプションのデフォルトの反復回数は100です。 一般に、アルゴリズムの行動を考えれば、モデル作成のための実行時間が長くなるという代償を払っても、必要に応じてこの値を増やすのは意味があることです。
- プロットサイズ: グラフのサイズに対してインチまたはセンチメートルを選択します。
- グラフの解像度: グラフの解像度を 1 インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。
- 基本フォント サイズ (ポイント): グラフ内のフォントのサイズを選択します。
出力を表示
- O アンカー: オブジェクト。 シリーズにされたモデルのテーブルとそのモデル名で構成されます。
- R アンカー: レポート。 ニューラルネットワークツールによって生成されるレポートスニペット (基本的なモデルの概要) と、ターゲット変数の各クラスの主な効果プロットから成ります。