ニューラルネットワークツール

ツールごとに学習

ニューラルネットワークツールには「ツールごとに学習」が用意されています。サンプルワークフローを参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。

ニューラルネットワークツールは、単一の隠れ層のあるフィードフォワードパーセプトロンニューラルネットワークモデルを作成します。隠れ層のニューロンはロジスティック(S字形としても知られる)活性化関数を使用し、出力活性化関数はターゲットフィールドの性質に依存します。具体的には、バイナリ分類問題(たとえば、顧客が購入するまたは購入しない確率)の場合、使用される出力活性化関数はロジスティックで、多項分類問題(たとえば、顧客がオプションA、B、またはCを選択する確率)の場合、使用される出力活性化関数はソフトマックスで、回帰問題(ターゲットが連続した数値フィールドである)の場合、出力に対して線形活性化関数が使用されます。

ニューラルネットワークは、予測モデリングのための第1の機械学習アルゴリズム(従来の統計的アプローチとは対照的)を表します。このメソッドの背後にある動機は、脳内のニューロンの構造を模倣することです(この故に、メソッドの名前)。ニューラルネットワークの基本構造には、1つ以上の「隠れ」層に供給される一連の入力(予測フィールド)が含まれ、各隠れ層には1つ以上の「ノード」(「ニューロン」としても知られている)があります。

第1の隠れ層で、入力は(各ノードの各入力に割り当てられた重みを用いて)線形結合され、「活性化関数」が予測の加重線形結合に適用されます。2番目以降の隠れ層では、前の隠れ層のノードからもたらされる出力は、隠れの各ノードにおいて(またしても前の隠れ層から各ノードに割り当てられた重みで)線形結合され、活性化関数は加重線形結合に適用されます。最後に、最終的な隠れ層のノードからもたらされる結果は、ターゲットタイプと一致する活性化関数を使用する最終的な出力層に結合されます。

推定(または、ニューラルネットワーク文献の語彙における「学習」)には、モデルの目的関数を最小にする各入力または前の層ノードの値に対する1セットの重みを見つけることが含まれます。連続数値フィールドの場合、これは、最終的なモデルの予測の二乗誤差の合計を実際の値と比較して最小にすることを意味しますが、分類ネットワークは、二項分類問題および多項分類問題の両方についてエントロピー測定を最小化しようとします。上記のように、ニューラルネットワークツール(R nnetパッケージに依存する)は、単一の隠れ層(任意の数のノードを有することができる)のみを可能にし、隠れ層ノードにおいては常にロジスティック伝達関数を使用します。これらの制限にもかかわらず、私たちの研究は、nnetパッケージが現時点ではRで利用可能な最も強固なニューラルネットワークパッケージであることを示しています。

より現代的な統計的学習方法([ブースト]、[フォレスト]、および[スプライン]モデルツールによって生成されたモデルなど)は、通常は、ニューラルネットワークモデルと比較してより大きな予測効力を提供しますが、(事前に決定できない)ある特定のアプリケーションでは、ニュートラルネットワークモデルの方が分類モデルと回帰モデルの両方で他のメソッドよりも優れています。さらに、金融リスクアセスメントなどの一部の分野では、ニューラルネットワークモデルは広く受け入れられている「標準的な」方法と考えられています。このツールはRツールを使用します。オプション > 予測ツールをダウンロード の順に進み、Alteryx Downloads and Licenses ポータルにサインインして、R と R ツールで使用されるパッケージをインストールします。予測ツールのダウンロードと使用を参照してください。

ツールの設定

必須パラメーター

モデル名: 各モデルには後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字ピリオド(".")とアンダースコア("_")を含むことができます。その他の特殊文字は使用できず、またRは大文字と小文字を区別します。
ターゲットフィールドを選択: 予測するデータストリームからフィールドを選択します。このターゲットは文字列型でなければなりません。
予測フィールドを選択: ターゲット変数の値が変更される「原因」と考えられるフィールドをデータストリームから選択します。サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、実行時の例外処理を引き起こす可能性があります。
モデル推定にサンプリングの重み付けを使用(オプション): チェックボックスをオンにしてデータストリームから重み付けフィールドを選択し、サンプリング重み付けを使用するモデルを推定します。
隠れ層のノード数: モデルの単一隠れ層内のノード(ニューロン)の数。デフォルトは10です。
効果プロットを含める: チェックマークが入っていると、予測変数とターゲットの関係をグラフィカルに表示し、他の予測フィールドの効果を平均した効果プロットが生成されます。生成するプロットの数は、「プロットに含まれるフィールドの重要度の最小レベル」によって制御されます。これは、特定フィールドに対して限界効果プロットを生成するために、そのフィールドがモデルに寄与する必要があるモデルの全予測累乗のパーセンテージを示すものです。この選択の値が高いほど、生成される限界効果プロットの数が少なくなります。

モデルのカスタマイズ

カスタムスケーリング/正規化...: 入力(予測フィールド)が異なるスケール(たとえば、世帯人数が1–7人の範囲で、収入が7000–100万の範囲)にある場合、モデルの重みの最適化の基礎となる数値的手法が問題となることがあります。
なし: 既定。
Zスコア: すべての予測フィールドは、平均値がゼロで標準偏差が1になるようにスケーリングされます。
単位区間: すべての予測フィールドは、最小値が0、最大値が1、他のすべての値がゼロと1の間にあるようにスケーリングされます。
ゼロセンタリング: すべての予測フィールドは、負の値の最小値と1の最大値を持ち、他のすべての値は負と正の値の間にくるようにスケーリングされます。
重み減衰: 減衰重みは、推定プロセスの各反復(「エポック」とも呼ばれる)での新しい重み値の移動を制限します。減衰重みの値はゼロと1の間にくる必要があります。値が大きいほど、重みの可能な移動の制限が大きくなります。一般に、0.01と0.2との間の減衰値はしばしば良好に機能します。
ゼロ付近の初期(ランダム)重みの+/-範囲: 各隠れノードの入力変数に与えられた重みは、乱数を用いて初期化されます。このオプションにより、使用する乱数の範囲を設定できます。通常、値は0.5の近くなるようにする必要があります。ただし、すべての入力変数のサイズが大きい場合は、値を小さくするほうが効果的です。0の値は、実際には特殊な値で、ツールが入力データを与えられた良好な構成値を見つられるようにします。
モデルで許容される加重の最大数: このオプションは、隠れ層に多数の予測フィールドとノードがある場合に意味を持ちます。重み付けの数を減らすとモデル推定が高速化し、アルゴリズムが(グローバルな最適化とは対照的に)重みのための局所的最適を見つける機会を減少させます。モデルから除外された重みは、暗黙的にゼロに設定されます。
モデル推定の最大反復回数: この値は、以前の重みのセットと比較して、モデルの重みのセットの改善を見つけるためにアルゴリズムが試行できる回数を制御します。反復回数が最大になる前に重みに改善が見られない場合、アルゴリズムは終了し、最良の重みセットを返します。このオプションのデフォルトの反復回数は100です。一般に、アルゴリズムの行動を考えれば、モデル作成のための実行時間が長くなるという代償を払っても、必要に応じてこの値を増やすのは意味があることです。

グラフィックオプション

プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。
グラフの解像度: グラフの解像度を 1 インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)
- 解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。
- 解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
ベースフォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。

出力の表示

O アンカー: オブジェクト。シリーズにされたモデルのテーブルとそのモデル名で構成されます。
R アンカー: レポート。ニューラルネットワークによって生成されたレポートスニペット(基本モデルサマリー、およびターゲット変数の各クラスのおもな効果プロット)で構成されます。

_{https://en.wikipedia.org/wiki/Artificial_neural_network}