Find Nearest Neighbors Tool Icon

最近傍探索ツール

Version:
Current
Last modified: June 05, 2020

[最近傍探索]ツールはユークリッド距離に基づいて、「クエリ」ストリーム内の各レコードに対応する「データ」ストリーム内の選択された数の最近傍点を見つけます。この方法では、速度と精度が異なる近傍を検索するためのアルゴリズムを選択できます。デフォルトでは、速度と精度の一般的に良い組み合わせを持つKD-Treeアルゴリズムに基づいて検索が行われます。また、Z スコアの標準化 (すべてのフィールドが平均 0 で標準偏差が 1) または単位区間変換 (各フィールドの値が 0 から 1 の範囲) を使用して、元のデータまたはデータを使用して計算を基準にして標準化することができます。

ユークリッド距離の計算はフィールドスケールの違いに非常に敏感であるため、このツールでは何らかのフィールド標準化を使用することをお勧めします(たとえば、未変換の世帯収入と年齢データのレベルと範囲は非常に異なります)。このメソッドの性質上、数値フィールドのみを入力として使用できます。このツールはR FNNパッケージを使用します。

このツールはRツールを使用します。[オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用するパッケージをインストールします。参照: 予測ツールのダウンロードとご使用

入力の接続

このツールは、2 つの Alteryx データ ストリームを受け入れます。右のストリームは、"クエリ" ストリームは、行は、左側のストリーム内の最も近い隣人の選択された数は、"データ" ストリームです。

ツール設定

  • 一意キーフィールド: クエリとデータストリーム内のレコード間のリレーションシップを識別するために、このツールに一意のキーが必要です。
  • フィールド (複数のフィールドを選択します): クラスター ソリューションの構築に使用する数値フィールドを選択します。
  • フィールドを標準化する:このオプションを選択すると、Z スコアまたは単位間隔の標準化を使用してフィールドを標準化できます。
    • z スコアの標準化: z スコア変換では、フィールドの値から各フィールドの平均値を減算し、フィールドの標準偏差で除算します。この結果、平均値がゼロで標準偏差が1の新しいフィールドが作成されます。
    • 単位間隔の標準化: 単位間隔の変換では、フィールドの値からフィールドの最小値を減算し、そのフィールドの最大値と最小数の差で除算を行います。これにより、0から1の範囲の値を持つ新しいフィールドが作成されます。K最近傍計算は、特にあるフィールドが別のフィールドと非常に異なるスケールにある場合、データのスケーリングに対して非常に敏感です。その結果、データのスケーリングは何か考慮すべきものとなります。
  • 検索する近傍の数: デフォルトの (および最小) 数は、隣接する近傍の 1 (最も近い) です。最大値は100です。
  • 近傍の検索に使用するアルゴリズム: 計算時間と精度が異なる方法です。デフォルトのアルゴリズムはKD-Treeで、一般的に計算時間と精度の両方を持ちます。線形検索は、真の最も近い近傍を見つけることが保証されていますが、計算コストが非常に高くなります。の 1 つを選択します。
    • カバーツリー
    • KDツリー
    • VR:Venableとリプリーが使用する方法、2002年。
    • CR: 変更された距離メジャーに基づく VR アルゴリズムのバージョン。
    • 線形検索: クエリ ストリーム内の各ポイントからデータ ストリーム内のすべてのポイントまでの距離を計算します。

出力を表示する

  • Nアンカー: クエリストリーム内の各ポイントに対して、一意のキー値と近くの近傍の数への距離を与えるテーブルで構成されます (クエリストリーム内の各レコードの一意キーによって識別されます)。望ましい近傍の数が2であり、ユニークなキーフィールド名がIDであれば、この出力データストリームはフィールドID、ID_1(最近傍のためのユニークキー)、Dist_1(最近傍のユニークなキー)、ID_2(2番目の最近傍のユニークキー)、Dist_2(2番目の最近傍までのユークリッド距離)を持ちます。
  • Mアンカー: 一意のキーフィールド、標準化されたデータ値、およびデータストリームとクエリの両方のレコードのデータまたはクエリストリームにレコードがあるかどうかのインジケーター (__Type__ フィールド) を提供します。

-ERR:REF-NOT-FOUND-*en.wikipedia.org/wiki/Cover_tree
**-ERR:REF-NOT-FOUND-en.wikipedia.org/wiki/K-d_tree
ヴァーゼル、W.N.、リプリー、B.D.(2002)、S、第4編、スプリンガー、ベルリンとの現代応用統計。

Was This Helpful?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support.