MBアフィニティーツール

[MBアフィニティー]ツールは「トランザクション」データを取り出し、各行がトランザクションであり列がトランザクションに現れる「アイテム」のセットであるマトリックスを構成します。 アイテムがトランザクション内に存在した場合、そのアイテムはマトリックスに1の値を持ち、存在しなかった場合には0を持ちます。 次いで、マトリックスは、同じトランザクションになる可能性に関して異なるアイテム間のアフィニティー測定のマトリックスを作成するために使用されます。 その結果、500個のアイテムがある場合、それによって生じるマトリックスには500個の行と列があります。

このツールは、トランザクションレコードの数に対応しますが、処理できるユニークなアイテムの数には制限があります。 一般的なラップトップとデスクトップの構成を使用して、制限は3000と5000ユニークなアイテムの間になりそうです。

このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには Rツール。 参照: 予測ツールをダウンロードして使用する

ツールを設定する

  1. [トランザクションキー] フィールドを選択します: 選択したフィールドは数値で、トランザクションの id が含まれている必要があります。
  2. 項目識別子を含むフィールドを選択します: 選択したフィールドには、項目の名前または id を含める必要があります (比較する場合)。
  3. 親和性尺度
    • コサイン距離: 2 つの項目間の距離 (すなわち相違) の尺度-0 (最も類似) と 1 (少なくとも類似) の間。
    • コサインの類似性: 2 つの項目間の類似性の尺度-0 (少なくとも類似) と 1 (最も類似) の間。
    • 共発生: カウント-両方のアイテムが存在していたトランザクションの数
  4. データチャンクごとのレコード数: 同時に処理されるレコードの最大数。

*https://en.wikipedia.org/wiki/Cosine_similarity