MBルールツール
MB ルールツールはトランザクションデータを受け取り、データを変換した後、 Apriori またはエクラアルゴリズムを使用して Apriori アルゴリズムまたは頻繁なアイテムセットを使用して一連のアソシエーションルールを作成します。 トランザクションデータとルール/アイテムセットの要約レポートが、ダウンストリームプロセスでさらに調査できるモデルオブジェクトとともに生成されます。
ルールとアイテムセットは、割当ルールがグループ内のアイテム間の特定の因果関係を暗示するのに対し、アイテムセットがトランザクションで頻繁に同時発生するグループで構成されている点で異なります。 割当ルールの場合、トランザクション内にアイテムのサブセット(左側のアイテムまたはLHS)が存在すると、トランザクションに他のアイテム(右側のアイテムまたはRHS)が含まれます。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード ] に進み、 Alteryxダウンロード/ライセンスポータル R とパッケージをインストールするには、 Rツール。
ツールを設定する
入力データ構造
入力データの2つの異なる形式が可能です。 第1の形式は、単一のアイテム識別子と、そのアイテムが含まれていたトランザクションの識別子(ユニークなアイテム - トランザクションペアのセット)を含むレコードからなります。 2番目の形式は、トランザクションに含まれるアイテムの区切りリストを含むトランザクションごとに1つのレコードで構成されます。
- トランザクションキーを持つレコードごとに1つのアイテム: このオプションは、一意の品目トランザクションペアに対応します。 このオプションでは、ユーザーはオプションを使用してデータストリームに2つのフィールドを指定する必要があります。
- [トランザクションキー] フィールド: [トランザクション id] フィールドを含む整数または文字列指向のフィールドを選択します。
- 項目識別子を含むフィールドを選択します: 項目識別子を含む整数または文字列指向のフィールド。
- 単一の (内部で区切られた) フィールド内のすべての項目を持つレコードごとに1つのトランザクション: このオプションは、トランザクションが1つのレコードに含まれている形式に対応します。 この形式の場合、ユーザーはオプションを使用してデータストリーム内で2つのフィールドを指定する必要があります。
- 区切られたトランザクション項目を持つフィールドを選択します: 区切られたトランザクション項目リストを含む文字列指向フィールド。
- トランザクション内の項目を区切るために使用する区切り文字(コンマなどの区切り文字)を指定します。
使用する方法
割当ルールと頻出アイテムセットを見つけるのに最も一般的に使用される2つのアルゴリズム、AprioriとEclatが提供されています。 Aprioriアルゴリズムは、3つのタイプの頻出アイテムセット(頻出、最大頻出、および閉鎖頻出)、割当ルールまたは割当ハイパーエッジセットのレベル状検索採用します。 Eclatアルゴリズムは、等価クラスクラスター化のための単純な交差演算とボトムアップ格子トラバーサルを使用して、3つのタイプの頻出アイテムセットを見つけます。 使用するメソッドを選択することに加えて、ユーザーは何を見つけるかを指定する必要があります(たとえば、アイテムセット、ルール、ハイパーエッジセットなど)。 オプションは次のとおりです。
- Apriori: このオプションは、Apriori アルゴリズムを選択します。 この方法を使用すると、頻出アイテムセット、最大頻出アイテムセット、閉鎖頻出アイテムセット、割当ルール(デフォルト)、または割当ハイパーエッジセットのいずれかを見つけることができます。
- エクラ: このオプションは、アイテムセットを検索するためのエクラアルゴリズムを選択します。 ユーザーは、頻出アイテムセット、最大頻出アイテムセット、または閉鎖頻出アイテムセットを見つけるかどうかを指定します
コントロールパラメーター
コントロールパラメーターは、トランザクションデータから抽出された割当ルール、頻出アイテムセット、または割当ハイパーエッジセットの性質に影響を与えます。 これらのパラメーターは次のとおりです。
- ルールまたはアイテムセット内の項目の許容最小数: このパラメータは、返されるルールまたはアイテムセットに、少なくとも指定された数の項目を含めるように制限します。 デフォルトで、値は1(最小値)に設定されていますが、1より高い数値に設定することもできます。 このパラメーターの自然な選択肢は1または2です。
- ルールまたはアイテムセットに必要な最低限のサポートレベル: サポートは、アイテムセットまたはアソシエーションルールの項目を含むトランザクションの割合です。 このパラメーターのデフォルト値は0.02ですが、0.002〜1の間で設定できます。 一般に、このパラメーターの値が小さいほど、ルールまたはアイテムセットの数が多くなります。 場合によっては、返されるルールまたはアイテムセットの数が利用可能なシステムメモリを使い果たす可能性があるため、小さすぎる値は使用しないでください。
- ルールまたはアイテムセットに対して最低限必要な信頼レベル (Apriori に対してのみ有効): 信頼とは、右辺の項目が含まれているトランザクションの中で、角形のアイテムが存在するトランザクションの割合です。 言い換えれば、これはLHSがトランザクションにも含まれているときに、RHSアイテムがトランザクションに入る確率の測定値です。 この測定値は、Aprioriアルゴリズムの場合にのみ適用されます。 supportパラメーターの場合と同様に、このパラメーターの値が小さいほど、ルールまたはアイテムセットの数が多くなります。 場合によっては、返されるルールまたはアイテムセットの数が利用可能なシステムメモリを使い果たす可能性があるため、小さすぎる値は使用しないでください。