MBルールツールは、トランザクションデータを取り込み、データを変換した後、関連付けルール(Aprioriアルゴリズムを使用)のセットまたは頻出アイテムセット(AprioriまたはEclatアルゴリズムを使用)を作成します。トランザクションデータとルール/アイテムセットの要約レポートが、ダウンストリームプロセスでさらに調査できるモデルオブジェクトとともに生成されます。
ルールとアイテムセットは、割当ルールがグループ内のアイテム間の特定の因果関係を暗示するのに対し、アイテムセットがトランザクションで頻繁に同時発生するグループで構成されている点で異なります。割当ルールの場合、トランザクション内にアイテムのサブセット(左側のアイテムまたはLHS)が存在すると、トランザクションに他のアイテム(右側のアイテムまたはRHS)が含まれます。
このツールはRツールを使用します。[オプション] > [予測ツールのダウンロード]に移動し、[Alteryxダウンロードとライセンス]ポータルにサインインして、Rツールで使用するパッケージとRツールをインストールします。参照: 予測ツールのダウンロードと使用
入力データの2つの異なる形式が可能です。第1の形式は、単一のアイテム識別子と、そのアイテムが含まれていたトランザクションの識別子(ユニークなアイテム - トランザクションペアのセット)を含むレコードからなります。2番目の形式は、トランザクションに含まれるアイテムの区切りリストを含むトランザクションごとに1つのレコードで構成されます。
トランザクションキーを持つレコードごとに1つのアイテム: このオプションは、ユニークなアイテムとトランザクションのペアに対応します。このオプションでは、以下のオプションを使用してデータストリームに2つのフィールドを指定する必要があります。
トランザクションキーフィールドを選択: トランザクション識別子フィールドが含まれる整数または文字列指向フィールド。
アイテム識別子を含むフィールドを選択: アイテム識別子が含まれる整数または文字列指向のフィールド。
単一の(内部で区切られた)フィールド内のすべてのアイテムを含むレコードごとに1つのトランザクション: このオプションは、トランザクションが単一のレコードに含まれる形式に対応します。この形式の場合、以下のオプションを使用してデータストリームの2つのフィールドを指定する必要があります。
区切られたトランザクションアイテムを含むアイテムを選択します: 区切り記号付きトランザクションアイテムリストが含まれる文字列指向フィールド。
トランザクション内のアイテムを分離するために使用される区切り文字を提供: カンマなどの区切り文字。
関連付けルールと頻出アイテムセットを見つけるのに最も一般的に使用される2つのアルゴリズムである、AprioriとEclatを利用できます。
Aprioriアルゴリズムは、3つのタイプの頻出アイテムセット(頻出、最大頻出、閉鎖頻出)、関連付けルール、または関連付けハイパーエッジセットにレベル状検索を採用します。
Eclatアルゴリズムは、等価クラスのクラスタリングのための単純な交差演算と、ボトムアップ格子トラバーサルを使用して、3つのタイプの頻出アイテムセットを見つけます。使用するメソッドを選択するほか、何を見つけるかを指定す必要があります(たとえば、アイテムセット、ルール、ハイパーエッジセットなど)。オプションは、次のとおりです。
Apriori: このオプションはAprioriアルゴリズムを選択します。このメソッドを使用すると、頻出アイテムセット、最大頻出アイテムセット、閉鎖頻出アイテムセット、関連付けルール(既定)、関連付けハイパーエッジセットのいずれかを見つけることができます。
Eclat: このオプションは、アイテムセットを見つけるためのEclatアルゴリズムを選択します。頻出アイテムセット、最大頻出アイテムセット、または閉鎖頻出アイテムセットを見つけるかどうかを指定します。
コントロールパラメーターは、トランザクションデータから抽出された割当ルール、頻出アイテムセット、または割当ハイパーエッジセットの性質に影響を与えます。これらのパラメーターは以下のとおりです。
ルールまたはアイテムセット内のアイテムの許容最小数: このパラメーターは、返されたルールまたはアイテムセットが少なくとも指定された数のアイテムを含むように制限します。既定では、この値は1(最小値)に設定されていますが、1より大きい数値に設定することもできます。このパラメーターの自然な選択肢は1または2です。
ルールまたはアイテムセットでのサポートの最小必要レベル: サポートは、アイテムセットまたは関連付けルール内のアイテムが含まれるトランザクションの割合です。このパラメーターの既定値は0.02ですが、0.002〜1の間で設定できます。一般に、このパラメーターの値が小さいほど、ルールまたはアイテムセットの数が多くなります。場合によっては、返されるルールまたはアイテムセットの数が利用可能なシステムメモリを使い果たす可能性があるため、小さすぎる値は使用しないでください。
ルールまたはアイテムセットでの最低限必要な信頼レベル(Aprioriのみで有効): 信頼度は、RHSアイテムを含むトランザクションにLHSアイテムも含まれているトランザクションの割合です。言い換えれば、これはLHSがトランザクションにも含まれているときに、RHSアイテムがトランザクションに入る確率の測定値です。この測定値は、Aprioriアルゴリズムの場合にのみ適用されます。supportパラメーターの場合と同様に、このパラメーターの値が小さいほど、ルールまたはアイテムセットの数が多くなります。場合によっては、返されるルールまたはアイテムセットの数が利用可能なシステムメモリを使い果たす可能性があるため、小さすぎる値は使用しないでください。