Outil Règles du PM

L'outil règles MB prend les données de transaction et, après avoir transformé les données, crée soit un ensemble de règles d'association à l'aide de l'algorithme Apriori, soit des jeux fréquents à l'aide des algorithmes Apriori ou Eclat. Un récapitulatif des données de transaction et des règles/jeux d’éléments est généré, avec un objet modèle qui peut être examiné plus en profondeur dans un processus en aval.

Les règles et les jeux d’éléments diffèrent dans le sens où les règles d’association impliquent une relation causale spécifique entre les éléments d’un groupe, tandis que les jeux d’éléments sont constitués de groupes qui présentent fréquemment une co-occurrence dans des transactions. Dans le cas de règles d’association, la présence d’un sous-ensemble d’éléments dans une transaction (éléments côté gauche ou LHS) entraîne l’inclusion d’autres éléments dans la transaction (éléments côté droit ou RHS).

Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.

Configurer l’outil

Structure d’entrée de données

Deux formats différents sont possibles pour l’entrée de données. Le premier format est constitué d’enregistrements qui contiennent un seul identifiant d’élément, ainsi qu’un identifiant de la transaction dans laquelle l’élément est contenu (jeu de paires élément-transaction uniques). Le deuxième format est constitué d’un seul enregistrement par transaction qui contient une liste délimitée d’éléments contenus dans la transaction.

  1. Un élément par enregistrement avec une clé de transaction: cette option correspond aux paires article-transaction uniques. Vous devez définir deux champs dans le flux de données à l’aide de ces options :
    • Sélectionnez le champ clé de transaction: le champ entier ou orienté chaîne qui contient le champ identificateur de transaction.
    • Sélectionnez le champ qui contient l'identificateur d'élément: le champ entier ou orienté chaîne qui contient les identificateurs d'élément.
  2. Une transaction par enregistrement avec tous les éléments d'un seul champ (délimité en interne): cette option correspond au format dans lequel une transaction est contenue dans un enregistrement unique. Pour ce format, vous devez définir deux champs dans le flux de données à l’aide de ces options :
    • Sélectionnez le champ avec les éléments de transaction délimités: le champ orienté chaîne qui contient les listes d'éléments de transaction délimités.
    • Fournir le caractère de délimiteur utilisé pour séparer les éléments d'une transaction: le caractère de délimiteur tel qu'une virgule.

Méthode à utiliser

Les deux algorithmes les plus couramment utilisés pour rechercher des règles d’association et les jeux d’éléments fréquents sont fournis : Apriori et Éclat. L’algorithme Apriori utilise une recherche de niveau pour trois types de jeux d’éléments fréquents (fréquent, fréquent maximal et fréquent fermé), les règles d’association ou les jeux hyperedge d’association. L’algorithme Éclat utilise des opérations d’intersection simples pour le clustering de classe d’équivalence et la traversée en treillis de bas en haut pour rechercher les trois types de jeux d’éléments fréquents. Outre la sélection de la méthode à utiliser, vous devez indiquer les éléments à rechercher (par exemple, jeux d’éléments, règles ou jeux hyperedge). Les options sont les suivantes :

  1. Apriori: cette option sélectionne l'algorithme Apriori. Grâce à cette méthode, vous pouvez rechercher les jeux d’éléments fréquents, très fréquents et fréquents fermés, les règles d’association (par défaut) ou les jeux hyperedge d’association.
  2. Eclat: cette option sélectionne l'algorithme Eclat pour trouver jeux. Vous indiquez les éléments à rechercher : jeux d’éléments fréquents, très fréquents ou fréquents fermés.

Paramètres de contrôle

Les paramètres de contrôle influencent la nature des règles d’association, des jeux d’éléments fréquents ou des jeux hyperedge d’association extraits des données de transaction. Les paramètres sont les suivants :

  1. Nombre minimal autorisé d'éléments dans une règle ou ItemSet: ce paramètre limite les règles retournées ou jeux pour contenir au moins le nombre spécifié d'éléments. La valeur par défaut est 1 (valeur minimale), mais vous pouvez définir une valeur supérieure. La valeur naturelle pour ce paramètre est 1 ou 2.
  2. Le niveau minimum requis de prise en charge pour une règle ou ItemSet: prise en charge est la proportion des transactions qui contiennent les éléments de la règle ItemSet ou Association. La valeur par défaut de ce paramètre est 0,02, mais elle peut être définie entre 0,002 et 1. En général, plus la valeur de ce paramètre est faible, plus le nombre de règles ou de jeux d’éléments renvoyés est important. Dans certaines instances, le nombre de règles ou de jeux d’éléments renvoyés peut occuper toute la mémoire système disponible. Il est dès lors conseillé de ne pas utiliser une valeur trop faible.
  3. Le niveau minimum requis de confiance pour une règle ou ItemSet (valide uniquement pour Apriori): la confiance est la proportion des transactions où les articles RHS sont dans les transactions qui contiennent également les éléments de la droite. En d’autres termes, il s’agit d’une mesure de la probabilité que les éléments RHS seront dans la transaction lorsque les éléments LHS seront également dans la transaction. Cette mesure ne s’applique que dans le cas de l’algorithme Apriori. Tout comme pour le paramètre de support, plus la valeur de ce paramètre est faible, plus le nombre de règles ou de jeux d’éléments renvoyés est important. Dans certaines instances, le nombre de règles ou de jeux d’éléments renvoyés peut occuper toute la mémoire système disponible. Il est dès lors conseillé de ne pas utiliser une valeur trop faible.