Outil Affinité du PM

L’outil Affinité du PM utilise les données de transaction et construit une matrice dans laquelle chaque ligne correspond à une transaction et les colonnes correspondent au jeu d’éléments pouvant apparaître dans la transaction. Si une transaction contient un élément, celui-ci a la valeur 1 dans la matrice, 0 dans le cas contraire. La matrice est ensuite utilisée pour construire une matrice de mesures d’affinité entre différents éléments en ce qui concerne la probabilité de figurer dans la même transaction. Par conséquent, s’il y a 500 éléments, la matrice correspondante contient 500 lignes et colonnes.

Cet outil effectue une mise à l’échelle en fonction du nombre d’enregistrements de transaction, mais est limité en ce qui concerne le nombre d’éléments uniques pouvant être gérés. Utilisant les configurations courantes d'ordinateur portatif et de bureau, la limite est susceptible d'être entre 3 000 et 5 000 articles uniques.

Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.

Configurer l’outil

  1. Sélectionnez le champ cléde transaction: le champ sélectionné doit être numérique et doit contenir des ID pour les transactions.
  2. Sélectionnez le champ qui contient l'identificateur d'élément: le champ sélectionné doit contenir des noms ou des ID pour les éléments (à comparer)
  3. Mesure d'affinité
    • Distance cosinus: mesure de la distance (i.e. dissimilitude) entre deux éléments-entre 0 (la plus semblable) et 1 (moins similaire).
    • Similitude cosinus: une mesure de similitude entre deux éléments-entre 0 (moins similaire) et 1 (le plus semblable).
    • Co-occurrence: A Count-le nombre de transactions dans lesquelles les deux éléments étaient présents
  4. Nombre d'enregistrements par segment de données: nombre maximal d'enregistrements à traiter simultanément.

*https://en.wikipedia.org/wiki/Cosine_similarity