Herramienta de reglas MB
La herramienta MB rules toma datos de transacciones y, después de transformar los datos, crea un conjunto de reglas de asociación utilizando el algoritmo Apriori o itemsets frecuentes utilizando los algoritmos Apriori o brillo. Se produce un informe resumido de los datos de la transacción y de las reglas/itemsets, junto con un objeto modelo que puede ser investigado más a posteriori en un proceso descendente.
Las reglas y itemsets difieren en que las reglas de asociación implican una relación causal específica entre los elementos de un grupo, mientras que los conjuntos de elementos consisten en grupos que frecuentemente coexisten en las transacciones. En el caso de las reglas de asociación, la presencia de algún subconjunto de elementos de una transacción (los elementos del lado izquierdo o LHS) lleva a la inclusión de otros elementos en la transacción (los elementos del lado derecho o RHS).
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.
Configurar la herramienta
Estructura de los datos de entrada
Son posibles dos formatos diferentes de los datos de entrada. El primer formato consta de registros que contienen un identificador de elemento único junto con un identificador para la transacción en la que se contenía el elemento (un conjunto de pares de transacciones de elementos únicos). El segundo formato consta de un único registro por transacción que contiene una lista delimitada de elementos incluidos en la transacción.
- Un elemento por registro con una clave de transacción: esta opción corresponde a los pares de transacciones de elementos únicos. En esta opción, el usuario debe especificar dos campos en la secuencia de datos mediante las opciones:
- Seleccione el campo clave de transacción: el entero o el campo orientado a cadena que contiene el campo Identificador de transacción.
- Seleccione el campo que contiene el identificador de elemento: el entero o el campo orientado a cadena que contiene los identificadores de elemento.
- Una transacción por registro con todos los elementos en un único campo (delimitado internamente): esta opción corresponde al formato en el que una transacción está contenida en un único registro. Para este formato, el usuario debe especificar dos campos en la secuencia de datos mediante las opciones:
- Seleccione el campo con los elementos de transacción delimitados: el campo orientado a cadena que contiene las listas de elementos de transacción delimitadas.
- Proporcione el carácter delimitador utilizado para separar los elementos de una transacción: el carácter delimitador, como una coma.
método que se debe utilizar
Los dos algoritmos más de uso general para encontrar reglas de la asociación y itemsets frecuente se proporcionan, Apriori y brillo. El algoritmo de Apriori emplea la búsqueda LEVEL-Wise para tres tipos de itemsets frecuente (frecuente, máximo frecuente, y cerrado frecuente), las reglas de la asociación, o la Asociación hyperedgesets. El algoritmo de brillo utiliza operaciones de intersección sencillas para agrupar la clase de equivalencia, junto con la traversación de enrejado ascendente para encontrar los tres tipos de itemsets frecuentes. Además de seleccionar el método a utilizar, el usuario debe especificar qué buscar (por ejemplo, itemsets, rules o hyperedgesets). Las opciones son:
- Apriori: esta opción selecciona el algoritmo Apriori. Con este método, el usuario puede encontrar el itemsets frecuente, itemsets máximo frecuente, los sistemas de artículo frecuentes cerrados, las reglas de la Asociación (el defecto), o la Asociación hyperedgesets.
- Brillo: esta opción selecciona el algoritmo de brillo para encontrar itemsets. El usuario especifica si itemsets frecuente, itemsets máximo frecuente, o itemsets frecuente cerrado debe ser encontrado.
Parámetros de control
Los parámetros de control influyen en la naturaleza de las reglas de asociación, itemsets frecuentes o hyperedgesets de asociación que se extraen de los datos de la transacción. Estos parámetros son:
- El número mínimo permisible de elementos de una regla o ítems: este parámetro limita las reglas devueltas o itemsets para contener al menos el número especificado de elementos. Por defecto su valor se establece en 1 (también el valor mínimo), pero se puede establecer en un número más alto. Las opciones naturales para este parámetro son 1 o 2.
- El nivel mínimo requerido de soporte para una regla o ítems: la compatibilidad es la proporción de transacciones que contienen los elementos de la regla de asociación o ítems. El valor por defecto para este parámetro es 0,02, pero se puede establecer entre 0,002 y 1. En general, cuanto menor sea el valor de este parámetro, mayor será el número de reglas o itemsets que se devuelvan. En algunos casos, el número de reglas devueltas o itemsets puede agotar la memoria del sistema disponible de los usuarios, por lo que no se debe utilizar un valor demasiado pequeño.
- El nivel mínimo requerido de confianza para una regla o ítems (válido sólo para Apriori): la confianza es la proporción de transacciones donde los elementos RHS están en las transacciones que también contienen los elementos LHS. En otras palabras, es una medida de la probabilidad de que los elementos RHS se encuentren en la transacción cuando los LHS estén también en la transacción. Esta medida sólo es aplicable en el caso del algoritmo Apriori. Al igual que con el parámetro support, cuanto menor es el valor de este parámetro, mayor es el número de reglas o itemsets que se devuelven. En algunos casos, el número de reglas devueltas o itemsets puede agotar la memoria del sistema disponible de los usuarios, por lo que no se debe utilizar un valor demasiado pequeño.