Ferramenta de regras de MB

A ferramenta regras de MB leva dados de transações e, depois de transformar os dados, cria um conjunto de regras de associação usando o algoritmo apriori ou conjuntos de tipos freqüentes usando os algoritmos apriori ou Eclat. Um relatório de Resumo de ambos os dados de transação e as regras/conjuntos de objetos é produzido, juntamente com um objeto de modelo que pode ser investigado ainda mais em um processo downstream.

Regras e conjuntos de itens diferem nessas regras de associação implicam uma relação específica e causal entre os Items de um grupo, enquanto conjuntos de itens consistem em grupos que freqüentemente coexistem em transações. No caso de regras de associação, a presença de algum subconjunto de itens em uma transação (os itens do lado esquerdo ou LHS) leva à inclusão de outros itens na transação (os itens do lado direito, ou RHS).

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.

Configure a ferramenta

Estrutura de dados de entrada

Dois formatos diferentes dos dados de entrada são possíveis. O primeiro formato consiste em registros que contêm um único identificador de item junto com um identificador para a transação que o item estava contido em (um conjunto de pares de transações de item exclusivos). O segundo formato consiste em um único registro por transação que contém uma lista delimitada de itens contidos na transação.

  1. Um item por registro com uma chave de transação: essa opção corresponde aos pares de itens de transação exclusivos. Nesta opção, o usuário precisa especificar dois campos no fluxo de dados usando as opções:
    • Selecione o campo de chave de transação: o inteiro ou o campo orientado a cadeia de caracteres que contém o campo identificador de transação.
    • Selecione o campo que contém o identificador de item: o inteiro ou o campo orientado a cadeia de caracteres que contém os identificadores de item.
  2. Uma transação por registro com todos os itens em um único campo (internamente delimitados): essa opção corresponde ao formato em que uma transação está contida em um único registro. Para esse formato, o usuário precisa especificar dois campos no fluxo de dados usando as opções:
    • Selecione o campo com os itens de transação delimitados: o campo orientado a cadeia de caracteres que contém as listas de item de transação delimitadas.
    • Forneça o caractere delimitador usado para separar itens em uma transação: o caractere delimitador, como uma vírgula.

Método para usar

Os dois algoritmos mais comumente usados para localizar regras de associação e conjuntos de tipos freqüentes são fornecidos, apriori e Eclat. O algoritmo apriori emprega a pesquisa de nível sábio para três tipos de conjuntos de jogos freqüentes (freqüente, maximamente freqüente e fechado freqüente), regras de associação ou associação hyperedgesets. O algoritmo Eclat usa operações de interseção simples para Agrupamento de classes de equivalência junto com passagem de treliça de baixo para cima para localizar os três tipos de conjuntos de modelos freqüentes. Além de selecionar o método a ser usado, o usuário precisa especificar o que encontrar (por exemplo, conjuntos de adições, regras ou hyperedgesets). As opções são:

  1. Apriori: esta opção seleciona o algoritmo apriori. Com esse método, o usuário pode localizar os conjuntos de itens freqüentes, os conjuntos de Items maximamente freqüentes, os conjuntos de artigos freqüentes fechados, as regras de associação (o padrão) ou a associação hyperedgesets.
  2. Eclat: esta opção seleciona o algoritmo Eclat para localizar conjuntos de opções. O usuário especifica se os conjuntos de tipos freqüentes, os conjuntos de tipos maximamente freqüentes ou os conjuntos de tipos freqüentes fechados devem ser encontrados.

Parâmetros de controle

Os parâmetros de controle influenciam a natureza das regras de associação, conjuntos de tipos freqüentes ou associação hyperedgesets que são extraídos dos dados de transação. Esses parâmetros são:

  1. O número mínimo permitido de itens em uma regra ou conjunto de itens: esse parâmetro limita as regras retornadas ou conjuntos de itens para conter pelo menos o número especificado de Items. Por padrão, seu valor é definido como 1 (também valor mínimo), mas pode ser definido como um número maior. As escolhas naturais para este parâmetro são 1 ou 2.
  2. O nível mínimo exigido de suporte para uma regra ou conjunto de itens: suporte é a proporção de transações que contêm os itens na regra de conjunto de itens ou associação. O valor padrão para este parâmetro é 0, 2, mas pode ser definido entre 0, 2 e 1. Em geral, quanto menor o valor desse parâmetro, maior o número de regras ou conjuntos de valores são retornados. Em alguns casos, o número de regras ou conjuntos de valores retornados pode esgotar a memória do sistema disponível dos usuários, portanto, um valor muito pequeno não deve ser usado.
  3. O nível mínimo exigido de confiança para uma regra ou um item de itens (válido somente para apriori): a confiança é a proporção de transações em que os itens RHS estão nas transações que também contêm os itens LHS. Em outras palavras, é uma medida da probabilidade de que os itens RHS estarão na transação quando o LHS também estiver na transação. Esta medida só é aplicável no caso do algoritmo apriori. Como com o parâmetro support, menor o valor desse parâmetro, maior o número de regras ou conjuntos de valores são retornados. Em alguns casos, o número de regras ou conjuntos de valores retornados pode esgotar a memória do sistema disponível dos usuários, portanto, um valor muito pequeno não deve ser usado.