MB Rules Tool

Ferramenta De Regras De MB

Versão:
2023.1
Last modified: September 25, 2020

A ferramenta regras de MB leva dados de transações e, depois de transformar os dados, cria um conjunto de regras de associação usando o algoritmo apriori ou conjuntos de tipos freqüentes usando os algoritmos apriori ou Eclat. Um relatório de Resumo de ambos os dados de transação e as regras/conjuntos de objetos é produzido, juntamente com um objeto de modelo que pode ser investigado ainda mais em um processo downstream. 

Regras e conjuntos de itens diferem nessas regras de associação implicam uma relação específica e causal entre os Items de um grupo, enquanto conjuntos de itens consistem em grupos que freqüentemente coexistem em transações. No caso de regras de associação, a presença de algum subconjunto de itens em uma transação (os itens do lado esquerdo ou LHS) leva à inclusão de outros itens na transação (os itens do lado direito, ou RHS).

Esta ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Consulte Baixar e utilizar ferramentas preditivas.

Configuração da ferramenta

Estrutura de dados de entrada

Dois formatos diferentes dos dados de entrada são possíveis. O primeiro formato consiste em registros que contêm um único identificador de item junto com um identificador para a transação que o item estava contido em (um conjunto de pares de transações de item exclusivos). O segundo formato consiste em um único registro por transação que contém uma lista delimitada de itens contidos na transação.

  1. Um item por registro com uma chave de transação: Essa opção corresponde aos pares exclusivos de transação de item. Nesta opção, o usuário precisa especificar dois campos no fluxo de dados usando as opções:
    • Selecione o campo de chave de transação: O inteiro ou campo orientado a cadeia de caracteres que contém o campo identificador de transação.
    • Selecione o campo que contém o identificador de item: O inteiro ou campo orientado a seqüência de caracteres que contém os identificadores de item.
  2. Uma transação por registro com todos os itens em um único campo (delimitado internamente): Essa opção corresponde ao formato em que uma transação está contida em um único registro. Para esse formato, o usuário precisa especificar dois campos no fluxo de dados usando as opções:
    • Selecione o campo com os itens de transação delimitados: O campo orientado a seqüência de caracteres que contém as listas de item de transação delimitada.
    • Forneça o caractere delimitador usado para separar itens em uma transação: O caractere delimitador, como uma vírgula.

Método para usar

Os dois algoritmos mais comumente usados para localizar regras de associação e conjuntos de tipos freqüentes são fornecidos, apriori e Eclat. O algoritmo apriori emprega a pesquisa de nível sábio para três tipos de conjuntos de jogos freqüentes (freqüente, maximamente freqüente e fechado freqüente), regras de associação ou associação hyperedgesets. O algoritmo Eclat usa operações de interseção simples para Agrupamento de classes de equivalência junto com passagem de treliça de baixo para cima para localizar os três tipos de conjuntos de modelos freqüentes. Além de selecionar o método a ser usado, o usuário precisa especificar o que encontrar (por exemplo, conjuntos de adições, regras ou hyperedgesets). As opções são:

  1. A apriori: Esta opção seleciona o algoritmo apriori. Com esse método, o usuário pode localizar os conjuntos de itens freqüentes, os conjuntos de Items maximamente freqüentes, os conjuntos de artigos freqüentes fechados, as regras de associação (o padrão) ou a associação hyperedgesets.
  2. Eclat: esta opção seleciona o algoritmo Eclat para localizar conjuntos de opções. O usuário especifica se os conjuntos de tipos freqüentes, os conjuntos de tipos maximamente freqüentes ou os conjuntos de tipos freqüentes fechados devem ser encontrados.

Parâmetros de controle

Os parâmetros de controle influenciam a natureza das regras de associação, conjuntos de tipos freqüentes ou associação hyperedgesets que são extraídos dos dados de transação. Esses parâmetros são:

  1. O número mínimo permitido de itens em uma regra ou Itemset: Este parâmetro limita as regras retornadas ou conjuntos de itens para conter pelo menos o número especificado de Items. Por padrão, seu valor é definido como 1 (também valor mínimo), mas pode ser definido como um número maior. As escolhas naturais para este parâmetro são 1 ou 2.
  2. O nível mínimo exigido de suporte para uma regra ou conjunto de itens: O suporte é a proporção de transações que contêm os itens na regra de conjunto ou de associação. O valor padrão para este parâmetro é 0, 2, mas pode ser definido entre 0, 2 e 1. Em geral, quanto menor o valor desse parâmetro, maior o número de regras ou conjuntos de valores são retornados. Em alguns casos, o número de regras ou conjuntos de valores retornados pode esgotar a memória do sistema disponível dos usuários, portanto, um valor muito pequeno não deve ser usado.
  3. O nível mínimo exigido de confiança para uma regra ou conjunto de itens (válido apenas para apriori): A confiança é a proporção de transações em que os itens de RHS estão nas transações que também contêm os itens do LHS. Em outras palavras, é uma medida da probabilidade de que os itens RHS estarão na transação quando o LHS também estiver na transação. Esta medida só é aplicável no caso do algoritmo apriori. Como com o parâmetro support, menor o valor desse parâmetro, maior o número de regras ou conjuntos de valores são retornados. Em alguns casos, o número de regras ou conjuntos de valores retornados pode esgotar a memória do sistema disponível dos usuários, portanto, um valor muito pequeno não deve ser usado.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.