Gamma Regression Tool Icon

Ferramenta De Regressão De Gama

Versão:
2022.3
Last modified: September 25, 2020

A ferramenta de regressão de gama relaciona uma gama distribuída, variável estritamente positiva de interesse (variável de destino) a uma ou mais variáveis (variáveis do preditor) que se espera que tenham influência na variável de destino.

Em um número de aplicações, os valores da variável de destino são sempre estritamente positivos (isto é, nunca são zero ou negativos), mas tendem a se aglomerar em direção ao intervalo mais baixo dos valores observados, mas em uma pequena minoria de casos assumir grandes valores. Variáveis-alvo dessa natureza representam um processo de geração de dados que não é consistente com as suposições de normalidade subjacentes ao modelo de regressão linear tradicional. No entanto, os valores são sempre positivos e nem sempre serão números inteiros, portanto não seguem uma distribuição de Poisson ou um processo baseado em distribuição binomial negativa. Eles são consistentes com um processo baseado em uma distribuição gama e podem ser estimados usando métodos semelhantes à regressão linear, através da estrutura do modelo linear generalizado.

Com esta ferramenta, se os dados de entrada são de um fluxo de dados Alteryx regular, então a função Open Source R GLM é usada para a estimativa do modelo. Se a entrada vier de uma ferramenta de entrada XDF ou da ferramenta saída XDF,a função RxGlm Revo ScaleR será usada para estimativa de modelo. A vantagem de usar a função baseada no Revo ScaleR é que permite que conjuntos de dados muito maiores (fora de memória) sejam analisados, mas ao custo de uma sobrecarga adicional para criar um arquivo XDF e com a incapacidade de criar parte da saída de diagnóstico do modelo disponível com as funções R de código aberto.

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixe ferramentas preditivas e faça login no portal Alteryx Downloads and Licenses para instalar R e os pacotes utilizados pela Ferramenta R. Consulte Baixar e Usar Ferramentas Preditivas.

Conectar uma entrada

Um fluxo de dados Alteryx ou Xdf do de metadados que inclui um campo de destino de interesse junto com um ou mais possíveis campos de previsão.

Configurar a ferramenta

Use a guia Configuração para definir os controles para a regressão gama.

  • Nome do modelo: Cada modelo precisa ser dado um nome para que ele possa ser identificado posteriormente. Os nomes de modelo devem começar com uma letra e podem conter letras, números e o período de caracteres especiais (".") e sublinhado ("_"). Nenhum outro caractere especial é permitido, e R é diferencia maiúsculas de minúsculas.
  • Selecione a variável de destino: Selecione o campo a partir do fluxo de dados que deseja prever.
  • Selecione as variáveis preditoras: Escolha os campos do fluxo de dados que você acredita que "causam" alterações no valor da variável alvo. As colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.
  • Tipo demodelo : Uma caixa suspensa com as opções de log, inverso e identidade. Essa opção determina a função de vínculo a ser usada com a família Gamma para estimar o modelo linear generalizado.
  • Usar pesos amostrais na estimativa do modelo? (Opcional)... Verifique a caixa de seleção e selecione um campo de peso a partir do fluxo de dados para estimar um modelo que usa peso amostral.

Use a guia Opções gráficas para definir os controles para a saída gráfica.

  • Resolução do gráfico: Selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).
    • A resolução mais baixa cria um arquivo menor e é melhor para visualização em um monitor.
    • Maior resolução cria um arquivo maior com melhor qualidade de impressão.

Ver a saída

  • O âncora: Consiste em uma tabela do modelo serializado com seu nome de modelo.
  • R âncora: Consiste nos trechos do relatório gerados pela ferramenta Gamma Regression: um resumo estatístico, uma Análise tipo II de Desvio (ANOD) e Parcelas De Diagnóstico Básico. A análise do tipo II da tabela de desvio e as parcelas diagnósticas básicas não são produzidas quando a entrada do modelo provém de uma ferramenta de entrada de saída Xdf do ou Xdf do.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.