Skip to main content

Gamma Regression Tool Icon Ferramenta Regressão Gama

Fluxo de trabalho de exemplo

A ferramenta Regressão de Contagem tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

Relacione uma variável de interesse (variável-alvo) com distribuição gama e estritamente positiva a uma ou mais variáveis (variáveis preditoras) que podem ter influência sobre a variável-alvo.

In a number of applications, the values of the target variable are always strictly positive (i.e., are never zero or negative), but tend to cluster toward the lower range of the observed values, but in a small minority of cases take on large values. Target variables of this nature represent a data generation process that is not consistent with the Normality assumptions underlying the traditional linear regression model. However, the values are always positive and will not always be integer numbers, so they do not follow a Poisson distribution or Negative Binomial distribution based process. They are consistent with a process based on a Gamma distribution and can be estimated using methods similar to linear regression, via the generalized linear model framework.

Com essa ferramenta, se os dados de entrada vierem de um fluxo de dados regular do Alteryx, será usada a função open-source GLM do R para o treinamento do modelo. Se a entrada vier de uma ferramenta Entrada XDF ou Saída XDF, será usada a função Revo ScaleR rxGlm para o treinamento do modelo. A vantagem de usar a função baseada em Revo ScaleR é que, com ela, é possível analisar conjuntos de dados muito maiores, mas ela tem custos extras para criar um arquivo XDF, não cria algumas das saídas de diagnóstico do modelo que estão disponíveis com as funções open-source do R e só pode gerar modelos de regressão de Poisson.

Essa ferramenta utiliza a ferramenta R. Vá para OpçõesBaixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.

Conectar uma entrada

Conecte um fluxo de dados do Alteryx ou um fluxo de metadados XDF que inclua um campo-alvo de interesse juntamente com um ou mais possíveis campos preditores.

Configurar a ferramenta

Use a guia "Configuração" para definir os controles para o diagrama de série temporal.

  • Nome do modelo: cada modelo precisa de um nome para que possa ser identificado mais tarde. Os nomes de modelo devem começar com uma letra e podem conter letras, números e os caracteres especiais ponto (".") e sublinhado ("_"). Nenhum outro caractere especial é permitido, e a ferramenta R diferencia maiúsculas de minúsculas.

  • Selecione a variável-alvo: selecione o campo do fluxo de dados que você deseja prever.

  • Selecione as variáveis preditoras: escolha os campos do fluxo de dados que você pressupõe causem alterações no valor da variável-alvo. Colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.

  • Model type: A dropdown box with the options of log, inverse, and identity. This option determines the link function to be used with the Gamma family in estimating the generalized linear model.

  • Usar pesos de amostragem no treinamento do modelo: marque essa caixa de seleção e selecione o campo de peso no fluxo de dados para treinar o modelo.

Use a guia "Opções de gráfico" para definir os controles para o gráfico de saída (opcional).

  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).

    • Resoluções mais baixas geram um arquivo menor, melhor para visualização em um monitor.

    • Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.

Visualizar a saída

  • Âncora O: consiste em uma tabela do modelo serializado com o nome correspondente.

  • Âncora R: consiste em fragmentos de relatório gerados pela ferramenta Regressão de Contagem: um resumo estatístico, uma análise de desvio do tipo II (ANOD) e gráficos de diagnóstico básicos. A tabela de análise de desvio do tipo II e os gráficos de diagnóstico básicos não são gerados quando a entrada do modelo vem de uma ferramenta Saída XDF ou Entrada XDF.