Herramienta de regresión gamma

La herramienta de regresión gamma relaciona una variable de interés de gamma distribuida y estrictamente positiva (variable de destino) a una o más variables (variables predictoras) que se espera que influyan en la variable de destino.

En una serie de aplicaciones, los valores de la variable de destino son siempre estrictamente positivos (es decir, nunca son cero o negativos), pero tienden a agruparse hacia el rango más bajo de los valores observados, pero en una pequeña minoría de casos asumir valores grandes. Las variables objetivo de esta naturaleza representan un proceso de generación de datos que no es coherente con las hipótesis de normalidad subyacentes al modelo de regresión lineal tradicional. Sin embargo, los valores son siempre positivos y no siempre serán números enteros, por lo que no siguen una distribución Poisson o un proceso basado en la distribución binomial negativa. Son consistentes con un proceso basado en una distribución gamma, y pueden ser estimados usando métodos similares a la regresión lineal, a través del marco de modelo lineal generalizado.

Con esta herramienta, si los datos de entrada proceden de una secuencia de datos Alteryx regular, la función GLM de código abierto se utiliza para la estimación del modelo. Si la entrada proviene ya sea de un Herramienta Datos de entrada XDF o Herramienta Datos de salida XDF, entonces la función de rxGlm del escalador de Revo se utiliza para la estimación modelo. La ventaja de usar la función basada en Revo Scaler es que permite analizar los datasets mucho más grandes (fuera de la memoria), pero al costo de sobrecarga adicional para crear un archivo XDF y con la incapacidad de crear algunos de los resultados de diagnóstico del modelo que está disponible con las funciones de código abierto R.

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.

Conectar una entrada

Un flujo de datos Alteryx o XDF de metadatos que incluye un campo de interés de destino junto con uno o varios campos predictores posibles.

Configurar la herramienta

Utilice la ficha Configuración para definir los controles de la regresión gamma.

  • Nombre del modelo: cada modelo debe recibir un nombre para poder identificarlo posteriormente. Los nombres de los modelos deben comenzar con una letra y pueden contener letras, números y el período de caracteres especiales (".") y subrayado ("_"). No se permiten otros caracteres especiales, y R distingue entre mayúsculas y minúsculas.
  • Seleccione la variablede destino: seleccione el campo de la secuencia de datos que desea predecir.
  • Seleccione las variables predictoras: elija los campos de la secuencia de datos que cree que "causan" cambios en el valor de la variable de destino.
  • Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.

  • Tipode modelo: un cuadro desplegable con las opciones de log, inversa e identidad. Esta opción determina la función de enlace que se usará con la familia gamma para estimar el modelo lineal generalizado.
  • ¿usar pesos de muestreo en estimación de modelos? (opcional)... : Haga clic en la casilla de verificación y, a continuación, seleccione un campo de peso de la secuencia de datos para estimar un modelo que utilice el peso de muestreo.

Utilice la ficha opciones gráficas para definir los controles de la salida gráfica.

  • Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi). La resolución más baja crea un archivo más pequeño y es el mejor para la visión en un monitor. Una resolución más alta crea un archivo más grande con una mejor calidad de impresión.

Ver la salida

  • O Anchor: consiste en una tabla del modelo serializado con su nombre de modelo.
  • R Anchor: consiste en los fragmentos de informe generados por la herramienta de regresión gamma: un resumen estadístico, un análisis tipo II de desviación (ANOD) y parcelas diagnósticas básicas. El análisis de tipo II de la tabla de desviación y las parcelas de diagnóstico básicas no se producen cuando la entrada del modelo proviene de una herramienta de entrada XDF OUTPUT o XDF.