Herramienta Puntuación
La herramienta puntuación crea una estimación de una variable de destino aplicando un modelo R a un conjunto de variables predictoras suministradas. Si la variable de destino es categórica, proporciona probabilidades de que un registro (basado en la variable predictor) pertenezca a cada categoría. Si la variable de destino es continua, estima el valor de la variable de destino. Aunque se puede utilizar para evaluar el rendimiento del modelo, no lo hace por sí solo.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.
Tipo de modelo
La herramienta score puede evaluar modelos de varias ubicaciones:
- Modelo local: el modelo se arrastra al flujo de trabajo desde un equipo local o se accede a ella dentro de una base de datos.
- Promuevael modelo: el modelo se almacena en el sistema de gestión modelo del Promote.
La herramienta score puede configurarse para los modelos a los que se accede mediante un flujo de trabajo estándar o para los modelos a los que se accede mediante la Suite in-dB.
La herramienta score requiere dos entradas:
- El objeto modelo producido en una herramienta predictiva basada en R.
- Secuencia de datos que contiene los campos de predictores seleccionados en la configuración del modelo. Esto puede ser una secuencia de datos Alteryx estándar o una secuencia de metadatos XDF.
Conecte estas entradas a la entrada de la herramienta de puntuación para comenzar la configuración.
Modelos soportados
La herramienta score puede utilizar una secuencia de datos desde un modelo predictivo, incluso si se estimó mediante una función RevoScaleR. La herramienta score sólo puede utilizar una secuencia de metadatos XDF si la entrada de la herramienta de modelado fuera de un Herramienta Datos de salida XDF o Herramienta Datos de entrada XDF y el modelo se estimó utilizando una función RevoScaleR.
Los modelos estimados por Oracle R Enterprise utilizando una herramienta predictiva en dB conectada a una fuente de datos Oracle no se pueden utilizar para marcar un flujo de datos estándar de Alteryx, aunque los modelos estimados con una secuencia de datos estándar de Alteryx pueden utilizarse para anotar fuentes de datos Oracle.
- El nuevo nombre de campo (destino continuo) o prefijo (destino categórico): el nombre o el prefijo de campo debe comenzar con una letra y puede contener letras, números y el período de caracteres especiales (".") y subrayado ("_"). R distingue entre mayúsculas y minúsculas.
- El campo de destino tiene un valor sobremuestreado: estos campos se utilizan para ajustar las probabilidades ajustadas para que coincidan con los porcentajes de muestra verdaderos. Seleccione para proporcionar:
- El valor del campo de destino que se sobremuestreó: el nombre del campo sobremuestreado.
- Porcentaje del valor sobremuestreado en los datos originales antes de sobremuestrear: el porcentaje de valores que se repitieron durante la sobremuestreo.
- Opciones de regresión lineal no regularizada:
- El campo de destino ha sido natural log transformado: Seleccione esta opción para aplicar una transformación que se ajuste a los valores a la escala original y utilice un estimador de frotis para contabilizar el sesgo de transformación subsiguiente.
- Incluir un intervalo de confianza de predicción: Seleccione para especificar el valor utilizado para calcular los intervalos de confianza.
- Opciones específicas de entrada XDF:
- Anexar puntuaciones al archivo XDF de entrada: Seleccione para anexar puntuaciones al archivo XDF de entrada en lugar de colocarlos en una secuencia de datos Alteryx.
- Número de registros que se deben marcar a la vez: Seleccione el número de registros de un grupo. Los datos de entrada se anotan en un grupo a la vez para evitar la limitación de procesamiento en memoria de R.
Los ajustes realizados a través de esta opción sólo son válidos si el destino es una variable categórica binaria.
Modelos mineral-creados
Si se utiliza un modelo creado por mineral, la tabla de estimación original debe existir en la base de datos para calcular los intervalos de confianza.
La herramienta score soporta Oracle, Microsoft SQL Server 2016 y Teradata en el procesamiento de bases de datos. Consulta Introducción a En base de datos. para obtener más información sobre las herramientas y el soporte en base de datos.
Para acceder a la versión in-dB de la herramienta Score:
- Coloque una herramienta in-dB en el lienzo. La herramienta puntuación cambia automáticamente a la versión in-dB.
- Haga clic con el botón derecho en la herramienta puntuación, elija la versión de la herramienta y seleccione la versión in-dB.
Consulta Analítica Predictiva para obtener más información sobre el soporte predictivo en base de datos.
La herramienta score requiere dos entradas:
- El objeto modelo producido en una herramienta predictiva basada en R.
- Secuencia de datos que contiene los campos de predictores seleccionados en la configuración del modelo. Esto puede ser una secuencia de datos Alteryx estándar o una secuencia de metadatos XDF.
Conecte estas entradas a la entrada de la herramienta de puntuación para comenzar la configuración.
Modelos soportados
La herramienta score puede utilizar una secuencia de datos desde un modelo predictivo, incluso si se estimó mediante una función RevoScaleR. La herramienta score sólo puede utilizar una secuencia de metadatos XDF si la entrada de la herramienta de modelado fuera de un Herramienta Datos de salida XDF o Herramienta Datos de entrada XDF y el modelo se estimó utilizando una función RevoScaleR.
Los modelos estimados por el mineral que utilizan una herramienta predictiva in-dB conectada a una fuente de datos Oracle no se pueden utilizar para anotar un flujo de datos estándar de Alteryx, aunque los modelos estimados con una secuencia de datos estándar de Alteryx se pueden utilizar para anotar fuentes de datos de Oracle.
- Nombre de tablade salida: escriba el nombre de la tabla a la que se guardan los resultados en la base de datos.
- El nuevo nombre de campo (destino continuo) o prefijo (destino categórico): el nombre o el prefijo de campo debe comenzar con una letra y puede contener letras, números y el período de caracteres especiales (".") y subrayado ("_").
- El campo de destino tiene un valor sobremuestreado: estos campos se utilizan para ajustar las probabilidades ajustadas para que coincidan con los porcentajes de muestra verdaderos. Los ajustes realizados a través de esta opción sólo son válidos si el destino es una variable categórica binaria. Seleccione para proporcionar:
- El valor del campo de destino que se sobremuestreó: el nombre del campo sobremuestreado.
- Porcentaje del valor sobremuestreado en los datos originales antes de sobremuestrear: el porcentaje de valores que se repitieron durante la sobremuestreo.
- Opciones de regresión lineal solamente:
- El campo de destino ha sido natural log transformado: Seleccione esta opción para aplicar una transformación que se ajuste a los valores a la escala original y utilice un estimador de frotis para contabilizar el sesgo de transformación subsiguiente.
- Incluir un intervalo de confianza de predicción: Seleccione para especificar el valor utilizado para calcular los intervalos de confianza.
- Teradata configuración específica: Microsoft machine learning Server necesita información adicional sobre la configuración de la plataforma Teradata específica que se utilizará. Esta información es proporcionada típicamente por un administrador de Teradata local.
- Los paths del servidor Teradata a los ejecutables binarios de R
- La ubicación de escritura de archivos temporales que utiliza Microsoft machine learning Server.
No se permiten otros caracteres especiales, y R distingue entre mayúsculas y minúsculas.
Modelos mineral-creados
Si se utiliza un modelo creado por mineral, la tabla de estimación original debe existir en la base de datos para calcular los intervalos de confianza.
- Fuentedel modelo: seleccione la fuente del objeto Model que se pasa a la entrada (M) de la herramienta score. Esto puede ser cualquiera:
- En la base de datos, identificada por el valor en el campo "nombre" de la secuencia de datos.
- Contenido en el campo "objeto" de la secuencia de datos.
La salida incluye las secuencias de datos originales con los valores predichos del modelo. En el caso de un modelo que utiliza un objetivo categórico, se proporciona una probabilidad prevista para cada nivel de la variable de destino en un nombre de campo compuesto por el prefijo proporcionado por el usuario y el sufijo del campo que corresponde al nivel posible de la variable de destino .
Promover es una plataforma para implementar, administrar y escalar modelos predictivos. Alteryx puede conectarse a la plataforma promocional para acceder a los modelos almacenados y puntuarlos en su contra.
Establecer un Alteryx promover la conexión.
Conexión de Alteryx Promote: una lista desplegable que se utiliza para seleccionar de las conexiones Promote guardadas.
Agregar conexión: una opción para agregar a la lista de conexiones Promote disponibles. El administrador de conexiones Promote opera independientemente de los flujos de trabajo.
- Haz clic en Agregar conexión.
- En la ventana Agregar Conexión, introduce una URL de Alteryx Promote, una dirección URL que apunte a la ubicación en la que se almacena el modelo.
- Haz clic en Siguiente.
- En la ventana Credenciales Alteryx Promote, escribe tu Nombre de usuario y Clave de API.
- Haz clic en Conectar.
- Si tienes éxito, en la ventana Conexión establecida, selecciona Finalizar. La nueva conexión está seleccionada y visible en la lista desplegable.
- Selecciona una conexión disponible.
- Haz clic en Quitar conexión.
- En la ventana Confirmación, comprueba que la dirección URL y el Nombre de usuario están asociados a la conexión que deseas quitar.
- Haz clic en Aceptar. La conexión ya no está disponible en la lista desplegable.
Acceso a Promote
Si no estás seguro sobre si tienes acceso a la función Promote o necesitas ayuda para encontrar tus credenciales necesarias, comunícate con tu administrador local o con tu representante de soporte técnico.
Se genera una lista de los modelos a los que tiene acceso. Desplácese por la lista o utilice la función de búsqueda para encontrar el modelo que desea anotar y seleccione la ruta del modelo.
Una vez que se selecciona una ruta de modelo, se rellena la información relativa al modelo.
- Nombre: el nombre del modelo.
- Propietario: el propietario del modelo.
- Estado: el estado actual del modelo, que refleja su accesibilidad.
- En línea: el modelo está actualizado y listo para procesar los datos.
- Building: el modelo se está actualizando y no puede procesar datos.
- Prueba de unidad fallida: modelo de construcción terminada, pero los componentes no se han construido correctamente. El modelo no puede procesar datos.
- Error: el modelo no pudo generarse correctamente y no puede procesar datos.
- Offline: el modelo no se ha construido y no puede procesar datos.
- Última actualización: la marca de hora del último modelo de compilación.
Compruebe que el modelo está disponible para el procesamiento de datos y seleccione hecho.
El Resumen de configuración proporciona un resumen de las credenciales utilizadas y del modelo de resumen del modelo seleccionado.