Ejemplo de cada herramienta
La herramienta Puntuación tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
La herramienta Puntuación crea una estimación de una variable objetivo mediante la aplicación de un modelo R a un conjunto de variables predictoras suministradas. Si la variable objetivo es categórica, proporciona probabilidades de que un registro (basado en la variable predictora) pertenezca a cada categoría. Si la variable objetivo es continua, estima el valor de la variable objetivo. Aunque se puede utilizar para evaluar el rendimiento de un modelo, no lo hace por sí sola.
Esta herramienta utiliza la herramienta R. Dirígete a Opciones > Descargar herramientas predictivas e inicia sesión en el portal de Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.
La herramienta Puntuación puede evaluar modelos desde varias ubicaciones:
Modelo local: el modelo se introduce en el flujo de trabajo desde una máquina local o se accede a él desde una base de datos.
Modelo de Promote: el modelo se almacena en el sistema de gestión del modelo de Promote.
La herramienta Puntuación se puede configurar para los modelos a los que se accede mediante un flujo de trabajo estándar o para los modelos a los que se accede mediante el conjunto en la base de datos (En-BD).
La herramienta Puntuación requiere dos entradas:
El objeto de modelo producido con una herramienta predictiva basada en R.
Un flujo de datos que contiene los campos predictores seleccionados en la configuración del modelo. Esto puede ser un flujo de datos Alteryx estándar o un flujo de metadatos XDF.
Conecta estas entradas a la entrada de la herramienta Puntuación para comenzar la configuración.
La herramienta Puntuación puede utilizar un flujo de datos de un modelo predictivo, incluso si se estimó utilizando una función RevoScaleR. La herramienta Puntuación solo puede usar un flujo de metadatos XDF si la entrada de la herramienta de modelado es de una herramienta de salida XDF o de entrada XDF, y el modelo se calculó mediante una función de RevoScaleR.
Los modelos estimados por Oracle R Enterprise utilizando una herramienta predictiva En-BD conectada a una fuente de datos Oracle no se pueden usar para puntuar un flujo de datos estándar de Alteryx, aunque los modelos estimados con un flujo de datos estándar de Alteryx se pueden usar para puntuar fuentes de datos Oracle.
Los ajustes realizados a través de esta opción solo son válidos si el objetivo es una variable categórica binaria.
El nombre de campo nuevo (objetivo continuo) o prefijo (objetivo categórico): el nombre del campo o prefijo debe comenzar con una letra y puede contener letras, números y los caracteres especiales punto (".") y guión bajo ("_"). R distingue entre mayúsculas y minúsculas.
El campo objetivo tiene un valor sobremuestreado: estos campos se utilizan para configurar las probabilidades ajustadas para que coincidan con los porcentajes de muestra verdaderos. Selecciona para proporcionar:
El valor del campo objetivo que se sobremuestreó: el nombre del campo de sobremuestreo.
El porcentaje del valor sobremuestreado en los datos originales antes del sobremuestreado: el porcentaje de valores que se repitieron durante el sobremuestreo.
Opciones solamente para regresiones lineales no regularizadas:
Modelos creados por ORE
Si utilizas un modelo creado por ORE, la tabla de estimación original debe existir en la base de datos para estimar los intervalos de confianza.
El campo objetivo se ha transformado mediante un logaritmo natural: selecciona esta opción para aplicar una transformación que ajuste los valores nuevamente a la escala original y para utilizar un estimador de difuminado para tener en cuenta el sesgo de transformación posterior.
Incluir un intervalo de confianza de predicción: selecciona para especificar el valor utilizado para calcular los intervalos de confianza.
Opciones específicas de las entradas XDF:
Anexar puntuaciones al archivo XDF de entrada: selecciona para anexar puntuaciones al archivo XDF de entrada en lugar de colocarlas en un flujo de datos Alteryx.
La cantidad de registros que se debe puntuar por vez: selecciona el número de registros en un grupo. Los datos de entrada se califican un grupo a la vez para evitar la limitación de procesamiento en memoria de R.
La herramienta Score admite el procesamiento en bases de datos de Oracle, Microsoft SQL Server 2016 y Teradata. Visita Información general sobre el procesamiento en base de datos para obtener más información sobre la compatibilidad y las herramientas de la categoría En base de datos.
Para acceder a la versión en base de datos (En-BD) de la herramienta Puntuación:
Coloca una herramienta de la categoría En-BD (En base de datos) en el lienzo. La herramienta Puntuación cambia automáticamente a la versión En-BD.
Haz clic con el botón derecho en la herramienta Puntuación, selecciona Elegir la versión de la herramienta y selecciona la versión En-BD.
Visita Analítica predictiva para obtener más información sobre la compatibilidad con la analítica predictiva en base de datos.
La herramienta Puntuación requiere dos entradas:
El objeto de modelo producido con una herramienta predictiva basada en R.
Un flujo de datos que contiene los campos predictores seleccionados en la configuración del modelo. Esto puede ser un flujo de datos Alteryx estándar o un flujo de metadatos XDF.
Conecta estas entradas a la entrada de la herramienta Puntuación para comenzar la configuración.
Modelos compatibles
La herramienta Puntuación puede utilizar un flujo de datos de un modelo predictivo, incluso si se estimó utilizando una función RevoScaleR. La herramienta Puntuación solo puede usar un flujo de metadatos XDF si la entrada de la herramienta de modelado es de una herramienta de salida XDF o de entrada XDF, y el modelo se calculó mediante una función de RevoScaleR.
Los modelos estimados por ORE utilizando una herramienta predictiva En-BD conectada a una fuente de datos Oracle no se pueden usar para puntuar un flujo de datos estándar de Alteryx, aunque los modelos estimados con un flujo de datos estándar de Alteryx se pueden usar para puntuar fuentes de datos Oracle.
No se permite el uso de otros caracteres especiales. Además, R distingue entre mayúsculas y minúsculas.
Nombre de la tabla de salida: escribe el nombre de la tabla en la que se guardan los resultados en la base de datos.
El nombre de campo nuevo (objetivo continuo) o prefijo (objetivo categórico): el nombre del campo o prefijo debe comenzar con una letra y puede contener letras, números y los caracteres especiales punto (".") y guión bajo ("_").
El campo objetivo tiene un valor sobremuestreado: estos campos se utilizan para configurar las probabilidades ajustadas para que coincidan con los porcentajes de muestra verdaderos. Los ajustes realizados a través de esta opción solo son válidos si el objetivo es una variable categórica binaria. Selecciona para proporcionar:
El valor del campo objetivo que se sobremuestreó: el nombre del campo de sobremuestreo.
El porcentaje del valor sobremuestreado en los datos originales antes del sobremuestreo: el porcentaje de valores que se repitieron durante el sobremuestreo.
Opciones solo para regresión lineal:
Modelos creados por ORE
Si utilizas un modelo creado por ORE, la tabla de estimación original debe existir en la base de datos para estimar los intervalos de confianza.
El campo objetivo se ha transformado mediante un logaritmo natural: selecciona esta opción para aplicar una transformación que ajuste los valores nuevamente a la escala original y para utilizar un estimador de difuminado para tener en cuenta el sesgo de transformación posterior.
Incluir un intervalo de confianza de predicción: selecciona para especificar el valor utilizado para calcular los intervalos de confianza.
Configuración específica de Teradata: Microsoft Machine Learning Server necesita información de configuración adicional sobre la plataforma específica de Teradata que se va a utilizar. Esta información suele ser proporcionada por un administrador local de Teradata.
Las rutas del servidor Teradata a los ejecutables binarios de R.
La ubicación temporal de escritura de archivos que utiliza Microsoft Machine Learning Server.
Origen del modelo: selecciona la fuente del objeto modelo que se pasa a la entrada (M) de la herramienta Puntuación. Esto puede:
En la base de datos, estar identificado por el valor en el campo "Nombre" del flujo de datos.
Estar contenido en el campo "Objeto" del flujo de datos.
La salida incluye el flujo de datos original con los valores previstos del modelo. En el caso de un modelo que utiliza un objetivo categórico, se proporciona una probabilidad prevista para cada nivel de la variable objetivo en un nombre de campo compuesto por el prefijo proporcionado por el usuario y el sufijo del campo que corresponde al nivel posible de la variable objetivo.
Promote es una plataforma para implementar, administrar y escalar modelos predictivos. Alteryx puede conectarse a la plataforma Promote para acceder a los modelos almacenados y puntuarlos.
Establecer una conexión de Alteryx Promote.
Conexión de Alteryx Promote: una lista desplegable que se utiliza para seleccionar de las conexiones Promote guardadas.
Agregar conexión: una opción para agregar a la lista de conexiones Promote disponibles. El administrador de conexiones Promote opera independientemente de los flujos de trabajo.
Haz clic en Agregar conexión.
En la ventana Agregar Conexión, introduce una URL de Alteryx Promote, una dirección URL que apunte a la ubicación en la que se almacena el modelo.
Selecciona Siguiente.
En la ventana Credenciales de Alteryx Promote, escribe tu Nombre de usuario y Clave de API.
Selecciona Conectar.
Si tienes éxito, en la ventana Conexión establecida, selecciona Finalizar. La nueva conexión está seleccionada y visible en la lista desplegable.
Selecciona una conexión disponible.
Haz clic en Quitar conexión.
En la ventana Confirmación, comprueba que la dirección URL y el Nombre de usuario están asociados a la conexión que deseas quitar.
Selecciona OK. La conexión ya no está disponible en la lista desplegable.
Si no estás seguro sobre si tienes acceso a la función Promote o si necesitas ayuda para encontrar tus credenciales necesarias, comunícate con tu administrador local o con tu representante de soporte técnico.
Se genera una lista de los modelos a los que tienes acceso. Desplázate por la lista o usa la función de búsqueda para encontrar el modelo que deseas puntuar y selecciona la ruta del modelo.
Una vez que seleccionas una ruta del modelo, se rellena la información relativa al modelo.
Nombre: el nombre del modelo.
Propietario: el propietario del modelo.
Estado: el estado actual del modelo, reflejando su accesibilidad.
En línea: el modelo está actualizado y listo para procesar datos.
Generando: el modelo se está actualizando actualmente y no puede procesar datos.
Falló la prueba de la unidad: el modelo se terminó de generar, pero los componentes no se generaron correctamente. El modelo no puede procesar datos.
Falló: el modelo falló al compilar correctamente y no puede procesar datos.
Fuera de línea: el modelo no se ha generado y no puede procesar datos.
Última actualización: la marca de tiempo de la última generación del modelo.
Verifica que el modelo esté disponible para el procesamiento de datos y selecciona Listo.
El Resumen de la configuración proporciona un resumen de las credenciales utilizadas y el Resumen del modelo del modelo seleccionado.