Skip to main content

Modelado asistido

Utiliza la opción Asistido con el fin de obtener ayuda para crear modelos de aprendizaje automático. Te guía a través de un proceso paso a paso, que incluye seleccionar un método de aprendizaje automático y un objetivo, establecer tipos de datos, limpiar los valores ausentes, seleccionar características y seleccionar el mejor algoritmo. Si no sabes bien qué algoritmo es el mejor, el modelado asistido te permite comparar algoritmos en la tabla de clasificación. Después de eso, puedes agregar un pipeline al lienzo de Designer que contenga todas las herramientas de Aprendizaje automático que has usado para entrenar el modelo.

Importante

Para poder usar la herramienta Modelado asistido, antes debes utilizar la Input Data Tool Icon Herramienta Datos de entrada para ingresar tus datos en Designer y, luego, conectarla a la herramienta Modelado asistido. Después de Ejecutar el flujo de trabajo, puedes seleccionar Iniciar Modelado asistido en la ventana de configuración.

1. Seleccionar el objetivo y el método de aprendizaje automático

Selecciona un objetivo y deja que el modelado asistido elija el mejor método de aprendizaje automático para predecir el objetivo.

  1. En la sección Objetivos disponibles, se enumeran los nombres de las características del conjunto de datos. Selecciona la característica que quieres establecer como objetivo.

  2. El modelado asistido detecta automáticamente si el objetivo contiene datos categóricos o numéricos y selecciona el método de aprendizaje automático adecuado.

  3. Selecciona Siguiente para ir al Paso 2: Seleccionar nivel de automatización .

Importante

El modelado asistido se asegura de que hayas elegido el objetivo correcto antes de ir al siguiente paso. Después de eso, no puedes cambiar el objetivo sin reiniciar todo el proceso. Selecciona Siguiente si seleccionaste el objetivo correcto.

2. Seleccionar el nivel de automatización

Selecciona si prefieres que la herramienta compile el pipeline de aprendizaje automático por ti o que el modelado asistido te guíe por el proceso paso a paso.

  1. Selecciona la opción Paso a paso o Automático .

  2. Selecciona Siguiente .

Si eliges Paso a paso , el modelado asistido continua al paso 3: Establecer tipos de datos .

Si eliges Automático , el modelado asistido recorre automáticamente los pasos para crear el pipeline de aprendizaje automático: establece tipos de datos, limpia los valores ausentes, selecciona características y selecciona algoritmos. Cuando la herramienta finaliza ese proceso, puedes ver el resultado en la tabla de clasificación.

3. Configurar los tipos de datos

El modelado asistido establece el tipo de datos para cada característica. Muestra el tipo de datos recomendado en la columna Tipo de datos . La opción recomendada está etiquetada (por ejemplo, Numérico (recomendado) ).

  1. Selecciona una característica para ver información sobre ella en la sección Detalles de columna . Puedes ver Probabilidades de tipo de datos , que muestra cuán seguro esta el modelado asistido de que una característica es un tipo de datos determinado. También puedes ver una Vista previa, que contiene una muestra de los datos. Utiliza esta información para asegurar que los tipos de datos están configurados correctamente.

  2. Si una característica tiene el tipo de datos incorrecto, utiliza la lista desplegable de la columna Tipo de datos para seleccionar el tipo de datos correcto.

  3. Selecciona Siguiente para ir al Paso 4: Limpiar los valores ausentes .

Sugerencia

Si tienes alguna duda sobre el significado de un término, consulta la sección Glosario en el modelado asistid La sección contiene información útil sobre muchos de los términos comunes utilizados por científicos de datos.

4. Limpiar los valores ausentes

El modelado asistido limpia los valores ausentes en los datos. Para cada característica que contiene valores ausentes, muestra un método recomendado para limpiarlos en la columna Método. La opción recomendada está etiquetada (por ejemplo, Reemplazar por la mediana (recomendado) ).

  1. Selecciona una característica para ver información sobre ella en la sección Detalles de la columna . Puedes ver el Método de limpieza , que explica cómo el modelado asistido elige el método para limpiar los datos ausentes También puedes ver una Vista previa, que contiene una muestra de los datos. Usa esta información para asegurarte de que estás usando el método correcto para controlar los valores ausentes.

  2. Si quieres utilizar un método de limpieza diferente, utiliza la lista desplegable de la columna Método para seleccionar el método de limpieza correcto.

  3. Selecciona Siguiente para ir al Paso 5: Seleccionar características .

5. Seleccionar características

El modelado asistido selecciona qué características dan como resultado el mejor modelo. Para cada característica, evalúa si es un buen predictor en la columna Información de le característica.

  1. Selecciona una característica para ver información sobre ella en la sección Detalles de la columna . Puedes ver Detalles del predictor, que proporciona dos medidas del rendimiento de la característica: Gini y GKT. El modelado asistido utiliza ambas medidas para determinar si la característica se asocia demasiado o poco con el objetivo. También puedes ver una Vista previa, que contiene una muestra de los datos. Utiliza esta información para asegurar que las características son buenos predictores.

  2. Si no quieres utilizar una característica, desactive la casilla al lado del nombre de esa característica.

  3. Selecciona Siguiente para ir al Paso 6: Seleccionar algoritmos .

6. Seleccionar algoritmos

El modelado asistido proporciona una selección de algoritmos para elegir. Recomienda diferentes algoritmos dependiendo del tipo de problema que quieres resolver. En este paso, selecciona qué algoritmos quieres evaluar en la tabla de clasificación.

  1. La tarjeta de cada algoritmo muestra sus pros y contras, una descripción y algunos casos prácticos. Utiliza esta información para asegurar que quieres evaluar el algoritmo.

    1. Para variables categóricas, la herramienta tiene 4 algoritmos disponibles:

      1. Regresión logística

      2. Árbol de decisión

      3. Bosque aleatorio

      4. XGBOOST

    2. Para variables continuas (numéricas), la herramienta tiene tres algoritmos disponibles:

      1. Linear Regression

      2. Árbol de decisión

      3. Bosque aleatorio

  2. Para evaluar un algoritmo, active la casilla al lado del nombre. Si no quieres evaluar un algoritmo, desactive la casilla.

  3. Selecciona  Ejecutar los algoritmos seleccionados .

La tabla de clasificación

El modelado asistido genera la tabla de clasificación, que puedes usar para comparar el rendimiento de los algoritmos que has seleccionado.

La salida en la tabla de clasificación es diferente, dependiendo del tipo de problema que estés solucionando, pero aquí están los conceptos básicos para navegar por la interfaz de usuario:

  • Para ver información específica de un algoritmo, selecciona su tarjeta en la sección Tabla de clasificación.

  • Para ver información sobre el rendimiento de un algoritmo con respecto a los otros algoritmos, selecciona la pestaña Comparación.

  • Para ver información sobre el rendimiento individual de un algoritmo, selecciona la pestaña Descripción general.

  • Para ver qué características valoró más un algoritmo, selecciona la pestaña Interpretación.

  • Para repasar las decisiones que has tomado a lo largo del proceso de modelado asistido, selecciona la pestaña Configuración.

  • Para empezar de nuevo con el modelado asistido pero conservar la información en la tabla de clasificación, selecciona Crear modelo nuevo .

  • Para mostrar u ocultar la tabla de clasificación, selecciona Ocultar tabla de clasificación o Ver tabla de clasificación .

Una vez que hayas determinado qué algoritmos funcionan mejor, puedes seleccionar cuáles quieres agregar al lienzo de Designer como parte del pipeline de aprendizaje automático que entrena el modelo:

  1. Activa la casilla al lado del nombre del algoritmo que quieres agregar al lienzo. Veras un conteo de cuántos algoritmos has seleccionado.

  2. Selecciona Agregar modelos y continuar al flujo de trabajo .

Puedes exportar un informe con los resultados del modelo.

  1. Selecciona el menú de tres puntos.

  2. En el menú, selecciona Exportar informe HTML .

  3. Selecciona dónde quieres guardar el informe usando el Explorador de archivos.

Puedes exportar el código del pipeline de aprendizaje automático a Jupyter Notebook en una Python tool Python Tool.

  1. Selecciona el ícono de tres puntos.

  2. En el menú, selecciona Exportar modelo a Python .

  3. Al salir de la ventana de modelado asistido, aparece una herramienta Python en el flujo de trabajo. Contiene un Jupyter Notebook anotado con todo el código para el pipeline de aprendizaje automático.