Analítica predictiva
Designer incluye un conjunto de herramientas predictivas que utilizan R, una base de código abierto usada para el análisis predictivo y estadístico.
Las herramientas abarcan la exploración de datos, elementos especializados de preparación de datos para analítica predictiva, modelado predictivo, herramientas para comparar y evaluar la eficacia de diferentes modelos, herramientas para agrupar registros y campos de manera sistemática, y herramientas para ayudar a implementar soluciones de analítica predictiva.
Las herramientas predictivas utilizan el lenguaje de programación R. Dirígete a Opciones > Descargar herramientas predictivas e inicia sesión en el portal de Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R .
Soporte en base de datos
Hay seis herramientas predictivas compatibles en base de datos.
Cuando se coloca una herramienta predictiva con soporte en base de datos en el lienzo con otra herramienta de la categoría En base de datos, la herramienta predictiva cambia automáticamente a la versión En-BD. Para cambiar la versión de la herramienta, haz clic con el botón derecho del mouse en la herramienta, selecciona Elegir la versión de la herramienta y escoge una. Consulta Información general sobre En base de datos para obtener más información sobre la compatibilidad y las herramientas en la base de datos.
Microsoft SQL Server 2016 | Oracle | Teradata | |
---|---|---|---|
Sí | |||
Sí | |||
Sí | |||
Sí | Sí | Sí | |
Sí | Sí | Sí | |
Sí | Sí | Sí |
Herramientas de analítica predictiva
Esta categoría de herramientas contiene herramientas para comprender mejor los datos que se utilizarán en un proyecto de analítica predictiva y herramientas para realizar tareas especializadas de muestreo de datos para analítica predictiva. Las herramientas para comprender mejor los datos que se utilizan en un proyecto de analítica predictiva incluyen tanto herramientas de visualización como herramientas que proporcionan tablas de estadísticas descriptivas.
Las herramientas que ayudan a un usuario a comprender mejor los datos que debe analizar mediante métodos visuales son las siguientes:
Las herramientas que proporcionan estadísticas de resumen útiles para ayudar al usuario a comprender mejor los datos que se analizan son las siguientes:
Esta categoría incluye herramientas de modelado predictivo general para modelos de clasificación (campo objetivo categórico) y de regresión (campo objetivo numérico), además de herramientas de comparación de modelos y de evaluación de hipótesis relevantes para el modelado predictivo. El conjunto de herramientas para el modelado predictivo general se puede desglosar aún más en modelos estadísticos tradicionales y métodos de aprendizaje estadístico más modernos. Una única herramienta Puntuación proporciona un mecanismo para obtener predicciones de modelos de ambos tipos de herramientas de modelado predictivo general.
Una distinción importante entre los modelos estadísticos tradicionales y los métodos de aprendizaje estadístico más modernos es el nivel de intervención directa del usuario en el proceso del modelado. Los modelos estadísticos tradicionales requieren un nivel mucho mayor de intervención y experiencia del usuario para desarrollar un modelo con un nivel adecuado de eficacia predictiva. En concreto, el usuario debe seleccionar previamente los campos predictores importantes y es probable que deba aplicar las transformaciones adecuadas a los campos numéricos para capturar efectos no lineales entre el campo objetivo y los predictores continuos. La selección de los predictores importantes (ignorando posibles problemas debido a relaciones no lineales) puede facilitarse mediante el uso de la regresión escalonada para los modelos tradicionales. En cambio, los métodos modernos de aprendizaje estadístico utilizan algoritmos que abordan internamente tanto la selección de predictores como las posibles relaciones no lineales entre el objetivo y los predictores numéricos.
Los modelos estáticos tradicionales se diferencian entre sí según la naturaleza del campo objetivo que desea predecir. Todos se basan en la estimación de modelos lineales (generalizados). Aunque todos los algoritmos de aprendizaje estadístico tienen la misma propiedad de manejar internamente la selección de predictores y los efectos no lineales, sí se diferencian en sus enfoques. Como resultado, ningún método por sí solo es mejor que los demás en el conjunto de problemas a los que un usuario puede enfrentarse.
Herramientas para modelos estadísticos tradicionales
Herramientas para el método moderno de aprendizaje estadístico
Herramientas para la comparación de modelos predictivos y la evaluación de hipótesis
Herramienta para predecir valores para todas las herramientas de modelado predictivo general
Herramienta para crear visualizaciones interactivas de redes y estadísticas de resumen clave
Herramientas para generar modelos de supervivencia y estimar el riesgo relativo y el tiempo de supervivencia medio restringido
Las herramientas de pruebas AB ayudan al usuario a llevar a cabo experimentos de pruebas AB (también conocidas como prueba y aprendizaje), como examinar el efecto de una nueva campaña de comunicaciones de marketing en las ventas o el impacto de cambiar los niveles de personal de una tienda. Las herramientas pueden ayudar a determinar las áreas de mercado para una prueba (generalmente para una que implique publicidad en los medios de comunicación de masas, donde todos los residentes en esa área pueden estar potencialmente expuestos a la publicidad) haciendo coincidir una o más unidades de control con cada unidad de tratamiento, crear medidas de temporalidad y tendencia en las que a menudo se basa la coincidencia de los controles con los tratamientos, y realizar el análisis real de los resultados experimentales. Las herramientas asociadas a esta subcategoría son las siguientes:
Esta categoría contiene una serie de herramientas de previsión y trazado de series temporales univariantes y regulares (en términos de intervalos de tiempo de los datos, como mensualmente). Entre ellas, se encuentran las herramientas para crear modelos de previsión ARIMA y de suavizado exponencial extendido que se pueden utilizar para crear elementos, como un modelo de previsión de ventas semanales. Ambos métodos desarrollan previsiones basadas en elementos sistemáticos relacionados con el tiempo en los valores de la variable objetivo. Específicamente, recopilan elementos de tendencia (movimientos al alza o a la baja a largo plazo y bastante constantes en la variable objetivo) y estacionalidad (patrones cíclicos que se repiten con el tiempo).
Para dar un ejemplo concreto de estos elementos, un modelo de series temporales de ventas de tablets probablemente revelaría una tendencia positiva en las ventas junto con un marcado patrón estacional de mayores ventas cerca de Navidad y antes del comienzo del año escolar. Si no hay tendencia ni estacionalidad en la variable objetivo, es probable que los valores de previsión de la variable objetivo disminuyan en una línea recta según del valor medio ponderado del objetivo para los valores más recientes del objetivo. Es probable que esto sea un resultado insatisfactorio para un usuario, pero indica que no existe una estructura real en los datos con respecto a los elementos relacionados con el tiempo (tendencia y estacionalidad). En estos casos, los métodos de modelado predictivo más generales pueden ser más útiles en la elaboración de previsiones que las herramientas de series temporales.
Además de las herramientas para crear previsiones, existen herramientas para ayudar al usuario a comparar la eficacia relativa de distintos modelos de previsión de series temporales. El conjunto completo de herramientas de series temporales incluye las siguientes:
Esta categoría contiene herramientas para agrupar registros o campos en una cantidad menor de grupos. Las aplicaciones comunes para agrupar registros son la creación de segmentos de clientes basados en patrones de compra o la creación de un conjunto de grupos de tiendas. El objetivo final de la agrupación en estas dos áreas es crear una cantidad menor de grupos que permita la personalización de programas y actividades de una manera que sea factible desde una perspectiva empresarial.
Por ejemplo, un minorista que tenga 500 puntos de venta en su red probablemente consideraría abrumador desarrollar un programa de comercialización y fijación de precios específico para cada uno de estos. Sin embargo, si los puntos de venta se agrupan en conjuntos más pequeños de tiendas (por ejemplo, 10) según la similitud de los puntos de venta con respecto a sus patrones de venta, crear 10 programas diferentes de comercialización y fijación de precios es algo que el minorista puede implementar con éxito. Del mismo modo, muchas organizaciones tienen tablas de bases de datos que desean analizar que son muy amplias, con muchos de los campos altamente correlacionados entre sí. En estos casos, trabajar con una gran cantidad de medidas altamente correlacionadas complica mucho los análisis realizados con estos datos. En consecuencia, puede tener sentido reducir el conjunto original de campos a un conjunto más pequeño de campos compuestos que se ajusten con mayor facilidad para su análisis. En ambos casos, es necesario reducir la dimensionalidad de los datos para convertirlos en datos realizables.
El método más utilizado para agrupar registros es el análisis de clústeres. En realidad, existen muchos tipos diferentes de análisis de clústeres, pero, sin duda, los métodos de agrupación en clústeres más utilizados en aplicaciones empresariales se basan en algoritmos de centroides K. Alteryx proporciona herramientas para ayudar a determinar la cantidad apropiada de clústeres (grupos) que se deben formar, crear el conjunto final de clústeres y agregar el clúster al que pertenece un registro en particular (independientemente de si el registro se utilizó para determinar el conjunto de clústeres) a los datos. Una herramienta relacionada (Buscar los vecinos más cercanos) permite al usuario formar grupos ad hoc de un tamaño determinado en torno a uno o más registros específicos. Por ejemplo, las herramientas le proporcionan al usuario la capacidad de encontrar los cinco clientes más parecidos al cliente “X” según el comportamiento de compra anterior. El método disponible para agrupar campos es el de componentes principales.
Las herramientas de análisis de canasta de mercado ayudan a determinar qué elementos van juntos en los datos de los puntos de venta o la combinación de problemas que suelen ocurrir conjuntamente en los sistemas de informes de defectos y órdenes de trabajo. Las herramientas de la categoría determinan el conjunto de “reglas” en los datos (por ejemplo, “es más probable que el defecto del producto A esté presente cuando también se observan defectos de los productos B y C”) y proporcionan herramientas de filtrado para ayudar a reducir la lista de posibles reglas basadas en un conjunto de criterios que están asociados a las reglas que tienen más probabilidades de hacerlas prácticamente más importantes.
Las herramientas de esta categoría incluyen las siguientes:
Esta categoría incluye herramientas que pueden ayudar a determinar el mejor curso de acción o resultado para una situación particular o un conjunto de situaciones. Puede ayudar a aumentar la salida de los modelos predictivos prescribiendo una acción óptima.