Herramienta de escalado multidimensional
El escalamiento multidimensional (MDS abreviados) es un método para separar los datos univariados basados en la varianza. Conceptualmente, MDS toma las disimilitudes, o distancias, entre los elementos descritos en los datos y genera un mapa entre los elementos. El número de dimensiones de este mapa se proporciona a menudo antes de la generación por el analista. Normalmente, la dimensión de varianza más alta corresponde a las distancias más grandes que se describen en los datos. La solución MAP se basa en datos univariantes, por lo que la rotación y la orientación de las cotas de mapa no son significativas. MDS utiliza el análisis dimensional similar a los componentes principales. Para obtener más información , consulte https://en.wikipedia.org/wiki/Multidimensional_scaling.
En esta herramienta se implementan dos tipos de MDS: los MDS clásicos y los MDS isométricos. El MDS clásico es el acercamiento simple y rápido. El MDS clásico trabaja generando un mapa reduciendo el error entre las distancias dadas entre los artículos y la distancia cartesiano entre los artículos en el mapa. Los MDS isométricos son un poco más complejos. Si se toma el mapa resultante de los MDS clásicos y, a continuación, se ajusta de manera que las distancias de los mapas entre pares de elementos se encuentren en el mismo orden de mayor a menor que los datos originales, es el caso de los MDS isométricos. Este MDS isométrico es entonces útil cuando las unidades de distancia exactas son menos importantes que el rango de los pares de elementos que están más alejados o más cercanos juntos.
Un uso del ejemplo de MDS clásicos sería la distancia straight-line entre las ciudades a través de los e.e.u.u. para producir un mapa de los e.e.u.u. Un ejemplo de uso de los MDS isométricos sería la producción de una tabla de alimentos multidimensional basado en la forma similar o diferente del valor nutricional es entre los alimentos, donde un ranking de las distancias es más importante que una unidad específica de coordenada. Estos métodos se utilizan a menudo en un contexto de investigación de marketing para obtener el número y la naturaleza de las dimensiones perceptivas utilizadas por los clientes para juzgar la similitud entre los diferentes elementos.
Herramienta Galería
Esta herramienta no se instala automáticamente con Alteryx Designer o las herramientas R. Para utilizar esta herramienta, descárgala de Alteryx Analytics Gallery.
Conectar una entrada
Una secuencia de datos configurada en cualquiera de las dos formas siguientes:
- Una secuencia de 3 columnas con cada entrada que representa los nombres de los pares de elementos y su desemejanza.
- Matriz MXM con cada columna que representa un elemento, cada fila que representa un elemento y cada intersección que representa el valor de la dissemejanza. Para obtener más información , consulte https://en.wikipedia.org/wiki/Distance_matrix.
Configurar la herramienta
Utilice la ficha Opciones de modelo para configurar el modelo.
- Elija el tipo de entrada: Seleccione si desea utilizar el enfoque de Pairwise de 3 columnas o la matriz de distancia para la entrada de información sobre la disimilitud. Debe definir todas las distancias de los pares en ambos casos; de lo contrario se produce un error.
- Número de cotas a salida: Seleccione el número de cotas que contendrán el mapa y los datos en las salidas Data y Plot. La consideración del nivel de la variación debe ser hecha usando el diagrama del valor propio en el informe para elegir el mejor número de dimensiones.
- Elija el método de escalamiento multidimensional: Elija entre utilizar los algoritmos de MDS clásicos o de MDS isométricos.
Utilice la ficha Opciones de trazado para definir los controles de la trama de salida.
- Lista separada por comas de cotas a voltear: cualquier número en esta lista será las cotas que tienen sus coordenadas de elemento multiplicadas por-1. Los algoritmos MDS eligen la polaridad de cota de forma arbitraria, y a veces pueden ser ayudadas por la entrada del usuario. Por ejemplo, en la creación de un mapa de los Estados Unidos basado en las distancias entre las ciudades, la dirección puede ser revertida de lo que se sabe que es el caso.
- Diagrama de valores propios: esta marca de verificación decide si los valores propios y la explicación están incluidos en el resultado del informe. Esto es para ayudar a elegir el número de dimensiones a mantener en el mapa de los datos. Principalmente, el diagrama de la barra ayuda a saber en qué punto las dimensiones adicionales incorporan solamente el ruido o los datos espurios en el mapa.
- Reemplazar nombres de elementos con números en gráfico para visibilidad?: el mapa puede contener demasiados elementos para identificar un nombre de otro. Esta marca de verificación decide si se convierten o no todos los nombres de elementos en IDS de número (es decir, ' Jack ', ' Jill ', ' banana '... etc, versus x1, x2, x3,... x987, x988, etc.).
Utilice la ficha opciones gráficas para definir los controles de la salida gráfica.
- Tamaño de la parcela: seleccione pulgadas o centímetros para el tamaño del gráfico.
-
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi). La resolución más baja crea un archivo más pequeño y es el mejor para la visión en un monitor. Una resolución más alta crea un archivo más grande con una mejor calidad de impresión.
- Tamaño de fuente base (puntos): seleccione el tamaño de la fuente en el gráfico.
Ver la salida
Conecta una herramienta Explorar con cada ancla de salida para ver los resultados.
- D ancla: [Data] contiene las entradas para cada elemento y el valor de coordenadas de cada dimensión.
- P ancla: [Plot] contiene las salidas de informe con la configuración gráfica tal como se declara en la configuración de la herramienta: (opcional) tabla y gráfico que representan la varianza de cada dimensión con la explicación de lo que son los valores de eigen; Parcelas de cada par de cotas (es decir, {1,2}; { 1, 3}; {1,4}; {2, 3}; {2,4}; {3,4}) con cada elemento representado por nombre o (opcionalmente) un identificador numérico.