Ferramenta de escala multidimensional

Escala multidimensional (abreviado MDS) é um método de separação de dados univariada com base na variância. Conceitualmente, o MDS leva as dissemelhanças ou distâncias entre os itens descritos nos dados e gera um mapa entre os itens. O número de dimensões neste mapa são frequentemente fornecidos antes da geração pelo analista. Normalmente, a maior dimensão de variância corresponde às distâncias maiores descritas nos dados. A solução MAP depende de dados univariada, portanto, a rotação e orientação das dimensões do mapa não é significativa. A MDS utiliza análises dimensionais semelhantes aos componentes principais. Para obter mais informações , consulte https://en.wikipedia.org/wiki/Multidimensional_scaling.

Dois tipos de MDS são implementados nesta ferramenta: MDS clássico e MDS isométrico. A MDS clássica é a abordagem simples e rápida. A MDS clássica funciona gerando um mapa reduzindo o erro entre as distâncias entre os itens e a distância cartesiana entre os itens no mapa. Os MDS isométricos são um pouco mais complexos. Se o mapa resultante da MDS clássica é tomado e, em seguida, ajustado de modo que as distâncias de mapa entre pares de item estão na mesma ordem maior para menor que os dados originais, que é o MDS isométrico. Este MDS isométrico é então útil quando as unidades de distância exata são menos importantes do que a classificação de que os pares de item são mais distantes ou mais próximos juntos.

Um exemplo de uso da MDS clássica seria a distância de linha reta entre as cidades em todo o e.u.a. para produzir um mapa dos EUA. Um exemplo de uso do MDS isométrico seria produzir um gráfico de alimentos multidimensional com base em como semelhante ou diferente o valor nutricional é entre os alimentos, onde um ranking das distâncias é mais importante do que uma coordenada unidade específica. Estes métodos são usados frequentemente em um contexto da pesquisa do mercado para obter o número e a natureza das dimensões perceptivas usadas por clientes para julg a similaridade entre artigos diferentes.

Ferramenta Gallery

Esta ferramenta não é instalada automaticamente com o Alteryx designer ou as ferramentas R. Para usar esta ferramenta, baixe-a da Alteryx Analytics Gallery.

Conecte uma entrada

Um fluxo de dados configurado em uma das seguintes maneiras 2:

  1. Um fluxo de coluna 3 com cada entrada representando nomes de par de itens e sua dessemelhança.
  2. Uma matriz MXM com cada coluna que representa um item, cada linha que representa um item e cada interseção que representa o valor de dissemelhança. Para obter mais informações , consulte https://en.wikipedia.org/wiki/Distance_matrix.

Configure a ferramenta

Use a guia opções de modelo para configurar seu modelo.

  1. Escolha tipo de entrada: selecione se deseja usar a abordagem de três colunas ou a abordagem de matriz de distância para entrada de informações de dissemelhança. Você deve definir todas as distâncias de par em ambos os casos; caso contrário, um erro é Descartado.
  2. Número de dimensões para saída: Selecione o número de dimensões que o mapa e os dados conterá nas saídas de dados e plotagem. A consideração do nível de variação deve ser feita usando a parcela autovalor no relatório para escolher o melhor número de dimensões.
  3. Escolha o método de dimensionamento multidimensional: escolha entre usar os algoritmos MDS clássicos ou isométricos.

Use a guia opções de plotagem para definir controles para a plotagem de saída.

  1. Lista separada por vírgulas de dimensões para Flip: qualquer número nesta lista será as dimensões que têm suas coordenadas de item multiplicadas por-1. Os algoritmos MDS escolhem a polaridade da dimensão arbitrariamente, e às vezes podem ser ajudadas pela entrada do usuário. Por exemplo, na criação de um mapa dos EUA com base em distâncias entre as cidades, a direção pode ser revertida do que é conhecido como o caso.
  2. Parcela da barra de autovalores: esta marca de verificação decide se a autovalores e a explicação estão incluídas na saída do relatório. Isto é para ajudar a escolher o número de dimensões para manter no mapa dos dados. Principalmente, o enredo da barra ajuda a saber em que ponto as dimensões adicionais incorporar apenas ruído ou dados falsos no mapa.
  3. Substituir nomes de itens por números no gráfico para visibilidade?: o mapa pode conter muitos itens para identificar um nome de outro. Esta marca de verificação decide se deve ou não converter todos os nomes de itens em IDs de números (ou seja, ' Jack ', ' Jill ', ' banana '... etc, x X1, X2, X3,... x987, x988, etc.).

Use a guia opções de gráficos para definir os controles da saída gráfica.

  • Tamanhodo lote: selecione polegadas ou centímetros para o tamanho do gráfico.
  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi); 2x (192 dpi); ou 3x (288 dpi). A resolução mais baixa cria um arquivo menor e é melhor para visualização em um monitor. Maior resolução cria um arquivo maior com melhor qualidade de impressão.

  • Tamanho da fonte base (pontos): selecione o tamanho da fonte no gráfico.

Visualizar a saída

Conecte uma ferramenta Navegar a cada âncora de saída para exibir os resultados.

  • D âncora: [data] contém entradas para cada item e o valor de coordenada de cada dimensão.
  • P âncora: [Plot] contém saídas de relatório com configurações gráficas conforme declarado na configuração da ferramenta: (opcional) tabela e gráfico representando a variância de cada dimensão com explicação de quais valores Eigen são; Parcelas de cada par de dimensões (i.e. {1,2}; { 1, 3}; {1, 4}; {2, 3}; {2, 4}; {3, 4}) com cada item representado por Name ou (opcionalmente) um identificador numérico.