Outil Mise à l’échelle multidimensionnelle

La mise à l’échelle multidimensionnelle (désignée par l’abréviation « MDS ») est une méthode de séparation des données univariées en fonction de la variance. Du point de vue conceptuel, l’outil MDS prend les dissimilarités, ou les distances, entre les éléments décrits dans les données et génère une carte entre ces éléments. Le nombre de dimensions dans cette carte est souvent fourni avant la génération de la carte par l’analyste. La dimension de variance la plus élevée correspond généralement à la distance la plus longue décrite dans les données. Dans la mesure où la solution de cartographie repose sur des données univariées, la rotation et l’orientation des dimensions des cartes ne sont pas significatives. L’outil MDS applique une analyse dimensionnelle similaire aux Composants principaux. Pour plus d'informations , voir https://en.wikipedia.org/wiki/Multidimensional_scaling.

Deux types de MDS sont mis en œuvre dans cet outil: le MDS classique et le MDS isométrique. La MDS classique est l’approche simple et rapide. La MDS classique génère une carte en réduisant l’erreur entre les distances données entre les éléments et la distance cartésienne entre les éléments sur la carte. La MDS isométrique est un peu plus complexe. Si la carte résultant de la MDS classique est prise, puis ajustée de sorte que les distances sur la carte entre des paires d’éléments apparaissent dans le même ordre décroissant que les données d’origine, on parle alors de MDS isométrique. Cette MDS isométrique est alors utile lorsque les unités de distance exactes sont moins importantes que le rang des paires d’éléments qui sont les plus éloignées ou les plus proches les unes des autres.

Par exemple, la MDS classique calcule la distance en ligne droite entre les villes des États-Unis pour générer une carte des États-Unis. La MDS isométrique consisterait à produire un diagramme des aliments multidimensionnel en fonction des similarités ou des différences en termes de valeur nutritionnelle qui existent entre les aliments, le classement des distances étant plus important qu’une coordonnée unitaire spécifique. Ces méthodes sont souvent employées dans le cadre de la recherche marketing pour obtenir le nombre et la nature des dimensions perceptuelles que les clients mettent en œuvre pour déterminer la similarité entre différents éléments.

Outil Gallery

Cet outil n'est pas installé automatiquement avec Alteryx Designer ou les outils R. Pour utiliser cet outil, téléchargez-le à partir de la Gallery Alteryx Analytics.

Connecter une entrée

Un flux de données configuré dans l'une des deux manières suivantes:

Flux comprenant 3 colonnes, chaque entrée représentant les noms de paires d’éléments et leur dissimilarité.
Matrice MxM dont chaque colonne représente un élément, chaque ligne représente un élément et chaque intersection représente la valeur de dissimilarité. Pour plus d'informations , voir https://en.wikipedia.org/wiki/Distance_matrix.

Configurer l’outil

Utilisez l' onglet Options du modèle pour configurer votre modèle.

Choisissez le type d'entrée: indiquez s'il faut utiliser l'approche par paires à 3 colonnes ou la matrice de distance pour l'entrée des informations de dissimilitude. Dans l’un ou l’autre cas, vous devez définir toutes les distances entre les paires, sinon l’application renverra une erreur.
Nombre de dimensions à la sortie: sélectionnez le nombre de dimensions que la carte et les données contiendront dans les données et les sorties de traçage. Il convient de prendre en considération le niveau de variance à l’aide du tracé de valeurs propres dans le rapport pour choisir le nombre de dimensions le plus approprié.
Choisissez la méthode de mise à l'échelle multidimensionnelle: Choisissez entre l'utilisation des algorithmes MDS classiques ou isométriques.

Utilisez l' onglet options de traçage pour définir des contrôles pour le tracé de sortie.

Liste séparée par des virgules de dimensions à retourner: tous les numéros de cette liste seront les dimensions dont les coordonnées d'élément sont multipliées par-1. Les algorithmes MDS sélectionnent la polarité des dimensions de manière arbitraire et, parfois, peuvent s’appuyer sur les valeurs saisies par l’utilisateur. Par exemple, lors de la création d’une carte des États-Unis sur la base des distances entre les villes, la direction peut être inversée par rapport à ce qu’on sait.
Tracé de barre des valeurs propres: cette coche détermine si les valeurs propres et l'explication sont incluses dans la sortie du rapport. Cela permet de choisir le nombre de dimensions à conserver dans la carte des données. Le diagramme à barres aide essentiellement à savoir à quel point des dimensions supplémentaires intègrent uniquement du bruit ou de fausses données dans la carte.
Remplacer les noms d'éléments par des nombres dans le graphique pour la visibilité?: la carte peut contenir trop d'éléments pour identifier un nom d'un autre. Cette coche décide de convertir ou non tous les noms d'éléments en numéros d'identification (par exemple, 'Jack', 'Jill', 'Banana'... etc, contre x1, x2, x3,... x987, x988, etc.).

Utilisez l' onglet options graphiques pour définir les commandes de la sortie graphique.

Tailledu tracé: sélectionnez pouces ou centimètres pour la taille du graphique.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 ppp) ; 2x (192 PPP) ; ou 3x (288 PPP). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.
Taille de police de base (points): sélectionnez la taille de la police dans le graphique.

Afficher la sortie

Connectez un outil Explorateur à chaque ancrage de sortie pour afficher les résultats.

D ancre: [Data] contient des entrées pour chaque élément et la valeur de coordonnées de chaque dimension.
P ancre: [Plot] contient des sorties de rapport avec des paramètres graphiques comme déclaré dans la configuration de l'outil: (facultatif) tableau et graphique représentant la variance de chaque dimension avec explication de ce que les valeurs Eigen sont; Parcelles de chaque paire de dimensions (i.e. {1,2}; { 1, 3}; {1, 4}; {2,3}; {2, 4}; {3,4}) avec chaque élément représenté par nom ou (facultativement) un identificateur numérique.