多次元スケーリングツール

多次元スケーリング(略してMDS)は、分散に基づいて単変量データを分離する方法です。 概念的には、MDS はデータに記述された項目間の相違または距離を取得し、項目間のマップを生成します。 このマップのディメンション数は、アナリストが生成する前に提供されることがよくあります。 通常、最も高い分散寸法は、データに記述されている最大距離に対応します。 マップソリューションは単変量データに依存しているため、マップディメンションの回転と方向は重要ではありません。 MDSは、主成分分析と同様のディメンション分析を使用します。 詳細については、https://en.wikipedia.org/wiki/Multidimensional_scaling を参照してください。

このツールでは、従来の mds とアイソメデータシートの2種類の mds が実装されています。 クラシックMDSは、シンプルで高速なアプローチです。 クラシックMDSは、アイテム間の距離とマップ上のアイテム間のデカルト距離との誤差を減らしてマップを生成することによって機能します。 アイソメトリックMDSはやや複雑です。 クラシックMDSの結果のマップを取得してから、アイテムペア間のマップ距離が元のデータと同じ最大値から最小値の順になるように調整すると、それがアイソメトリックMDSです。 このアイソメトリックMDSは、正確な距離単位が、アイテムペアが最も離れているかまたは最も近いアイテムのランクより重要でない場合に便利です。

クラシックなMDSの使用例は、米国のマップを作成する米国の都市間の直線距離です。 等尺性 MDS の使用例としては、特定の単位座標よりも距離の順位が重要である食料品の間にどのように類似または異なる栄養価に基づいて多次元食品チャートを生成することになります。 これらの方法は、異なるアイテム間の類似性を判断するために顧客が使用する知覚的次元の数および性質を得るためにマーケティングリサーチの文脈でしばしば使用されます。

ギャラリーツール

このツールは、Alteryx デザイナーまたは R ツールと共に自動的にはインストールされません。 このツールを使用するには、Alteryx Analytics Galleryからダウンロードしてください。

入力を接続する

次の2つの方法のいずれかで構成されたデータストリーム。

  1. 項目ペア名とその相違を表す各エントリを含む3列のストリーム。
  2. 各列がアイテムを表し、各行がアイテムを表し、各交差が相違値を表すMxM行列。 詳細については、https://en.wikipedia.org/wiki/Distance_matrix を参照してください。

ツールを設定する

モデルを構成するには、[モデルオプション] タブを使用します。

  1. 入力タイプの選択:相違情報の入力に対して、3列のペアアプローチまたは距離行列アプローチを使用するかどうかを選択します。 どちらの場合も、すべてのペアの距離を定義する必要があります。それ以外の場合はエラーがスローされます。
  2. 出力する寸法の数:データおよびプロット出力に含まれるマップとデータの次元数を選択します。 分散のレベルを考慮するには、レポートの固有値プロットを使用して最適な次元数を選択する必要があります。
  3. 多次元スケーリング方法を選択:従来の mds アルゴリズムまたは等角投影法を使用して選択します。

[印刷オプション] タブを使用して、出力プロットのコントロールを設定します。

  1. 反転する寸法のコンマ区切りリスト:このリスト内の任意の数値は、項目座標が-1 で乗算された寸法になります。 MDS アルゴリズムは、任意に寸法極性を選択し、ユーザ入力によって助けられる場合があります。 たとえば、都市間の距離に基づいて米国のマップを作成する場合、その方向は既知のものとは逆になる可能性があります。
  2. 固有値の小節プロット:このチェックマークは、固有値と説明をレポート出力に含めるかどうかを決定します。 これは、データのマップに保持する次元の数を選択するのに役立ちます。 主に、棒グラフは、追加の次元がノイズまたは擬似データのみをマップに組み込む点を知るのに役立ちます。
  3. アイテム名をグラフ内の数値に置き換えますか?:マップには、別の名前を識別するためのアイテムが多すぎる可能性があります。 このチェックマークは、すべての項目名を番号 id に変換するかどうかを決定します (すなわち、' ジャック '、' ジル '、' バナナ '... など, 対 x1, x2, x3,... x987、x988 など)。

グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。

  • [印刷サイズ]: グラフのサイズに対してインチまたはセンチメートルを選択します。
  • グラフ解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

  • 基本フォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。

出力を見る

各出力アンカーに閲覧ツールを接続して、結果を表示します。

  • Dアンカー: [Data] には、各項目と各次元の座標値のエントリが含まれています。
  • Pアンカー: [プロット] は、ツールの設定で宣言されたグラフィック設定とレポートの出力が含まれています: (オプション) テーブルとグラフ固有の値が何であるかの説明と各次元の分散を描いた。各次元ペアのプロット ({1, 2}; {1, 3};{1, 4};{2, 3};{2, 4};{3, 4}) 各項目が名前または (オプションで) 数値識別子で表されます。