多維尺度MDS案例
多維尺度MDS
多維尺度(multidimensional scaling, MDS),是一種將研究對象之間距離或者不相似度的直觀展示,較為典型的研究對象是地理位置,當(dāng)然也可以是觀點、顏色等任意各類實體或抽象概念,比如茶的口味不相似情況。多維尺度的目的是將距離進行可視化展示。
多維尺度MDS通常分為兩類,分別是度量MDS(metric multidimensional scaling, mMDS)和非度量MDS(nonmetric multidimensional scaling, nMDS)。二者的使用上,通常情況下,如果研究對象之間的距離代表其真實距離,那么使用度量MDS較為適合,而且此類距離通??蛇x擇使用歐式距離進行計算,如果研究對象之間的距離代表次序(即相對距離非真實距離,比如成績排名),那么使用非度量MDS較為適合。
多維尺度MDS案例
1 背景
當(dāng)前有中國有8大核心城市的距離數(shù)據(jù),希望使用多維尺度法直觀展示該8大城市的距離情況,數(shù)據(jù)如下圖所示:
圖中右下角數(shù)據(jù)為1,其代表自己,以及數(shù)據(jù)呈現(xiàn)出完全對稱關(guān)系。上述數(shù)據(jù)中數(shù)字代表實際距離,因而應(yīng)該使用‘度量MDS法’,并且數(shù)據(jù)格式為n*n格式。可選擇‘計算歐氏距離’。
2 理論
多維尺度MDS涉及2種類型,分別是度量MDS和非度量MDS,以及SPSSAU支持兩種數(shù)據(jù)格式。具體如下事例說明:
如果研究的是‘飲料口味相似度’,類似下圖這樣的n*n結(jié)構(gòu)數(shù)據(jù),數(shù)字代表的距離只是一種‘次序’非實際距離(比如coffee和milk之間的數(shù)字為6代表距離較遠,但beer和wine之間的數(shù)字為1代表距離非常近),此類數(shù)據(jù)一般使用‘非度量MDS’法,數(shù)據(jù)格式為n*n結(jié)構(gòu)數(shù)據(jù);
除此之外,還有一種數(shù)據(jù)為‘原始數(shù)據(jù)’格式,比如研究中國31省市在8個維度的消費情況,以便可視化呈現(xiàn)各省市居民的相似情況,如下圖所示:
上圖展示中國31省市在8個維度上的消費數(shù)據(jù),數(shù)字代表實際消費情況,因此此類數(shù)據(jù)應(yīng)該使用‘度量MDS’,而且選中‘計算歐氏距離’,而且上述圖中數(shù)據(jù)格式為‘原始數(shù)據(jù)’格式,其并非n*n格式數(shù)據(jù)。
3 操作
本例子操作如下:
由于數(shù)字為實際距離值,因而使用‘度量MDS’法,并且選中‘計算歐式距離’,以及當(dāng)前數(shù)據(jù)格式為n*n格式。
4 SPSSAU輸出結(jié)果
SPSSAU共輸出2個表格和1個圖。分別如下說明:
5文字分析
上表格展示MDS模型的基本設(shè)置,本次案例使用度量MDS法進行研究,輸入數(shù)據(jù)為n*n格式,并且要求先計算歐式距離后再進入模型分析。
? 上表格MDS距離模型的具體坐標(biāo)數(shù)據(jù),下圖為MDS距離模型,圖示可以看見北京和天津的距離非常近,而且上海和杭州的距離很近。但鄭州離其余七個城市均有很遠的距離,這與事實情況完全吻合。足以證明MDS模型可以很好的可視化展示距離數(shù)據(jù)。
6 剖析
涉及以下幾個關(guān)鍵點,分別如下:
關(guān)于SPSSAU中‘計算歐式距離’參數(shù)?
如果是度量MDS數(shù)據(jù),可選中‘計算歐式距離’,即讓系統(tǒng)先計算出各研究對象之間的歐式距離后然后進入模型進行分析,當(dāng)然這由研究者自身決定,通常需要選中計算。
如果提供的是‘原始數(shù)據(jù)格式’(非n*n格式時),此時系統(tǒng)自動會計算出各研究對象之間的歐式距離,然后構(gòu)建出數(shù)據(jù)后進行MDS距離模型計算,此時不論是否選中‘歐式距離’,系統(tǒng)會會先進行研究對象歐式距離計算后再進入MDS模型。