最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

「SPSSAU|數(shù)據(jù)分析」:聚類案例分析

2022-06-01 16:29 作者:SPSSAU官方賬號  | 我要投稿

案例說明

1.案例背景

研究調(diào)查10名運(yùn)動員的3項(xiàng)測試數(shù)據(jù),其中三項(xiàng)分別是:肩寬/髖寬×100、胸厚/胸圍×100、腿長/身長×100。其中編號為4、6、8、9的4名運(yùn)動員分別是蛙、自由、仰、蝶泳四種姿勢的佼佼者。預(yù)計(jì)姿勢按姿勢分為蝶泳、仰泳、蛙泳、自由泳4類(為簡化問題僅以10名運(yùn)動員的3項(xiàng)測試數(shù)據(jù)為例)。

2.分析目的

本案例對游泳運(yùn)動員調(diào)查的數(shù)據(jù)進(jìn)行聚類,以便分項(xiàng),預(yù)計(jì)姿勢按姿勢分為蝶泳、仰泳、蛙泳、自由泳4類。 [案例來源于:SPSS統(tǒng)計(jì)分析(第5版)盧紋岱,朱紅兵主編,案例有一些變動 具體請看分析。]

數(shù)據(jù)處理

1.數(shù)據(jù)檢查

在數(shù)據(jù)分析之前,首先需要進(jìn)行數(shù)據(jù)查看,包括數(shù)據(jù)中是否有異常值,無效樣本等。如果有異常值則需要進(jìn)行處理,然后再進(jìn)行分析。另外如果數(shù)據(jù)中有無效樣本也需要進(jìn)行處理后再進(jìn)行分析。無效樣本會干擾分析研究,扭曲數(shù)據(jù)結(jié)論等,因而在分析前先對無效樣本進(jìn)行標(biāo)識顯示尤其必要。異常值的鑒別與處理一般分為三個部分,其中分別是判斷標(biāo)準(zhǔn),鑒別方法以及異常值的處理,以下從這三個方面進(jìn)行說明。

異常值的判斷標(biāo)準(zhǔn)如下:

檢驗(yàn)數(shù)據(jù)是否有異常值的方法:

異常值處理方法:

此案例對于異常值參照的標(biāo)準(zhǔn)為大于±3個標(biāo)準(zhǔn)差

使用箱線圖進(jìn)行查看發(fā)現(xiàn)沒有異常值。

除了對異常值的處理,還需要對于無效樣本進(jìn)行檢查:如果數(shù)據(jù)來源為問卷,則很可能出現(xiàn)無效樣本,因?yàn)樘顚憜柧淼臉颖臼欠裾鎸?shí)填寫無從判定;如果數(shù)據(jù)庫下載或者使用二手?jǐn)?shù)據(jù)等,也可能出現(xiàn)大量缺失數(shù)據(jù)等無效樣本。以下從無效樣本場景、SPSSAU設(shè)置標(biāo)準(zhǔn)、處理三方面進(jìn)行說明。

  • 常見場景

  • 設(shè)置標(biāo)準(zhǔn)

  • 無效樣本的處理

設(shè)置好無效樣本后,默認(rèn)會新生成一個標(biāo)題,用來標(biāo)識那些樣本是有效,那些是無效,在分析的時候直接進(jìn)行篩選下就好。

本次案例分析將以相同數(shù)字大于70%為標(biāo)準(zhǔn)進(jìn)行檢驗(yàn),結(jié)果顯示沒有無效樣本。

2.標(biāo)題處理

將變量肩寬/髖寬×100設(shè)為x1、變量胸厚/胸圍×100設(shè)為x2、變量腿長/身長×100設(shè)為x3。

操作

首先對初始計(jì)劃進(jìn)行分析得到模型如下:

從上表可以看出:最終聚類得到4類群體, 4類人群分布較為均勻,整體說明聚類效果較好。如果分析人員沒有預(yù)設(shè)聚類個數(shù)也可以利用該方法對數(shù)據(jù)類別進(jìn)行初步判斷,若該案例數(shù)據(jù)聚類個數(shù)為3,結(jié)果如下:

從結(jié)果來看,若分為三類,數(shù)據(jù)中第三個類別占比較多,不如分為4類的結(jié)果均勻,綜合結(jié)果對比聚類個數(shù)選擇4,但是就此案例說明,若研究者的預(yù)設(shè)聚類個數(shù)為3,也是可以接受的。

總結(jié)來講,不需要對模型進(jìn)行調(diào)整,重復(fù)進(jìn)行案例模型的構(gòu)建。

聚類分析往往是一個主觀判斷的過程,需要根據(jù)分析結(jié)果及個人專業(yè)知識判斷,聚為幾類更合適。這里結(jié)合SPSSAU輸出結(jié)果,提供幾個判斷聚類效果的方法:

接下來將對此一一說明。

結(jié)果輸出及分析

首先要查看數(shù)據(jù)分布是否均勻,一般來說,每個類別的樣本比例應(yīng)分布均勻,如果出現(xiàn)某一類占比過大或過小,可以考慮重新設(shè)置聚類類別個數(shù)。

1.聚類基本情況

使用聚類分析對樣本進(jìn)行分類,使用Kmeans聚類分析方法,從上表可以看出:最終聚類得到4類群體,此4類群體的占比分別是20.00%, 20.00%, 30.00%, 30.00%。整體來看, 4類人群分布較為均勻,整體說明聚類效果較好。

2.方差分析

聚類類別與聚類分析項(xiàng)進(jìn)行交叉分析,如果呈現(xiàn)出顯著性(p<0.05),意味著聚類得到的不同類別樣本,在相同指標(biāo)上有明顯的差異。這說明參與聚類分析的3個變量能夠很好的區(qū)分類別,類間差異足夠大,其中p值越小說明明類別之間的差異越大,表中顯示自變量x2的類別之間差異性最大。

對不同類別進(jìn)行均值比較除了可以查看方差分析還可以進(jìn)行查看聚類項(xiàng)重要性對比。

如果某個指標(biāo)重要性較低,考慮移出該指標(biāo)。從上述結(jié)果看,所有研究項(xiàng)均呈現(xiàn)出顯著性,說明不同類別之間的特征有明顯的區(qū)別,聚類的效果較好。

3.聚類效果的圖示化

可通過散點(diǎn)圖直觀展示聚類效果,使用任意兩個聚類指標(biāo)進(jìn)行散點(diǎn)圖繪制(可視化模塊里面的散點(diǎn)圖),并且在‘顏色區(qū)分(定類)[可選]框中放入‘聚類類別’項(xiàng),以查看不同類別時,兩兩指標(biāo)的散點(diǎn)效果。

從圖中可以發(fā)現(xiàn)各個類別之間有明顯的區(qū)別,聚類的效果較好。其中發(fā)現(xiàn)第一個類別x1、x3都比較大,建議研究時可以更加關(guān)注。

4.聚類類別實(shí)際意義

根據(jù)編號為4、6、8、9的4名運(yùn)動員分別是蛙、自由、仰、蝶泳四種姿勢的佼佼者。

可以將第一類命名為蛙泳,第二類命名為自由泳,第三類命名為仰泳,第四類命名為蝶泳。

研究者也可以觀察折線圖趨勢進(jìn)行命名。參考如下:

其它

1.聚類中心

整體說明聚類效果較好

上表為經(jīng)過迭代后類中心的變化,數(shù)據(jù)是經(jīng)過標(biāo)準(zhǔn)化后的,

至于數(shù)據(jù)是否需要標(biāo)準(zhǔn)化,聚類算法是根據(jù)距離進(jìn)行判斷類別,因此一般需要在聚類之前進(jìn)行標(biāo)準(zhǔn)化處理,SPSSAU默認(rèn)是選中進(jìn)行標(biāo)準(zhǔn)化處理。數(shù)據(jù)標(biāo)準(zhǔn)化之后,數(shù)據(jù)的相對大小意義還在(比如數(shù)字越大GDP越高),但是實(shí)際意義消失了。

2.SSE

對于聚類中心的SSE指標(biāo)說明如下:

在進(jìn)行Kmeans聚類分析時SPSSAU默認(rèn)輸出誤差平方和SSE值,該值可用于測量各點(diǎn)與中心點(diǎn)的距離情況,理論上是希望越小越好,而且如果同樣的數(shù)據(jù),聚類類別越多則SSE值會越?。ǖ垲愵悇e過多則不便于分析)。SSE指標(biāo)可用于輔助判斷聚類類別個數(shù),建議在不同聚類類別數(shù)量情況下記錄下SSE值,然后分析SSE值的減少幅度情況,如果發(fā)現(xiàn)比如從3個聚類到4個類別時SSE值減少幅度明顯很大,那么此時選擇4個聚類類別較好。比如該案例若聚類數(shù)為3,此時SSE值為7.451,但是當(dāng)聚類數(shù)為4時此時SSE值為2.844,發(fā)現(xiàn)SSE減少幅度較大。所以可以看出選擇4個聚類類別較好。

總結(jié)

對案例數(shù)據(jù)首先進(jìn)行數(shù)據(jù)的檢查,沒有發(fā)現(xiàn)缺失值與異常值,針對聚類的基本情況分析,發(fā)現(xiàn)數(shù)據(jù)可以進(jìn)行聚類,以及對聚類類別的選擇,最后對于輸出的結(jié)果進(jìn)行分析,得到結(jié)論。如果有定類數(shù)據(jù),或使用分層聚類方法分析,分析思路也是如此。

「SPSSAU|數(shù)據(jù)分析」:聚類案例分析的評論 (共 條)

分享到微博請遵守國家法律
商南县| 申扎县| 杂多县| 白山市| 汶上县| 定襄县| 赤城县| 满洲里市| 崇明县| 英山县| 景德镇市| 杭锦旗| 沙河市| 黎城县| 鄯善县| 永昌县| 荔波县| 胶南市| 罗山县| 富裕县| 界首市| 阿克| 临湘市| 鹤壁市| 开鲁县| 哈尔滨市| 吉林市| 波密县| 唐河县| 保德县| 渭南市| 营口市| 江油市| 涡阳县| 普兰店市| 宜宾县| 娱乐| 灵山县| 台北市| 青冈县| 曲阳县|