「SPSSAU|數(shù)據(jù)分析」:相關(guān)分析步驟匯總

一、研究場(chǎng)景
相關(guān)分析用于研究定量數(shù)據(jù)之間的關(guān)系情況,包括是否有關(guān)系,以及關(guān)系緊密程度等。例如:研究員工薪資與員工工齡的關(guān)系;產(chǎn)品銷量與產(chǎn)品售后服務(wù)的關(guān)系等。
二、數(shù)據(jù)類型
相關(guān)分析的適用范圍很廣,理論上講,凡是考察兩個(gè)變量相關(guān)性,都可以叫作相關(guān)分析。相關(guān)分析研究是定量與定量的數(shù)據(jù),如果是定類和定量數(shù)據(jù)需要使用方差分析,定類和定類需要使用交叉(卡方)。

三、SPSSAU操作
1.上傳數(shù)據(jù)
登錄賬號(hào)后進(jìn)入SPSSAU頁面,點(diǎn)擊右上角“上傳數(shù)據(jù)”,將處理好的數(shù)據(jù)進(jìn)行“點(diǎn)擊上傳文件”上傳即可。

2.拖拽分析項(xiàng)
在“通用方法”模塊中選擇“相關(guān)”方法,將分析項(xiàng)定量變量放于分析框內(nèi),點(diǎn)擊“開始分析”即可。

PS: 分析項(xiàng)X可選
需要特別強(qiáng)調(diào)的一點(diǎn)是,相關(guān)分析通常不會(huì)特別區(qū)分哪個(gè)變量是X,哪個(gè)變量是Y。因此分析時(shí),常常是直接把分析項(xiàng)都放入“分析項(xiàng)Y(定量)”里即可。
3.參數(shù)選擇
SPSSAU在相關(guān)分析中提供


四、分析前檢驗(yàn)
1.正態(tài)性檢驗(yàn)
相關(guān)分析要求數(shù)據(jù)服從正態(tài)分布,因此分析前需要檢驗(yàn)數(shù)據(jù)的正態(tài)性。正態(tài)性有多種檢驗(yàn)方法,常見方法如:正態(tài)圖、正態(tài)性檢驗(yàn)、P-P圖/Q-Q圖等。
補(bǔ)充說明:相關(guān)分析對(duì)數(shù)據(jù)正態(tài)要求比較寬松,違反時(shí)系數(shù)計(jì)算結(jié)果也比較穩(wěn)健,只要數(shù)據(jù)基本滿足正態(tài)即可。如果數(shù)據(jù)完全不正態(tài),則可以用Spearman相關(guān)系數(shù)。
2.線性趨勢(shì)
當(dāng)兩個(gè)定量數(shù)據(jù)在散點(diǎn)圖上的散點(diǎn)呈現(xiàn)直線趨勢(shì)時(shí),就可以認(rèn)為兩者存在直線相關(guān)趨勢(shì),這也是相關(guān)分析的一個(gè)基本前提。
補(bǔ)充說明:可使用SPSSAU中可視化下的散點(diǎn)圖進(jìn)行分析與查看。


例如上圖,當(dāng)X增大時(shí),可以比較明顯地看出Y會(huì)隨著減小,說明X和Y之間有著負(fù)向相關(guān)關(guān)系。如果是正相關(guān),散點(diǎn)圖會(huì)呈現(xiàn)隨著一個(gè)變量值的增加,另一個(gè)變量值也增加的趨勢(shì)。
如果數(shù)據(jù)呈現(xiàn)非線性的趨勢(shì),可以選擇對(duì)變量進(jìn)行數(shù)據(jù)轉(zhuǎn)換(如對(duì)數(shù)轉(zhuǎn)換),或是使用Spearman相關(guān)系數(shù)進(jìn)行分析。
3.異常值
相關(guān)分析對(duì)極端值較為敏感,異常值會(huì)影響分析結(jié)果。需要在分析前查看是否存在異常值,保證結(jié)果的可靠性,此步可以和上一步一起通過散點(diǎn)圖查看。
如果存在異常值,可以使用SPSSAU數(shù)據(jù)處理里面的異常值進(jìn)行處理。

五、SPSSAU分析
背景:利用相關(guān)分析去研究公司滿意度和人際關(guān)系, 機(jī)會(huì)感知, 離職傾向, 工作條件共4項(xiàng)之間的相關(guān)關(guān)系,使用Pearson相關(guān)系數(shù)去表示相關(guān)關(guān)系的強(qiáng)弱情況。(PS:已滿足分析條件)
1.Pearson相關(guān)-標(biāo)準(zhǔn)格式

從上表可知,利用相關(guān)分析去研究公司滿意度和人際關(guān)系, 機(jī)會(huì)感知, 離職傾向, 工作條件共4項(xiàng)之間的相關(guān)關(guān)系,使用Pearson相關(guān)系數(shù)去表示相關(guān)關(guān)系的強(qiáng)弱情況。
其中上表展示了各個(gè)變量的均值標(biāo)準(zhǔn)差以及相關(guān)系數(shù)等,例如:公司滿意度的平均值為3.291,標(biāo)準(zhǔn)差為0.541,人際關(guān)系的平均值是3.748,標(biāo)準(zhǔn)差為0.616,機(jī)會(huì)感知的平均值3.322以及標(biāo)準(zhǔn)差為0.602,以此類推。
補(bǔ)充說明:對(duì)于相關(guān)分析,一般規(guī)范的表格格式是:p?值使用*號(hào)表示(標(biāo)識(shí)在相關(guān)系數(shù)的右上角),p?< 0.01使用2個(gè)*號(hào)表示;p?< 0.05使用1個(gè)*號(hào)表示。同時(shí)?SPSSAU也提供一個(gè)帶具體p?值的結(jié)果表格。
2.Pearson相關(guān)-詳細(xì)格式

具體來看,公司滿意度和人際關(guān)系之間的相關(guān)系數(shù)值為0.326,并且呈現(xiàn)出0.01水平的顯著性,因而說明公司滿意度和人際關(guān)系之間有著顯著的正相關(guān)關(guān)系。
公司滿意度和機(jī)會(huì)感知之間的相關(guān)系數(shù)值為-0.404,并且呈現(xiàn)出0.01水平的顯著性,因而說明公司滿意度和機(jī)會(huì)感知之間有著顯著的負(fù)相關(guān)關(guān)系。
公司滿意度和離職傾向之間的相關(guān)系數(shù)值為-0.642,并且呈現(xiàn)出0.01水平的顯著性,因而說明公司滿意度和離職傾向之間有著顯著的負(fù)相關(guān)關(guān)系。
公司滿意度和工作條件之間的相關(guān)系數(shù)值為0.268,并且呈現(xiàn)出0.01水平的顯著性,因而說明公司滿意度和工作條件之間有著顯著的正相關(guān)關(guān)系。
3.Pearson相關(guān)可視化圖

可直觀地看到分析項(xiàng)之間的相關(guān)系數(shù),例如:公司滿意度與人際關(guān)系的相關(guān)系數(shù)為0.33,公司滿意度與機(jī)會(huì)感知的相關(guān)系數(shù)為-0.40以此類推,另外SPSSAU還提供了不同取值范圍顏色深淺不同這一特征。
六、其它問題
1.針對(duì)問卷量表數(shù)據(jù),幾個(gè)題表示一個(gè)維度,如何處理?
比如有兩個(gè)題“我愿意向朋友推薦SPSSAU”,“我有需要會(huì)再來使用SPSSAU”,此兩個(gè)題是“忠誠度”的體現(xiàn)。但現(xiàn)在需要“忠誠度”這個(gè)整體,而不是具體兩個(gè)標(biāo)題,此時(shí)如何辦呢?

2.相關(guān)分析不正態(tài)時(shí)如何辦?
理論上講,如果數(shù)據(jù)正態(tài)分布時(shí),可使用Pearson相關(guān)系數(shù)進(jìn)行相關(guān)分析;如果數(shù)據(jù)不正態(tài)時(shí),則使用Spearman相關(guān)系數(shù)進(jìn)行相關(guān)分析。但理論上的正態(tài)分布基本沒有,只要數(shù)據(jù)非正態(tài)情況在可接受范圍內(nèi)則可繼續(xù)使用Pearson系數(shù);
而且一般情況下Pearson和Spearman系數(shù)的結(jié)論基本保持一致。所以絕大多數(shù)研究均是使用Pearson相關(guān)系數(shù),而較少使用Spearman相關(guān)系數(shù)。
七、總結(jié)
以上就是相關(guān)分析的分析流程梳理。理論上都應(yīng)該按照上述步驟進(jìn)行分析,但在實(shí)際過程中,即使忽略其中的步驟,也能得到穩(wěn)定的結(jié)果。
因此即使不按照步驟分析,也沒有問題,而對(duì)于沒有分析經(jīng)驗(yàn)的研究者,SPSSAU建議按提供的步驟進(jìn)行分析,才是最保險(xiǎn)的做法。