相關(guān)分析全流程總結(jié),原來是這樣的!
大家好!這里是SPSSAU~
為了幫大家快速度過新手期, 我們整理了一份常見分析方法的流程總結(jié)。
其中包括每種分析方法的分析流程,以及每個(gè)環(huán)節(jié)中可能出現(xiàn)的問題及應(yīng)對(duì)方法。不會(huì)分析的同學(xué)可以按照?qǐng)D中的流程一步步操作,就能得到準(zhǔn)確可靠的結(jié)果。

本文將介紹的是相關(guān)分析的分析流程,即SPSSAU通用方法中的“相關(guān)”。

為了便于理解,我們先簡(jiǎn)單介紹下相關(guān)分析,然后按照分析流程順序,對(duì)每一步可能會(huì)涉及的問題進(jìn)行簡(jiǎn)要說明。
?
相關(guān)分析
使用相關(guān)分析,通常是研究?jī)蓚€(gè)變量的相關(guān)性情況。比如學(xué)習(xí)成績(jī)和聽課質(zhì)量的關(guān)系;員工敬業(yè)度與薪資的關(guān)系等等。
?
1.數(shù)據(jù)類型
?
相關(guān)分析的適用范圍很廣,理論上講,凡是考察兩個(gè)變量相關(guān)性,都可以叫做相關(guān)分析。
?
但依據(jù)習(xí)慣,我們通常說的相關(guān)分析,多指的是兩個(gè)定量數(shù)據(jù)之間的簡(jiǎn)單相關(guān)分析,這就要求兩個(gè)變量都是定量數(shù)據(jù),即選項(xiàng)數(shù)字大小要可比較,且有實(shí)際意義。

如果兩個(gè)數(shù)據(jù)均為定類數(shù)據(jù),則不可以直接用相關(guān)分析,而應(yīng)該使用卡方分析測(cè)量相關(guān)性(準(zhǔn)確說應(yīng)該是差異分析)。
?
如果一個(gè)是定類數(shù)據(jù),一個(gè)是定量數(shù)據(jù),則應(yīng)該使用方差分析。
?
這種誤用常見于分析背景信息題與核心研究題項(xiàng)的相關(guān)情況。

2.正態(tài)性
?
相關(guān)分析要求數(shù)據(jù)服從正態(tài)分布,因此分析前需要檢驗(yàn)數(shù)據(jù)的正態(tài)性。
正態(tài)性有多種檢驗(yàn)方法,常見方法如:正態(tài)圖、正態(tài)性檢驗(yàn)、P-P圖/Q-Q圖等。
正態(tài)性的判斷標(biāo)準(zhǔn)可以查看SPSSAU教程:


由于相關(guān)分析對(duì)正態(tài)性要求比較寬松,即使違反計(jì)算結(jié)果也比較穩(wěn)健,只要數(shù)據(jù)基本滿足正態(tài)即可。如果數(shù)據(jù)完全不正態(tài),則可以用Spearman相關(guān)系數(shù)。
?
3.查看線性趨勢(shì)
?
當(dāng)兩個(gè)定量數(shù)據(jù)在散點(diǎn)圖上的散點(diǎn)呈現(xiàn)直線趨勢(shì)時(shí),就可以認(rèn)為兩者存在直線相關(guān)趨勢(shì),這也是相關(guān)分析的一個(gè)基本前提。
?


例如上圖,當(dāng)X增大時(shí),可以比較明顯地看出Y會(huì)隨著增大,說明X和Y之間有著正向相關(guān)關(guān)系。如果是負(fù)相關(guān),散點(diǎn)圖會(huì)呈現(xiàn)隨著一個(gè)變量值的增加,另一個(gè)變量值降低的趨勢(shì)。
?
非線性關(guān)系
如果數(shù)據(jù)呈現(xiàn)非線性的趨勢(shì),可以選擇對(duì)變量進(jìn)行數(shù)據(jù)轉(zhuǎn)換(如對(duì)數(shù)轉(zhuǎn)換),或是使用Spearman相關(guān)系數(shù)進(jìn)行分析。
?
4.檢驗(yàn)異常值
相關(guān)分析對(duì)極端值較為敏感,異常值會(huì)影響分析結(jié)果。需要在分析前查看是否存在異常值,保證結(jié)果的可靠性,此步可以和上一步一起通過散點(diǎn)圖查看。
?
存在異常值
如果存在極端值,需要在分析前進(jìn)行剔除。使用方法:SPSSAU數(shù)據(jù)處理->異常值。

這是上一步中得到的散點(diǎn)圖,有一個(gè)明顯的離群值,研究者需要根據(jù)情況選擇保留或刪除。建議按照SPSSAU異常值幫助手冊(cè)的說明,對(duì)異常值進(jìn)行處理。
?
5.相關(guān)系數(shù)類型
?
當(dāng)完成以上步驟且滿足相關(guān)分析的分析條件后,即可進(jìn)行相關(guān)分析。點(diǎn)擊‘通用方法’-‘相關(guān)’。

這時(shí)又出現(xiàn)一個(gè)問題。SPSSAU提供了三種相關(guān)系數(shù),分別是Pearson、Spearman,Kendall相關(guān)系數(shù),該選哪一種呢?

多數(shù)情況下,SPSSAU建議使用pearson相關(guān)系數(shù)。如果數(shù)據(jù)不滿足正態(tài)性或不滿足線性關(guān)系,可以考慮使用Spearman相關(guān)系數(shù)。
?
Kendall相關(guān)系數(shù)用于判斷兩個(gè)變量的等級(jí)相關(guān)性,是否具有一致性,比如評(píng)委打分,數(shù)據(jù)排名等。關(guān)于三種相關(guān)系數(shù)的比較具體可以查看相關(guān)分析幫助手冊(cè)。
?
6.SPSSAU操作
?
終于到了分析這一步了。相對(duì)于其他分析軟件,SPSSAU的操作相對(duì)簡(jiǎn)單,將變量從左側(cè)拖拽到分析項(xiàng)處,點(diǎn)擊‘開始相關(guān)分析’即可。

分析項(xiàng)X可選
需要特別強(qiáng)調(diào)的一點(diǎn)是,相關(guān)分析通常不會(huì)特別區(qū)分哪個(gè)變量是X,哪個(gè)變量是Y。因此分析時(shí),常常是直接把分析項(xiàng)都放入“分析項(xiàng)Y(定量)”里即可。

?
如果有明確的X、Y可以分開放置,兩種放置方法只在表格的展示格式上有區(qū)別,結(jié)果是一樣的。
?
指標(biāo)解讀

分析步驟可參考SPSSAU輸出結(jié)果中的“分析建議”及“智能分析”。


需要注意的是相關(guān)系數(shù)代表變量之間的相關(guān)程度,相關(guān)系數(shù)越大,說明相關(guān)程度越緊密。
?
P值用于判斷相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,P<0.05即說明變量間有相關(guān)關(guān)系,P值并不代表相關(guān)關(guān)系的強(qiáng)弱。
?
平均成績(jī)、能力評(píng)分兩個(gè)分析項(xiàng)交叉處的數(shù)字代表相關(guān)系數(shù),而星號(hào)代表P值。一個(gè)星號(hào)代表P<0.05,兩個(gè)星號(hào)代表P<0.01。如果沒有星號(hào),則說明P值>0.05。
?
7.后續(xù)分析
?
相關(guān)分析的結(jié)果并不能代替回歸分析,而相關(guān)分析通常是作為回歸分析的基礎(chǔ),保證在有相關(guān)性的前提下,才可能有回歸影響關(guān)系。
?
因此后續(xù)可以通過回歸分析,進(jìn)一步得到影響關(guān)系和具體的函數(shù)表達(dá)式。

?
總結(jié)
?
以上就是相關(guān)分析的分析流程梳理。理論上都應(yīng)該按照上述步驟進(jìn)行分析,但在實(shí)際過程中,即使忽略其中的步驟,也能得到穩(wěn)定的結(jié)果。
?
因此即使不按照步驟分析,也沒有問題,而對(duì)于沒有分析經(jīng)驗(yàn)的研究者,SPSSAU建議按提供的步驟進(jìn)行分析,才是最保險(xiǎn)的做法。學(xué)不會(huì)的挫敗感。