SPSS 單因素方差分析全流程總結(jié)
案例與數(shù)據(jù)
在實際生活中,消費(fèi)者與產(chǎn)品生產(chǎn)者、銷售者或服務(wù)提供者之間經(jīng)常發(fā)生糾紛。發(fā)生糾紛后,消費(fèi)者常常會向消費(fèi)者協(xié)會投訴。為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)以及航空公司三個行業(yè)抽取不同的企業(yè)作為樣本,然后統(tǒng)計最近一年消費(fèi)者對企業(yè)的投訴次數(shù)(假設(shè)企業(yè)之間的規(guī)模、服務(wù)對象等條件都是相同的),一般而言,受到的投訴次數(shù)越多,其服務(wù)的質(zhì)量越差。消費(fèi)者協(xié)會想知道這三個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異。部分?jǐn)?shù)據(jù)如下(數(shù)據(jù)虛構(gòu),無實際意義):
二、分析問題
其實在分析三個行業(yè)之間的服務(wù)質(zhì)量是否有差異,實際上也就是要判斷行業(yè)被投訴的次數(shù)是否有顯著性差異,差異性分析常見的方法包括方差分析,t檢驗,卡方檢驗,由于“行業(yè)”是定類數(shù)據(jù),“投訴次數(shù)”是定量數(shù)據(jù),卡方檢驗中的自變量和因變量均需要滿足定類變量,所以使用方差分析或者t檢驗,又因為定類數(shù)據(jù)的組別為三個分別為“零售業(yè)”、“旅游業(yè)”以及“航空公司”,一般兩個以上組別需要使用方差分析。所以本例子中使用方差分析進(jìn)行研究。方差分析包括單因素方差分析和多因素方差分析,因為自變量只有一個(“行業(yè)”),所以使用單因素方差分析進(jìn)行研究即可。
三、分析前準(zhǔn)備
首先對數(shù)據(jù)進(jìn)行簡單查看,比如是否含有異常值等,異常值的存在可能會影響分析結(jié)果,所以在分析前需要進(jìn)行處理,除此之外,進(jìn)行方差分析還需要滿足每個總體服從正態(tài)分布,各個總體的方差相同(滿足方差齊性),以及觀測值是獨(dú)立的(例子已滿足)。所以以下一一來檢驗。
1.異常值檢驗
檢查數(shù)據(jù)中的異常值,異常值顧名思義就是同一組別中與其他的值相比相差特別大(比如大于3倍標(biāo)準(zhǔn)差等),異常值的存在會使整體的均值和標(biāo)準(zhǔn)差不準(zhǔn)確,可能會導(dǎo)致最終的結(jié)果分析,尤其是小樣本研究中,例子中共有三組數(shù)據(jù),每組15個樣本,共有45個樣本,所以檢查異常值尤為重要。檢查異常值的方法有很多,包括利用描述分析進(jìn)行查看標(biāo)準(zhǔn)差在進(jìn)行判斷,散點(diǎn)圖以及箱線圖等,其中圖示化方法比較直觀,所以這里利用SPSSAU可視化的箱線圖進(jìn)行描述:
箱線圖結(jié)果:
從上圖結(jié)果可以看出,組別“零售業(yè)”以及“旅游業(yè)”均有一個異常值,“航空公司”數(shù)據(jù)未見異常。具體的異常值請見如下:
可以看出“零售業(yè)”中數(shù)據(jù)的異常值為99,“旅游業(yè)”中數(shù)據(jù)的異常值為68。接下來進(jìn)行篩選處理:
對異常值進(jìn)行處理后,分別檢驗數(shù)據(jù)是否滿足方差分析的前提條件,首先進(jìn)行正態(tài)性檢驗。
2.正態(tài)性檢驗
正態(tài)分布的檢驗方法有很多種,包括正態(tài)性檢驗以及圖示法p-p圖,q-q圖等,一般正態(tài)性檢驗最為嚴(yán)謹(jǐn)所以利用SPSSAU分組進(jìn)行正態(tài)性檢驗,結(jié)果如下:
因為是小樣本分析(樣本量小于50)所以查看S-W(Shapiro-Wilk)檢驗結(jié)果就可以,如果是大樣本數(shù)據(jù)則可以考慮K-S(Kolmogorov-Smimov)或者J-B(Jarque–Bera)檢驗。從結(jié)果中可以看出三組數(shù)據(jù)的p值均大于0.05,三組數(shù)據(jù)具有正態(tài)性。若不滿足正態(tài)性可以使用非參數(shù)檢驗進(jìn)行分析,接著進(jìn)行方差齊檢驗如下。
3.方差齊檢驗
利用SPSSAU方差齊進(jìn)行檢驗結(jié)果如下:
從結(jié)果中可以看出,三個組別進(jìn)行方差齊檢驗,最終F值為2.797,p值為0.073大于0.05,意味著三組數(shù)據(jù)波動沒有太大差異,具有方差齊性。通過分析,發(fā)現(xiàn)數(shù)據(jù)滿足方差分析的條件(如果不滿足方差齊性,可以使用非參數(shù)檢驗或者welch 方差,或者Brown-Forsythe方差),綜上滿足單因素方差分析條件。
四、單因素方差分析
分析三個行業(yè)之間的服務(wù)質(zhì)量是否有差異,以“行業(yè)”作為自變量,以“投訴次數(shù)”作為因變量進(jìn)行單因素方差分析,結(jié)果如下:
從上表中可以看出,零售業(yè)的均值為49.929,標(biāo)準(zhǔn)差為9.068;旅游業(yè)的均值為28,標(biāo)準(zhǔn)差為4.315;航空公司的標(biāo)準(zhǔn)差為34.333,標(biāo)準(zhǔn)差為7.451。從中可以看出三者之間有差異,并且零售業(yè)投訴次數(shù)相對多一些,以及單因素方差模型的F值為34.244,P值遠(yuǎn)小于0.05,具有顯著性差異,也說明了三者之間存在顯著性差異。也可以用圖示化方法進(jìn)行描述三者的均值對比:
從折線圖中可以看出,例子中“零售業(yè)”的均值最大,其次是“航空公司”最后是“旅游業(yè)”也即說明“零售業(yè)”的投訴比較多,然后是“航空公司”最后是“旅游業(yè)”。那么根據(jù)單因素方差分析驗證三者之間存在顯著性差異,具體兩兩之間的差異如何查看呢?接下來利用事后多重比較分析“兩兩”之間的關(guān)系。
五、事后多重比較
利用SPSSAU事后多重比較中的LSD法(使用最為廣泛,檢驗效能高,對比組別較少)進(jìn)行兩兩比較,結(jié)果如下:
“零售業(yè)”,“旅游業(yè)”以及“航空公司”之間兩兩比較,一共有三組比較,分別為“零售業(yè)”和“旅游業(yè)”、“零售業(yè)”和“航空公司”以及“旅游業(yè)”和“航空公司”最后發(fā)現(xiàn)三組的p值均小于0.05,所以三個行業(yè)兩兩之間均具有顯著性差異。
六、總結(jié)
通過搜集的數(shù)據(jù)進(jìn)行單因素方差分析發(fā)現(xiàn)三個行業(yè)之間的服務(wù)質(zhì)量有差異,結(jié)合單因素方差分析結(jié)果以及折線圖發(fā)現(xiàn)“零售業(yè)”收到的投訴次數(shù)相對較多,其次是“航空公司”最后是“旅游業(yè)”,然后分析三者中兩兩行業(yè)的關(guān)系,在單因素方差分析的基礎(chǔ)上,進(jìn)行事后多重比較發(fā)現(xiàn)三個行業(yè)中兩兩之間均具有差異,也說明“零售業(yè)”可以更進(jìn)一步研究“如何提升服務(wù)質(zhì)量”。