雙因素方差分析全流程總結(jié)
上篇文章講述了“單因素方差分析全流程總結(jié)”,單因素方差分析只是考慮了一個(gè)自變量(定類)與一個(gè)因變量(定量)之間的關(guān)系,但是在實(shí)際問題研究中可能研究兩個(gè)或者幾個(gè)因素與因變量之間的關(guān)系,例如,分析產(chǎn)品滿意度與學(xué)歷、品牌滿意度等的關(guān)系。當(dāng)方差分析中研究幾個(gè)自變量和1個(gè)因變量之間的關(guān)系時(shí),稱為多因素方差分析。如果是兩個(gè)自變量則為雙因素方差分析。
一、案例與數(shù)據(jù)
有四個(gè)品牌的吸塵器在兩個(gè)地區(qū)的不同門店銷售,為分析吸塵器的品牌和銷售地區(qū)對銷售量的影響,搜集每個(gè)品牌在各地區(qū)的銷售數(shù)據(jù),銷售經(jīng)理根據(jù)搜集的數(shù)據(jù)想要進(jìn)行分析品牌和地區(qū)對吸塵器的銷售量是否有顯著差異以及兩個(gè)因素搭配是否對銷售量產(chǎn)生新的影響,部分?jǐn)?shù)據(jù)如下:
二、分析問題
例子中涉及三個(gè)變量,一個(gè)是“地區(qū)”一個(gè)是“品牌”還有一個(gè)是“銷售量”。其中“地區(qū)”和“品牌”是定類變量,“銷售量”是定量變量,想要進(jìn)行分析品牌和地區(qū)對吸塵器的銷售量是否有顯著差異,分析究竟是一個(gè)因素在起作用,還是兩個(gè)因素都在起作用,還是兩個(gè)因素都不起作用。這就是一個(gè)雙因素方差分析問題。
三、分析前準(zhǔn)備
在進(jìn)行雙因素方差分析前需要進(jìn)行分析前準(zhǔn)備,首先進(jìn)行數(shù)據(jù)的異常值檢查,然后驗(yàn)證數(shù)據(jù)是否滿足雙因素方差分析的要求:
案例已經(jīng)滿足前兩個(gè)條件,只需驗(yàn)證在個(gè)總體中,每個(gè)總體服從正態(tài)分布和方差齊性。
1、異常值檢驗(yàn)
異常值是指在數(shù)據(jù)中不正常的值,也稱離群值,比如大于三倍標(biāo)準(zhǔn)差等。與其它方差分析一致,雙因素方差分析對異常值也比較敏感,這些數(shù)據(jù)可能會(huì)導(dǎo)致分析結(jié)果異常,比如扭曲各分類之間的差異,所以檢驗(yàn)異常值尤為重要。利用SPSSAU箱線圖進(jìn)行查看直觀且容易查看異常值點(diǎn)。
不同地區(qū)的銷量:
從箱線圖中可以看出不同地區(qū)吸塵器的銷量沒有發(fā)現(xiàn)異常值。
不同品牌的銷量:
從箱線圖中可以看出不同品牌吸塵器的銷量沒有發(fā)現(xiàn)異常值。綜上:數(shù)據(jù)中暫未發(fā)現(xiàn)異常值,不需要處理。
那么如果出現(xiàn)異常值如何處理呢?
常見做法是將異常值剔除,重新進(jìn)行分析,有時(shí)異常值數(shù)量較多,不希望剔除,那么也可以處理為缺失值進(jìn)行填補(bǔ)(一般平均值和中位數(shù)等使用較多),或者利用插值法進(jìn)行插值。接下來進(jìn)行檢查數(shù)據(jù)是否符合方差分析的前提條件,首先進(jìn)行正態(tài)性檢驗(yàn)。
2、正態(tài)性檢驗(yàn)
檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布有很多種方式其中包括正態(tài)性檢驗(yàn)以及圖示化P-P圖或者Q-Q圖等,例子中要檢驗(yàn)每個(gè)總體是否服從正態(tài)分布,由于正態(tài)性檢驗(yàn)最為嚴(yán)謹(jǐn),所以這里使用正態(tài)性檢驗(yàn)進(jìn)行分析。不同品牌的銷量結(jié)果如下:
SPSSAU共提供三種正態(tài)性檢驗(yàn)其中包括K-S檢驗(yàn)(Kolmogorov-Smirnov檢驗(yàn))、S-W檢驗(yàn)(Shapiro-Wilk檢驗(yàn))以及J-B檢驗(yàn)(Jarque-Bera檢驗(yàn)),由于每個(gè)個(gè)體的樣本為6個(gè)總樣本量為24個(gè)小于50所以為小樣本分析,使用S-W檢驗(yàn)進(jìn)行分析即可,如果樣本量較大(比如大于50)可以考慮使用K-S或者J-B檢驗(yàn)。發(fā)現(xiàn)S-W檢驗(yàn)中p值均大于0.05,所以不同地區(qū)的銷量滿足正態(tài)性檢驗(yàn),不同地區(qū)吸塵器的銷量分析也是如此:
綜上,每個(gè)總體服從正態(tài)分布,接下來驗(yàn)證是否服從方差齊性。
3、方差齊檢驗(yàn)
方差齊性指自變量X的取值范圍內(nèi),不論X取什么值,對應(yīng)的Y為服從正態(tài)分布的隨機(jī)變量,并具有相同的方差,即Y的方差與X值的大小無關(guān)(來源百度百科)。利用SPSSAU進(jìn)行方差齊檢驗(yàn)(分析路徑【通用方法】→【方差】)。不同地區(qū)的銷量方差齊分析如下:
利用方差齊性檢驗(yàn)各組別數(shù)據(jù)的波動(dòng)情況,從方差齊分析結(jié)果中可以看出結(jié)果的F值為0.043,p值為0.838大于0.05,說明不同地區(qū)的銷量沒有顯著差異性,也即說明具有方差齊性,同理可以分析不同品牌的銷量也具有方差齊性(不進(jìn)行贅述)。
綜上,每個(gè)總體服從方差齊性,并且滿足雙因素方差分析的前提條件,所以接下來進(jìn)行雙因素方差分析。
四、雙因素方差分析
為了研究品牌和地區(qū)對吸塵器的銷售量是否有顯著差異以及兩個(gè)因素搭配是否對銷售量產(chǎn)生新的影響,以品牌和地區(qū)作為自變量,以銷售量作為因變量進(jìn)行雙因素方差分析。
1、主效應(yīng)
考慮某因素的主效應(yīng)時(shí),需要考慮除所有因素的效應(yīng),簡單來說就是X對Y的影響。比如:雙因素方差分析中,分別去判斷“地區(qū)”和“品牌”對銷售量的影響。
結(jié)果如下:
首先進(jìn)行查看變量“地區(qū)”,發(fā)現(xiàn)自變量地區(qū)的F值為21.970,并且p值小于0.05所以說明主效應(yīng)存在,然后對“品牌”進(jìn)行分析,發(fā)現(xiàn)品牌的F值為130.145并且p值小于0.05所以說明主效應(yīng)存在,具體差異可以進(jìn)行事后多重比較進(jìn)行分析。接下來研究“地區(qū)”和“品牌”搭配是否對銷售量產(chǎn)生新的影響,進(jìn)行查看交互效應(yīng)。
2、交互效應(yīng)
在雙因素方差分析中,如果除了研究品牌和地區(qū)對銷售量的影響還研究兩個(gè)因素搭配是否對銷售量產(chǎn)生新的影響,例如例子中的某個(gè)地區(qū)對某種品牌吸塵器有特殊偏好,則為雙因素方差分析的交互作用分析,即交互效應(yīng)。
從上表可以看出,分析項(xiàng)為“地區(qū)與品牌的交互項(xiàng)”因變量為“銷售量”發(fā)現(xiàn)模型的F值為1.649,并且p值為0.218大于0.05,所以模型不顯著,即說明沒有交互效應(yīng)。分析完畢。綜上,存在主效應(yīng)但不存在交互效應(yīng),接下來進(jìn)一步分析。
五、進(jìn)一步分析
如果進(jìn)行雙因素方差分析,一般是主效應(yīng)顯著后才會(huì)進(jìn)一步查看事后多重比較,對于交互作用顯著的模型才會(huì)更深一步研究簡單效應(yīng)分析。
1、簡單效應(yīng)
簡單效應(yīng)是指簡單效應(yīng)指X1在某個(gè)水平時(shí),X2不同水平的比較;因?yàn)樵撃P椭淮嬖谥餍?yīng)所以進(jìn)行事后多重比較不進(jìn)行簡單效應(yīng)分析。如果存在交互效應(yīng),則可以進(jìn)一步分析簡單效應(yīng)。
2、事后多重比較
因?yàn)橹餍?yīng)顯著,并且“地區(qū)”和“品牌”兩個(gè)主效應(yīng)都顯著,所以進(jìn)行事后多重比較,進(jìn)一步分析(此處利用LSD方法進(jìn)行,因?yàn)樵摲椒▽Σ町愖顬槊舾惺褂米顬閺V泛,并且檢驗(yàn)效能高,對比組別較少時(shí)使用,除此之外SPSSAU還提供其它方法,比如:Bonferroni校正等)。
“地區(qū)”事后多重比較:
比較不同地區(qū)的銷量是否有顯著性差異,上表可以看出t值為-4.687,p值遠(yuǎn)小于0.05所以地區(qū)1和地區(qū)2的銷量有顯著性差異并且地區(qū)1與地區(qū)2的均值差值為負(fù)數(shù),說明地區(qū)2的均值更大,從側(cè)面說明地區(qū)2的銷量更好。
“品牌”事后多重比較:
比較不同品牌的銷量是否有顯著性差異,上表可以看出品牌1、品牌2、品牌3、品牌4兩兩之間比較,p值均遠(yuǎn)小于0.05所以不同品牌兩兩之間的銷量均有顯著性差異,并且從均值差值中可以看出品牌1的均值更大,從側(cè)面說明品牌1的銷量更好。
六、總結(jié)
通過雙因素方差分析研究了“品牌和地區(qū)對吸塵器的銷售量是否有顯著差異以及兩個(gè)因素搭配是否對銷售量產(chǎn)生新的影響”,最后發(fā)現(xiàn)品牌和地區(qū)對吸塵器的銷售量有顯著性差異,但是兩個(gè)因素搭配并未對對銷售量產(chǎn)生新的影響,并且利用事后多重比較進(jìn)一步分析發(fā)現(xiàn)不同地區(qū)對銷售量有顯著性差異,并且地區(qū)2銷量更好,不同品牌兩兩之間的銷量均有顯著性差異品牌1的銷量更好,所以公司在做決策時(shí)可以重點(diǎn)分析地區(qū)2和品牌1的特點(diǎn)或者策略等。