方差分析、T檢驗(yàn)、卡方分析如何區(qū)分?
差異研究的目的在于比較兩組數(shù)據(jù)或多組數(shù)據(jù)之間的差異,通常包括以下幾類分析方法,分別是方差分析、T檢驗(yàn)和卡方檢驗(yàn)。
三個(gè)方法的區(qū)別

其實(shí)核心的區(qū)別在于:數(shù)據(jù)類型不一樣。如果是定類和定類,此時(shí)應(yīng)該使用卡方分析;如果是定類和定量,此時(shí)應(yīng)該使用方差或者T檢驗(yàn)。
方差和T檢驗(yàn)的區(qū)別在于,對(duì)于T檢驗(yàn)的X來講,其只能為2個(gè)類別比如男和女。如果X為3個(gè)類別比如本科以下,本科,本科以上;此時(shí)只能使用方差分析。
進(jìn)一步細(xì)分

1)方差分析
根據(jù)X的不同,方差分析又可以進(jìn)行細(xì)分。X的個(gè)數(shù)為一個(gè)時(shí),我們稱之為單因素方差;X為2個(gè)時(shí)則為雙因素方差;X為3個(gè)時(shí)則稱作三因素方差,依次下去。當(dāng)X超過1個(gè)時(shí),統(tǒng)稱為多因素方差。
單因素方差分析,用于分析定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況。在使用單因素方差分析時(shí),需要每個(gè)選項(xiàng)的樣本量大于30,比如男性和女性樣本量分別是100和120,如果出現(xiàn)某個(gè)選項(xiàng)樣本量過少時(shí)應(yīng)該首先進(jìn)行組別合并處理,比如研究不同年齡組樣本對(duì)于研究變量的差異性態(tài)度時(shí),年齡小于20歲的樣本量?jī)H為20個(gè),那么需要將小于20歲的選項(xiàng)與另外一組(比如20~25歲)的組別合并為一組,然后再進(jìn)行單因素方差分析。
如果選項(xiàng)無法進(jìn)行合并處理,比如研究不同專業(yè)樣本對(duì)于變量的態(tài)度差異,研究樣本的專業(yè)共分為市場(chǎng)營(yíng)銷、心理學(xué)、教育學(xué)和管理學(xué)四個(gè)專業(yè),這四個(gè)專業(yè)之間為彼此獨(dú)立無法進(jìn)行合并組別,但是市場(chǎng)營(yíng)銷專業(yè)樣本量?jī)H為20并沒有代表意義,因此可以考慮首先篩選出市場(chǎng)營(yíng)銷專業(yè),即僅比較心理學(xué),教育學(xué)和管理學(xué)這三個(gè)專業(yè)對(duì)某變量的差異性態(tài)度,當(dāng)對(duì)比的組別超過三個(gè),并且呈現(xiàn)出顯著性差異時(shí),可以考慮使用事后檢驗(yàn)進(jìn)一步對(duì)比具體兩兩組別間的差異情況。

雙因素方差分析,用于分析定類數(shù)據(jù)(2個(gè))與定量數(shù)據(jù)之間的關(guān)系情況,例如研究人員性別,學(xué)歷對(duì)于網(wǎng)購(gòu)滿意度的差異性;以及男性或者女性時(shí),不同學(xué)歷是否有著網(wǎng)購(gòu)滿意度差異性;或者同一學(xué)歷時(shí),不同性別是否有著網(wǎng)購(gòu)滿意度差異性。

多因素方差分析通常用于類實(shí)驗(yàn)式問卷研究。比如研究者測(cè)試某新藥對(duì)于膽固醇水平是否有療效;研究者共招募72名被試,男女分別為36名,以及男女分別再細(xì)分使用新藥和普通藥物;同時(shí)高血壓患者對(duì)于新藥可能有干擾,因而研究者將被試是否患高血壓也納入考慮范疇中。因而最終,X共分為三個(gè),分別是藥物(舊藥和新藥)、性別,是否患高血壓;Y為膽固醇水平。因而需要進(jìn)行三因素方差分析即多因素方差分析。

在方法選擇上,問卷研究通常會(huì)使用方差分析,但某些專業(yè),比如心理學(xué)、教育學(xué)或者師范類專業(yè)等涉及到實(shí)驗(yàn)研究時(shí),更多會(huì)使用T檢驗(yàn)進(jìn)行分析,另外方差分析與T檢驗(yàn)還有較多差異,在某些分析中只能使用其中一種。
2)T檢驗(yàn)
T檢驗(yàn)共分為三種方法,分別是獨(dú)立樣本T檢驗(yàn),配對(duì)樣本T檢驗(yàn)和單樣本T檢驗(yàn)。
獨(dú)立樣本T檢驗(yàn)和單因素方差分析功能上基本一致,但是獨(dú)立樣本T檢驗(yàn)只能比較兩組選項(xiàng)的差異,比如男性和女性。相對(duì)來講,獨(dú)立樣本T檢驗(yàn)在實(shí)驗(yàn)比較時(shí)使用頻率更高,尤其是生物、醫(yī)學(xué)相關(guān)領(lǐng)域。針對(duì)問卷研究,如果比較的類別為兩組,獨(dú)立樣本T檢驗(yàn)和單因素方差分析均可實(shí)現(xiàn),研究者自行選擇使用即可。

獨(dú)立樣本T檢驗(yàn)和配對(duì)樣本T檢驗(yàn)功能上都是比較差異,而且均是比較兩個(gè)組別差異。但二者有著實(shí)質(zhì)性區(qū)別,如果是比較不同性別,婚姻狀況(已婚和未婚)樣本對(duì)某變量的差異時(shí),應(yīng)該使用獨(dú)立樣本T檢驗(yàn)。如果比較組別之間有配對(duì)關(guān)系時(shí),只能使用配對(duì)樣本T檢驗(yàn),配對(duì)關(guān)系是指類似實(shí)驗(yàn)組和對(duì)照組的這類關(guān)系。另外獨(dú)立樣本T檢驗(yàn)兩組樣本個(gè)數(shù)可以不相等,而配對(duì)樣本T檢驗(yàn)的兩組樣本量需要完全相等。

T檢驗(yàn)的第三種分析方法為單樣本T檢驗(yàn)。比如問卷某題項(xiàng)選項(xiàng)表示為1分代表非常不滿意,2分代表比較不滿意,3分代表一般,4分代表比較滿意,5分代表非常滿意,當(dāng)想分析樣本對(duì)此題項(xiàng)的態(tài)度是否有明顯的傾向,比如明顯高于3分或者明顯低于3分時(shí),即可以使用單樣本T檢驗(yàn)。單樣本T檢驗(yàn)是比較某個(gè)題項(xiàng)的平均得分是否與某數(shù)字(例子是與3進(jìn)行對(duì)比)有著明顯的差異,如果呈現(xiàn)出顯著性差異,即說明明顯該題項(xiàng)平均打分明顯不等于3分。此分析方法在問卷研究中較少使用,平均得分是否明顯不為3分可以很直觀的看出,而不需要單獨(dú)進(jìn)行檢驗(yàn)分析。

3)卡方分析
卡方檢驗(yàn)用于分析定類數(shù)據(jù)與定類數(shù)據(jù)之間的關(guān)系情況。例如研究人員想知道兩組學(xué)生對(duì)于手機(jī)品牌的偏好差異情況,則應(yīng)該使用卡方分析??ǚ绞峭ㄟ^分析不同類別數(shù)據(jù)的相對(duì)選擇頻數(shù)和占比情況,進(jìn)而進(jìn)行差異判斷,單選題或多選題均可以使用卡方分析進(jìn)行對(duì)比差異分析。
