深入解析交互效應(yīng)、主效應(yīng)和簡(jiǎn)單效應(yīng)—推薦收藏!
所謂“事出反常必有妖,事由多因必復(fù)雜”。對(duì)于多因素研究,不僅要關(guān)注每個(gè)因素的直接效應(yīng),還需要考慮因素與因素之間的相互作用。交互作用由于其實(shí)際的生物學(xué)和專業(yè)意義,越來(lái)越受到研究者的重視。但由于現(xiàn)實(shí)世界事物間聯(lián)系本身的復(fù)雜性,很難窮盡“真實(shí)”交互作用的所有形式,目前研究者仍然主要從數(shù)據(jù)出發(fā),依靠統(tǒng)計(jì)學(xué)方法進(jìn)行交互作用的識(shí)別,此時(shí)稱為統(tǒng)計(jì)學(xué)交互作用(statistical interaction)更為合理。常用的方法包括分層(或亞組)分析后效應(yīng)的異質(zhì)性檢驗(yàn)、模型中納入乘積交互項(xiàng)等。同時(shí),根據(jù)交互作用的發(fā)生機(jī)制、模型、效應(yīng)指標(biāo)不同,可以分為相加模型和相乘模型兩種,其原理各位看官可以查閱相關(guān)文獻(xiàn)哦。在我們下面的案例中,由于是基于線性模型,通過(guò)差值考察效應(yīng),實(shí)際考察的僅是相加交互作用。
一、研究效應(yīng)
研究效應(yīng)是研究因素作用下研究對(duì)象出現(xiàn)的反應(yīng)或結(jié)果。但從歸因的角度來(lái)看,不管是多因素研究還是單因素研究,觀察到的結(jié)果都是多種因素作用產(chǎn)生的綜合效應(yīng)。比如100人用某藥后80人有效,有效率80%是綜合有效率,需要設(shè)置一個(gè)不用藥且可比對(duì)照組,如觀察到對(duì)照組有效率為60%,實(shí)際歸因于藥物的有效率為20%。因此,研究中歸因效應(yīng)都是通過(guò)差異(差或比的形式)體現(xiàn)的。在單因素分析中比較簡(jiǎn)單,但在多因素分析中,還需要區(qū)分主效應(yīng)、簡(jiǎn)單效應(yīng)和交互效應(yīng)。
(一)主效應(yīng)
主效應(yīng)是不考慮其他因素存在時(shí),所關(guān)注因素不同水平觀察結(jié)果的差異。比如上例中的20%即為藥物的主效應(yīng)。
(二)簡(jiǎn)單效應(yīng)(單獨(dú)效應(yīng))
簡(jiǎn)單效應(yīng)又稱單獨(dú)效應(yīng),是指其他因素水平固定時(shí),所關(guān)注因素不同水平的效應(yīng)之差。比如對(duì)于重型病人歸因于藥物有效率為10%(即重型病人用藥組有效率65%-對(duì)照組55%)。因此簡(jiǎn)單效應(yīng)反映的不是所有對(duì)象的估計(jì)結(jié)果,而是某一亞組(如對(duì)照組、第1周等)的估計(jì)結(jié)果。
(三)交互效應(yīng)
兩個(gè)或多個(gè)因素間的效應(yīng)互不獨(dú)立的情形,即一個(gè)因素的單獨(dú)效應(yīng)隨著另外一個(gè)(或多個(gè))因素水平的變化而變化。比如重型病人歸因于藥物有效率為10%(即重型病人用藥組有效率65%-對(duì)照組55%),而輕型病人有效率為30%(即輕型病人用藥組有效率95%-對(duì)照組65%),此時(shí)即可認(rèn)為存在了藥物與病型存在交互作用。

二、案例-兩分類變量效應(yīng)解讀
示例:三組實(shí)驗(yàn)(正常、實(shí)驗(yàn)A、實(shí)驗(yàn)B)治療某病的效果,進(jìn)行了21周的隨訪,隨訪時(shí)點(diǎn)位3、7、14、21周四個(gè)時(shí)點(diǎn);Y表示測(cè)量指標(biāo)。
grp:組別。
t:隨訪時(shí)間。
y:測(cè)量結(jié)果(因變量)。

考慮本研究為重復(fù)測(cè)量設(shè)計(jì),估采用線性混合效應(yīng)模型(為方便演示,納入隨機(jī)效應(yīng)為隨機(jī)截距)。
ods html dpi=300 ;
ods graphics / reset height=5in width=7in noborder attrpriority=color ;
proc sgplot data = t;
?? styleattrs ?? datacontrastcolors=("#ff5500" "#4b71af" "#54a767" "#7f72b2" "#d98ac2" "#ccb874" "#ff6b83" "#da8455" "#90b0ed") ;
?? vline t /? group=grp response=y stat=mean limits=both limitstat=stddev markers LIMITATTRS=(thickness=1px )
?????? CLUSTERWIDTH=0.5 datalabel??? GROUPDISPLAY=CLUSTER lineattrs=(thickness=3px ) name="a";
?? xaxis display=(nolabel)
?????? valueattrs=(size=9 Family="黑體/Times New Roman" weight=bold)
?????? ?labelattrs=(size=10 Family="黑體/Times New Roman" weight=bold)? grid GRIDATTRS=(color=white thickness=1.5) ;
?? yaxis??
?????? valueattrs=(size=9 Family="黑體/Times New Roman" weight=bold)
?????? label="Y"
?????? ?labelattrs=(size=10 Family="黑體/Times New Roman" weight=bold)?? grid GRIDATTRS=(color=white thickness=1.5) ;
?? keylegend "a"/ title="組別" titleATTRS=( Family="黑體/Times New Roman" size=8 weight=bold) noborder
?????? VALUEATTRS=( Family="黑體/Times New Roman" size=8 weight=bold) location=inside position=topright down=4;
?????? format t t. grp grp.;
run;
ods graphics off;

proc means data =t n nmiss mean ;
?? var y;
?? class grp t;
?? format t t. grp grp.;
run;

(二)模型建立
1、?建立主效應(yīng)模型
模型中不納入交互作用的時(shí),結(jié)果即為主效應(yīng)。
代碼:
proc mixed data = t covtest;
? class id grp(ref="1正常") t(ref="3周") /ref=first;
? model y=t grp / solution;
? random int / subject=id type=un solution g ;
? lsmeans t grp /cl diff;
run;
quit;
結(jié)果:
(1)模型的固定效應(yīng)參數(shù)估計(jì)結(jié)果

上圖為固定效應(yīng)的解,模型中沒(méi)有納入交互效應(yīng),呈現(xiàn)為主效應(yīng)結(jié)果。主效應(yīng)是基于所有人不分組的結(jié)果,此時(shí)假設(shè)三組隨時(shí)間的變化趨勢(shì)線平行。grp結(jié)果顯示:實(shí)驗(yàn)組A與正常組相比,結(jié)果低于正常組(實(shí)驗(yàn)組A-正常組=-2.4586)。同理,14周和21周結(jié)果低于3周結(jié)果。
(2)模型的最小二乘均值

上圖結(jié)果輸出模型中組別和時(shí)間的最小二乘均值,我們可以發(fā)現(xiàn)組間最小二乘均值的差即為模型的系數(shù)估計(jì)。例如:實(shí)驗(yàn)組A-正常組=1.7491-4.2080=2.4589。該結(jié)果與上述結(jié)果一致。
(3)不同組別的均值
那么我們繼續(xù)輸出均值的結(jié)果呢?
proc means data =t n nmiss mean stddev ;
? var y;
? class t ;
? format t t. ;
run;

不同組別的均值結(jié)果表明:實(shí)驗(yàn)組A-正常組=1.74907-4.20798=-4.4589。此時(shí),我們驚奇地發(fā)現(xiàn),不同組別描述的均值之差和最小二乘均值之差相同,那么這種情況是巧合嗎?
在一般情況下,若數(shù)據(jù)是均衡的,二者的主效應(yīng)計(jì)算結(jié)果就是相同;但如果數(shù)據(jù)不均衡,二者的結(jié)果也會(huì)不一樣。本研究中各測(cè)量時(shí)點(diǎn)相同,且不存在缺失,可認(rèn)為是均衡數(shù)據(jù)。從使用的角度看,若試驗(yàn)是不均衡的,則應(yīng)該使用LSMEANS。此外,LSMEANS也用于某個(gè)因素下水平間差異的檢驗(yàn)。小編這里建議大家直接使用LSMEANS。
2、模型的交互效應(yīng)和簡(jiǎn)單效應(yīng)
模型中納入交互作用的時(shí),結(jié)果即為交互效應(yīng)和簡(jiǎn)單效應(yīng)。
代碼:
ods output diffs=diffs;
proc mixed data = t covtest;
? class id grp(ref="1正常") t(ref="3周") /ref=first;
? model y=t grp t*grp/ solution;
? random int / subject=id type=un solution g ;
? lsmeans t grp t*grp/cl diff;
run;
quit;
結(jié)果:

3、簡(jiǎn)單效應(yīng)的理解和結(jié)果解釋:
圖中結(jié)果表明:時(shí)間以“3周”為參照組,組別以“正?!睘閰⒄战M的情況下,實(shí)驗(yàn)組A和正常組比較的估計(jì)值為-2.1715,此時(shí)的結(jié)果即為簡(jiǎn)單效應(yīng),解釋為:固定時(shí)間=3周時(shí),實(shí)驗(yàn)組A與正常組的差值估計(jì)。聽(tīng)到這里的小伙伴可能會(huì)產(chǎn)生困惑,難道我之前的效應(yīng)解釋都錯(cuò)了??那讓我慢慢道來(lái)。首先,通過(guò)“l(fā)smeans?t grp t*grp/cl?diff語(yǔ)句”輸出每個(gè)分類變量和其交互項(xiàng)的最小二乘均值:

模型輸出結(jié)果較長(zhǎng),我們通過(guò)提取Excel表格,經(jīng)過(guò)篩選結(jié)果如下:

結(jié)果表明:在控制時(shí)間=3周的情況下,實(shí)驗(yàn)組A和正常組比較的最小二乘均值的差值為-2.1715。
現(xiàn)在我們?cè)倮斫庀潞?jiǎn)單效應(yīng)的概念“其他因素水平固定時(shí),同一因素不同水平的效應(yīng)之差”。是不是豁然開(kāi)朗?。。⊥?,由于本研究為均衡數(shù)據(jù),此時(shí)控制時(shí)間=3周時(shí),實(shí)驗(yàn)組A和正常組均值比較的結(jié)果仍為-2.1715。

4、交互效應(yīng)的理解和結(jié)果解釋:

交互結(jié)果表明:14周時(shí)實(shí)驗(yàn)組B與正常組的差值與3周時(shí)實(shí)驗(yàn)組B與正常組的差值的差值為-1.2483。那么怎么理解這個(gè)結(jié)果呢?首先,我們得到14周時(shí)實(shí)驗(yàn)組B與正常組的差值為-1.6624(該結(jié)果為組別在時(shí)間=14周時(shí)的單獨(dú)效應(yīng))。

同理得到3周時(shí)實(shí)驗(yàn)組B與正常組的差值為-0.4141(該結(jié)果為組別在時(shí)間=3周時(shí)的單獨(dú)效應(yīng))。

那么差值的差值為:-1.6624-(-0.4141)=-1.2483。此刻再理解交互效應(yīng)的概率“兩個(gè)或多個(gè)因素間的效應(yīng)互不獨(dú)立的情形,表示一個(gè)因素的單獨(dú)效應(yīng)隨著另外一個(gè)因素水平的變化而變化”,組別在14周的單獨(dú)效應(yīng)和組別在3周時(shí)的單獨(dú)效應(yīng)之差。
現(xiàn)在,可否豁然開(kāi)朗?
繼續(xù)?。?!
三、案例-1分類1定量變量結(jié)果解讀
直接上代碼:
ods results;
ods output solutionf=EST_bl_y;
proc mixed data=dataset_bl plots=studentpanel(marginal conditional);
? class x(ref="2");
? model y=x logCRP x*logCRP/solution cl;
? lsmeans x/ cl diff;
run;
quit;
其中:
X:定性資料
logCRP:定量資料
y:因變量
此時(shí)的Mixed過(guò)程步,沒(méi)有納入隨機(jī)效應(yīng),結(jié)果同線性回歸模型結(jié)果。
(一)交互效應(yīng)的理解和結(jié)果解釋:

結(jié)果顯示:logCRP和x存在交互效應(yīng)。定性資料和定量資料的交互可以理解為:通過(guò)定性資料分層,分別擬合模型,模型的系數(shù)差,即為交互結(jié)果。
X分為0 1 2三層分別擬合線性回歸模型如下:

此時(shí),我們用X=0時(shí)的回歸系數(shù)減去X=1時(shí)的回歸系數(shù):0.178-1.275=-1.097。剛好等于模型的估計(jì)系數(shù)。

那么,是否還有更直觀的解釋?我們通過(guò)繪制不同X分層的回歸擬合圖,圖中的斜率即為X分層建模logCRP的系數(shù)。我們發(fā)現(xiàn)X=0和X=1具有相同的變化趨勢(shì),而X=0、X=1與X=2變化趨勢(shì)存在交叉,也對(duì)應(yīng)的模型的結(jié)果,交互效應(yīng)具有統(tǒng)計(jì)學(xué)意義。此時(shí)模型還可以解釋為:隨著logCRP的增加,X=2時(shí)具有較快的增長(zhǎng)趨勢(shì),而X=0和X=1具有相同的增長(zhǎng)趨勢(shì)。
聽(tīng)到這里?還不點(diǎn)贊、收藏和轉(zhuǎn)發(fā)??
需要數(shù)據(jù)和代碼的小伙伴私信小編發(fā)送“交互”?。?!
關(guān)注微信公眾號(hào),獲取更多相關(guān)內(nèi)容!
