R語言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例|附代碼數(shù)據(jù)
全文下載鏈接:http://tecdat.cn/?p=23050
最近我們被客戶要求撰寫關(guān)于線性混合效應(yīng)模型的研究報告,包括一些圖形和統(tǒng)計輸出。
在本文中,我們將用R語言對數(shù)據(jù)進(jìn)行線性混合效應(yīng)模型的擬合,然后可視化你的結(jié)果
線性混合效應(yīng)模型是在有隨機(jī)效應(yīng)時使用的,隨機(jī)效應(yīng)發(fā)生在對隨機(jī)抽樣的單位進(jìn)行多次測量時。來自同一自然組的測量結(jié)果本身并不是獨立的隨機(jī)樣本。因此,這些單位或群體被假定為從一個群體的 "人口 "中隨機(jī)抽取的。示例情況包括
當(dāng)你劃分并對各部分進(jìn)行單獨實驗時(隨機(jī)組)。
當(dāng)你的抽樣設(shè)計是嵌套的,如橫斷面內(nèi)的四分儀;林地內(nèi)的橫斷面;地區(qū)內(nèi)的林地(橫斷面、林地和地區(qū)都是隨機(jī)組)。
當(dāng)你對相關(guān)個體進(jìn)行測量時(家庭是隨機(jī)組)。
當(dāng)你重復(fù)測量受試者時(受試者是隨機(jī)組)。
混合效應(yīng)的線性模型在R命令lme4和lmerTest包中實現(xiàn)。另一個選擇是使用nmle包中的lme方法。lme4中用于計算近似自由度的方法比nmle包中的方法更準(zhǔn)確一些,特別是在樣本量不大的時候。
測量斑塊長度
這第一個數(shù)據(jù)集是從Griffith和Sheldon(2001年,《動物行為學(xué)》61:987-993)的一篇論文中提取的,他們在兩年內(nèi)對瑞典哥特蘭島上的30只雄性領(lǐng)頭鶲的白色額斑進(jìn)行了測量。該斑塊在吸引配偶方面很重要,但其大小每年都有變化。我們在這里的目標(biāo)是估計斑塊長度(毫米)。
讀取和檢查數(shù)據(jù)
從文件中讀取數(shù)據(jù)。
查看數(shù)據(jù)的前幾行,看是否正確讀取。
創(chuàng)建一個顯示兩年研究中每只飛鳥的測量對圖??梢試L試制作點陣圖。是否有證據(jù)表明不同年份之間存在著測量變異性?
構(gòu)建線性混合效應(yīng)模型
對數(shù)據(jù)進(jìn)行線性混合效應(yīng)模型,將單個鳥類視為隨機(jī)組。注:對每只鳥的兩次測量是在研究的連續(xù)年份進(jìn)行的。為了簡單起見,在模型中不包括年份。在R中把它轉(zhuǎn)換成一個字符或因子,這樣它就不會被當(dāng)作一個數(shù)字變量。按照下面步驟(2)和(3)所述,用這個模型重新計算可重復(fù)性。重復(fù)性的解釋如何改變?
從保存的lmer對象中提取參數(shù)估計值(系數(shù))。檢查隨機(jī)效應(yīng)的輸出。隨機(jī)變異的兩個來源是什么?固定效應(yīng)指的是什么?
在輸出中,檢查隨機(jī)效應(yīng)的標(biāo)準(zhǔn)差。應(yīng)該有兩個標(biāo)準(zhǔn)差:一個是"(截距)",一個是 "殘差"。這是因為混合效應(yīng)模型有兩個隨機(jī)變異的來源:鳥類內(nèi)部重復(fù)測量的差異,以及鳥類之間額斑長度的真實差異。這兩個來源中的哪一個對應(yīng)于"(截距)",哪一個對應(yīng)于 "殘差"?
同時檢查固定效應(yīng)結(jié)果的輸出。模型公式中唯一的固定效應(yīng)是所有長度測量的平均值。它被稱為"(截距)",但不要與隨機(jī)效應(yīng)的截距相混淆。固定效應(yīng)輸出給了你平均值的估計值和該估計值的標(biāo)準(zhǔn)誤差。注意固定效應(yīng)輸出是如何提供均值估計值的,而隨機(jī)效應(yīng)輸出則提供方差(或標(biāo)準(zhǔn)差)的估計值。
從擬合模型中提取方差分量,估計各年斑塊長度的可重復(fù)性*。
解釋上一步中獲得的重復(fù)性測量結(jié)果。如果你得到的重復(fù)性小于1.0,那么個體內(nèi)測量結(jié)果之間的變化來源是什么。僅是測量誤差嗎?
產(chǎn)生一個殘差與擬合值的圖。注意到有什么問題?似乎有一個輕微的正向趨勢。這不是一個錯誤,而是最佳線性無偏預(yù)測器(BLUPs)"收縮 "的結(jié)果。
分析步驟
讀取并檢查數(shù)據(jù)。
head(fly)

#?點陣圖chart(patch?~?bird)

#?但顯示成對數(shù)據(jù)的更好方法是用成對的交互圖來顯示plot(res=patch,?x?=?year)

#?優(yōu)化版本plot(y?=?patch,?x?=?factor(year),?theme_classic)

擬合一個線性混合效應(yīng)模型。summary()的輸出將顯示兩個隨機(jī)變異的來源:單個鳥類之間的變異(鳥類截距),以及對同一鳥類進(jìn)行的重復(fù)測量之間的變異(殘差)。每個來源都有一個估計的方差和標(biāo)準(zhǔn)差。固定效應(yīng)只是所有鳥類的平均值--另一個 "截距"。
點擊標(biāo)題查閱往期內(nèi)容

R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級調(diào)查數(shù)據(jù)

左右滑動查看更多

01

02

03

04

#?1.混合效應(yīng)模型#?2.?參數(shù)估計summary(z)

#?5.?方差分量VarCorr(z)

#?可重復(fù)性1.11504^2/(1.11504^2?+?0.59833^2)
##?[1]?0.7764342
#?7.殘差與擬合值的關(guān)系圖plot(z)

金魚視覺
Cronly-Dillon和Muntz(1965; J. Exp. Biol 42: 481-493)用視運動反應(yīng)來測量金魚的色覺。在這里,我們將對數(shù)據(jù)進(jìn)行擬合,包括測試的全部波長。5條魚中的每一條都以隨機(jī)的順序在所有的波長下被測試。敏感度的值大表明魚可以檢測到低的光強(qiáng)度。視運動反應(yīng)的一個重要特點是,魚不習(xí)慣,在一個波長下的視覺敏感度的測量不太可能對后來在另一個波長下的測量產(chǎn)生影響。
讀取和檢查數(shù)據(jù)
讀取文件中的數(shù)據(jù),并查看前幾行以確保讀取正確。
使用交互圖來比較不同光波長實驗下的個體魚的反應(yīng)。
使用什么類型的實驗設(shè)計?*這將決定在擬合數(shù)據(jù)時使用的線性混合模型。
構(gòu)建線性混合效應(yīng)模型
對數(shù)據(jù)擬合一個線性混合效應(yīng)模型??梢杂胠mer()來實現(xiàn)。發(fā)現(xiàn)“畸形擬合”,“boundary (singular) fit: see ?isSingular
”繪制擬合(預(yù)測)值**。每條魚的預(yù)測值和觀察值之間的差異代表殘差。
你在(1)中做了什么假設(shè)?創(chuàng)建一個殘差與擬合值的圖,以檢查這些假設(shè)之一。
從保存的lmer對象中提取參數(shù)估計值。檢查固定效應(yīng)的結(jié)果。給出的系數(shù)與使用lm分析的分類變量的解釋相同。
檢查隨機(jī)效應(yīng)的輸出。我們的混合效應(yīng)模型中再次出現(xiàn)了兩個隨機(jī)誤差的來源。它們是什么?其中哪個對應(yīng)于輸出中的"(截距)",哪個對應(yīng)于 "殘差"?注意,在這個數(shù)據(jù)集中,其中一個變化源的估計標(biāo)準(zhǔn)差非常小。這就是畸形擬合信息背后的原因。魚類之間的方差不太可能真的為零,但是這個數(shù)據(jù)集非常小,由于抽樣誤差,可能會出現(xiàn)低方差估計。
生成基于模型的每個波長的平均敏感度的估計。
各個波長之間的差異是否顯著?生成lmer對象的方差分析表。這里測試的是什么效應(yīng),隨機(jī)效應(yīng)還是固定效應(yīng)?解釋方差分析結(jié)果。
*這是一個 "按實驗對象 "的重復(fù)測量設(shè)計,因為每條魚在每個實驗下被測量一次。它本質(zhì)上與隨機(jī)完全區(qū)塊設(shè)計相同(把每條魚看作是 "區(qū)塊")。
*可視化是首選,因為數(shù)據(jù)和擬合值都被繪制出來。請注意魚與魚之間的預(yù)測值是多么的相似。這表明在這項研究中,個體魚之間的估計差異非常小。
*** 一般來說,在方差分析表中只測試固定效應(yīng)。使用測試隨機(jī)效應(yīng)中沒有方差的無效假設(shè)是可能的。
分析步驟
讀取并檢查數(shù)據(jù)。
x?<-?read.csv("fish.csv",?
????????stringsAsFactors?=?FALSE)
head(x)

擬合一個線性混合效應(yīng)模型。
該模型假設(shè)所有擬合值的殘差為正態(tài)分布,方差相等。該方法還假設(shè)個體魚之間的隨機(jī)截距為正態(tài)分布。該方法還假設(shè)組(魚)的隨機(jī)抽樣,對同一魚的測量之間沒有影響。
#?#?1.?擬合混合效應(yīng)模型。
##?boundary?(singular)?fit:?see??isSingular

#?2. 這就為每條魚分別繪制了擬合值。vis(z)

#?3.測試假設(shè)plot(z)

#?4.?提取參數(shù)估計值summary(z)

#?6.??基于模型的平均敏感度估計?means(z)

#?7.?ANOVA方差分析
蓍草酚類物質(zhì)的濃度
項目實驗性地調(diào)查了國家公園的北方森林生態(tài)系統(tǒng)中施肥和食草的影響(Krebs, C.J., Boutin, S. & Boonstra, R., eds (2001a) Ecosystem dynamics of the Boreal Forest.Kluane項目. 牛津大學(xué)出版社,紐約)) ,目前的數(shù)據(jù)來自于一項關(guān)于植物資源和食草動物對底層植物物種防御性化學(xué)的影響的研究。
16個5x5米的小區(qū)中的每一個都被隨機(jī)分配到四個實驗之一。1)用柵欄圍起來排除食草動物;2)用N-P-K肥料施肥;3)用柵欄和施肥;4)未實驗的對照。然后,16塊地中的每一塊被分成兩塊。每塊地的一側(cè)(隨機(jī)選擇)在20年的研究中持續(xù)接受實驗。每塊地的另一半在頭十年接受實驗,之后讓它恢復(fù)到未實驗的狀態(tài)。這里要分析的數(shù)據(jù)記錄了歐蓍草(Achillea millefolium)中酚類物質(zhì)的濃度(對植物防御化合物的粗略測量),歐蓍草是地塊中常見的草本植物。測量單位是每克干重毫克丹寧酸當(dāng)量。
可視化數(shù)據(jù)
從文件中讀取數(shù)據(jù)。
檢查前幾行的數(shù)據(jù)。實驗是作為一個有四個層次的單一變量給出的(而不是作為兩個變量,圍墻和肥料,用2x2因子設(shè)計的模型)。持續(xù)時間表示半塊土地是否接受了整整20年的實驗,或者是否在10年后停止實驗。變量 "ch "是蓍草中酚類物質(zhì)的濃度。
畫一張圖來說明不同實驗和持續(xù)時間類別中蓍草中的酚類物質(zhì)的濃度。在每個實驗和持續(xù)時間水平的組合中沒有很多數(shù)據(jù)點,所以按組畫條形圖可能比按組畫箱形圖更好。
添加線段來連接成對的點。
擬合一個線性混合效應(yīng)模型
使用的是什么類型的實驗設(shè)計?*這將決定對數(shù)據(jù)的線性混合模型的擬合。
在沒有實驗和持續(xù)時間之間的交互作用的情況下,對數(shù)據(jù)進(jìn)行線性混合模型擬合。使用酚類物質(zhì)的對數(shù)作為因變量,因為對數(shù)轉(zhuǎn)換改善了數(shù)據(jù)與線性模型假設(shè)的擬合。
可視化模型對數(shù)據(jù)的擬合。按持續(xù)時間(如果xvar是實驗)或?qū)嶒灒ㄈ绻鹸var是持續(xù)時間)分開面板。visreg()不會保留配對,但會允許你檢查殘差。
現(xiàn)在重復(fù)模型擬合,但這次包括實驗和持續(xù)時間之間的相互作用。將模型與數(shù)據(jù)的擬合情況可視化。兩個模型擬合之間最明顯的區(qū)別是什么,一個有交互作用,另一個沒有?描述包括交互項的模型 "允許 "什么,而沒有交互項的模型則不允許。判斷,哪個模型最適合數(shù)據(jù)?
使用診斷圖檢查包括交互項的模型的線性混合模型的一個關(guān)鍵假設(shè)。
使用擬合模型對象估計線性模型的參數(shù)(包括交互作用)。請注意,現(xiàn)在固定效應(yīng)表中有許多系數(shù)。
在上一步的輸出中,你會看到 "隨機(jī)效應(yīng) "標(biāo)簽下的 "Std.Dev "的兩個數(shù)量。解釋一下這些數(shù)量指的是什么。
來估計所有固定效應(yīng)組合的模型擬合平均值。
生成固定效應(yīng)的方差分析表。哪些項在統(tǒng)計學(xué)上是顯著的?
默認(rèn)情況下,lmerTest將使用Type 3的平方和來測試模型項,而不是按順序(Type 1)。用類型1來重復(fù)方差分析表。結(jié)果有什么不同嗎?**
*實驗采用了分塊設(shè)計,即整個塊被隨機(jī)分配到不同的實驗,然后將第二種實驗(持續(xù)時間)的不同水平分配到塊的一半。
*應(yīng)該沒有差別,因為設(shè)計是完全平衡的。
分析步驟
閱讀并檢查數(shù)據(jù)。
一個好的策略是對實驗類別進(jìn)行排序,把對照組放在前面。這將使線性模型的輸出更加有用。
#?1.?讀取數(shù)據(jù)#?2.?檢查head(x)
#?3.?分組帶狀圖#?首先,重新排列實驗類別factor(treat,levels=c("cont","exc","fer","bo"))
plot(data?=?x,?y?=?log(phe),?x?=?trea)
#?4.?在多個面板上分別繪制成對的數(shù)據(jù)plot(data?=?x,y?=?log(ach,?x?=?dur,?fill?=?dur,?col?=?dur)
擬合一個線性混合效應(yīng)模型。固定效應(yīng)是 "實驗 "和 "持續(xù)時間",而 "塊"是隨機(jī)效應(yīng)。擬合交互作用時,實驗水平之間的差異大小在持續(xù)時間水平之間會有所不同。
由于隨機(jī)效應(yīng)也存在(塊),系數(shù)表將顯示兩個隨機(jī)變化來源的方差估計。一個是擬合模型的殘差的方差。第二個是(隨機(jī))塊截距之間的方差。
#?2.?擬合混合效應(yīng)模型-無交互作用
#?3.?可視化vis(z)
#?4.?包括交互項和再次視覺化vis(z.int,?overlay?=?TRUE)
#?5.?繪制圖表以檢驗方差齊性(以及正態(tài)性)plot(z)
#?6.?系數(shù)summary(z)
#?8.?模型擬合平均值means(z,?data?=?x)
#?9.?方差分析表anova(z)?# lmerTest中默認(rèn)為3類平方和。
#?10.??改為1類anova(z,?type?=?1)
本文摘選?《?R語言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例?》?,點擊“閱讀原文”獲取全文完整資料。

點擊標(biāo)題查閱往期內(nèi)容
非線性混合效應(yīng) NLME模型對抗哮喘藥物茶堿動力學(xué)研究
生態(tài)學(xué)模擬對廣義線性混合模型GLMM進(jìn)行功率(功效、效能、效力)分析power analysis環(huán)境監(jiān)測數(shù)據(jù)
有限混合模型聚類FMM、廣義線性回歸模型GLM混合應(yīng)用分析威士忌市場和研究專利申請數(shù)據(jù)
如何用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級調(diào)查數(shù)據(jù)R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言建立和可視化混合效應(yīng)模型mixed effect model
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題
基于R語言的lmer混合線性回歸模型
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
R語言分層線性模型案例
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
SPSS中的多層(等級)線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計HLM多層(層次)線性模型模型