R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
原文鏈接:http://tecdat.cn/?p=11724
介紹
本教程對(duì)多層回歸模型進(jìn)行了基本介紹 。??
?
本教程期望:
多層回歸模型的基礎(chǔ)知識(shí) 。
R中編碼的基礎(chǔ)知識(shí)。
安裝R軟件包??
,和??
。?
?
步驟1:設(shè)定?
如果尚未安裝所有下面提到的軟件包,則可以通過命令安裝它們??。
受歡迎程度數(shù)據(jù)集包含不同班級(jí)學(xué)生的特征。本教程的主要目的是找到模型和檢驗(yàn)關(guān)于這些特征與學(xué)生受歡迎程度(根據(jù)其同學(xué))之間的關(guān)系的假設(shè)。 我們將使用.sav文件,該文件可以在SPSS文件夾中找到。將數(shù)據(jù)下載到工作目錄后,可以使用?命令將其打開? 。
GitHub是一個(gè)平臺(tái),允許研究人員和開發(fā)人員共享代碼,軟件和研究成果,并在項(xiàng)目上進(jìn)行協(xié)作。
步驟2:數(shù)據(jù)清理
數(shù)據(jù)集中有一些我們不使用的變量,因此我們可以選擇將要使用的變量,并查看前幾個(gè)觀察值。
步驟3:繪制數(shù)據(jù)
在開始分析之前,我們可以繪制外向性和受歡迎程度之間的關(guān)系,而無需考慮數(shù)據(jù)的多層結(jié)構(gòu)。

現(xiàn)在我們可以向該圖添加回歸線。

到目前為止,我們已經(jīng)忽略了數(shù)據(jù)的嵌套多層結(jié)構(gòu)。我們可以通過對(duì)不同類進(jìn)行顏色編碼來顯示這種多層結(jié)構(gòu)。

現(xiàn)在我們可以為數(shù)據(jù)中的100個(gè)不同類別繪制不同的回歸線

我們清楚地看到,外向性和受歡迎程度之間的關(guān)系在所有層級(jí)中并不相同,但平均而言,存在明顯的正向關(guān)系。在本教程中,我們將顯示這些不同斜率的估計(jì)值(以及如何解釋這些差異)。?
我們還可以對(duì)最極端的回歸線進(jìn)行顏色編碼。
人氣數(shù)據(jù):

?
步驟4:分析數(shù)據(jù)
截距模型
我們第一個(gè)模型是截距模型。
如果我們查看LMER函數(shù)的不同輸入,則:
?“受歡迎程度”,表示我們要預(yù)測(cè)的因變量。
一個(gè)“?”,用于表示我們現(xiàn)在給出了其他感興趣的變量。(與回歸方程式的'='相比)。
公式中表示截距的“ 1”。
由于這是僅截距模式,因此我們?cè)谶@里沒有任何其他自變量。
在方括號(hào)之間,我們具有隨機(jī)效果/斜率。同樣,值1表示垂直“ |”的截距和變量右側(cè) 條用于指示分組變量。在這種情況下,類ID。因此,因變量“受歡迎程度”是由截距和該截距的隨機(jī)誤差項(xiàng)預(yù)測(cè)的。
最后,我們?cè)?code class="">?命令后指定要使用的數(shù)據(jù)集?
?
如果查看匯總輸出,則在“隨機(jī)效應(yīng)”下可以看到,類別層0.7021上的殘差和第一層(學(xué)生層)上的殘差為1.2218。這意味著類內(nèi)相關(guān)性(ICC)為0.7021 /(1.2218 + 0.7021)=.36。
在“固定效果”下,報(bào)告截距的估計(jì)值為5.078。
我們還可以輸出計(jì)算ICC。
一層預(yù)測(cè)變量
現(xiàn)在我們可以首先添加第一層(學(xué)生)水平的預(yù)測(cè)變量。一層預(yù)測(cè)因子是性別和外向性?,F(xiàn)在,我們僅將它們添加為固定效果,而不添加為隨機(jī)斜率。在此之前,我們可以繪制兩種性別在效果上的差異。我們發(fā)現(xiàn)性別之間可能存在平均差異,但斜率(回歸系數(shù))沒有差異。

?
現(xiàn)在的截距為2.14,性別的回歸系數(shù)為1.25,外向回歸系數(shù)為0.44。在輸出的固定效果表的最后一列中,我們看到了P值,這些值表示所有回歸系數(shù)均與0顯著不同。?
一層和二層預(yù)測(cè)變量
現(xiàn)在,我們(除了重要的1層變量)還在第2層(教師經(jīng)驗(yàn))添加了預(yù)測(cè)變量。
結(jié)果表明,層1和層2變量均顯著。但是,我們尚未為任何變量添加隨機(jī)斜率 。
現(xiàn)在,我們還可以與基礎(chǔ)模型相比,計(jì)算出第1層和第2層的解釋方差。
對(duì)于1層,這是(1.2218 – 0.592)/1.2218 = 0.52
對(duì)于2層,這是(0.7021 – 0.2954)/0.7021 = 0.58
具有隨機(jī)斜率的一層和二層預(yù)測(cè)模型(1)
現(xiàn)在我們還想包括隨機(jī)斜率。第1層的兩個(gè)預(yù)測(cè)變量(性別和外向性)均具有隨機(jī)斜率。要在LMER中完成此操作,只需將隨機(jī)斜率的變量添加到輸入的隨機(jī)部分。????
。
我們可以看到所有固定的回歸斜率仍然很顯著。然而,沒有給出對(duì)隨機(jī)效應(yīng)的顯著性檢驗(yàn),但是,可變性別的斜率的誤差項(xiàng)(方差)估計(jì)很?。?.0024)。這可能意味著類別之間的SEX變量沒有斜率變化,因此可以從下一次分析中刪除隨機(jī)斜率估計(jì)。由于沒有針對(duì)此方差的直接顯著性檢驗(yàn),我們可以使用?軟件包的???函數(shù)??
,提供類似于ANOVA的隨機(jī)效果表。它檢查如果刪除了某種隨機(jī)效應(yīng)(稱為似然比檢驗(yàn)),則模型是否變得明顯更差,如果不是這種情況,則隨機(jī)效應(yīng)不顯著。
我們看到性別的隨機(jī)影響確實(shí)不顯著(P = 0.6792),外向的隨機(jī)影響也很顯著(P <.0001)。
具有隨機(jī)斜率的一層和二層預(yù)測(cè)模型
我們?cè)诤雎孕詣e的隨機(jī)斜率之后繼續(xù)。
我們看到:
截距是0.736
性別的固定影響是1.252
老師經(jīng)驗(yàn)的影響是0.091
外向的平均影響為0.453
外向斜率的隨機(jī)效應(yīng)為0.035
一層殘差為0.552
二層的殘差為1.303
?
具有隨機(jī)斜率和跨水平交互作用的一層和二層預(yù)測(cè)?
作為最后一步,我們可以在教師的經(jīng)驗(yàn)和外向性之間添加跨層的交互作用。換句話說,我們要調(diào)查的是,班上外向與受歡迎程度之間關(guān)系的差異是否可以由該班老師的老師經(jīng)驗(yàn)來解釋。 我們添加了Extraversion和Teacher體驗(yàn)之間的層級(jí)交互項(xiàng)。這意味著我們必須添加TEXP作為EXTRAV系數(shù)的預(yù)測(cè)因子。外向性和教師經(jīng)驗(yàn)之間的跨層級(jí)交互作用可以通過“:”符號(hào)或乘以符號(hào)來創(chuàng)建。
如果將所有這些都以公式形式表示,則得到:
受歡迎程度ij =β0j+β1* genderij +β2j* extraversionij + eij
受歡迎程度ij =β0j+β1* genderij +β2j* extraversionij + eij。
其中β0j=γ00+γ01? experiencej +u0jβ0j=γ00+γ01? experiencej + u0j和β2j=γ20+γ21? experiencej +u2jβ2j=γ20+γ21? experiencej + u2j
合并得到:
?
受歡迎程度ij =γ00+γ10? SEXij +γ20? extraversionij +γ01?經(jīng)驗(yàn)j +γ21? extraversionij ?經(jīng)驗(yàn)j + u2j ? extraversionij + u0j + eij
受歡迎程度ij =γ00+γ10? SEXij +γ20? extraversionij +γ01?經(jīng)驗(yàn)j +γ21? extraij u2j * extraversionij + u0j + eij
交互項(xiàng)用?表示,??
?并估計(jì)為-0.025。
從這些結(jié)果中,我們現(xiàn)在還可以通過使用教師經(jīng)驗(yàn)作為第二層變量來計(jì)算解釋的外向斜率方差:(0.03455-0.005409)/0.03455 = .843。因此,外向斜率回歸系數(shù)的方差的84.3%可以由老師的經(jīng)驗(yàn)來解釋。
外向系數(shù)在受歡迎程度上的截距和斜率均受教師經(jīng)驗(yàn)的影響。一名具有0年經(jīng)驗(yàn)的老師的班級(jí)中,外向得分為0的男學(xué)生(SEX = 0)的預(yù)期受歡迎度為-1.2096。一名類似的(男)學(xué)生,每增加1分外向度,就將獲得0.8036分,以提高其知名度。當(dāng)教師經(jīng)驗(yàn)增加時(shí),每年經(jīng)驗(yàn)的截距也增加0.226。因此,同一個(gè)沒有外向性的男學(xué)生與一個(gè)有15年經(jīng)驗(yàn)的老師一起上課,其預(yù)期受歡迎度得分為-1.2096 +(15 x .226)= 2.1804。教師的經(jīng)驗(yàn)也減輕了外向性對(duì)普及的影響。對(duì)于具有15年經(jīng)驗(yàn)的教師,外向的回歸系數(shù)僅為0.8036 –(15 x .0247)= 0.4331(相比之下,具有0年經(jīng)驗(yàn)的教師班級(jí)為0.8036)。
我們還可以清楚地看到,多年的教師經(jīng)驗(yàn)既影響截距,又影響外向度的回歸系數(shù)。

??
最后
在本教程結(jié)束,我們將檢查模型的殘差是否正態(tài)分布(在兩個(gè)層級(jí)上)。除了殘差是正態(tài)分布的之外,多層模型還假設(shè),對(duì)于不同的隨機(jī)效應(yīng),殘差的方差在組(類)之間是相等的。確實(shí)存在跨組的正態(tài)性和方差相等性的統(tǒng)計(jì)檢驗(yàn)。
首先,我們可以通過比較殘差和擬合項(xiàng)來檢查均方差。

我們還可以使用QQ圖檢查殘差的正態(tài)性。該圖確實(shí)表明殘差是正態(tài)分布的。

?
現(xiàn)在,我們還可以檢查100個(gè)班級(jí)的兩個(gè)隨機(jī)效果。同樣,可以看到符合正態(tài)分布。

?


最受歡迎的見解
1.基于R語言的lmer混合線性回歸模型
2.R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
3.R語言線性混合效應(yīng)模型實(shí)戰(zhàn)案例
4.R語言線性混合效應(yīng)模型實(shí)戰(zhàn)案例2
5.R語言線性混合效應(yīng)模型實(shí)戰(zhàn)案例
6.線性混合效應(yīng)模型Linear Mixed-Effects Models的部分折疊Gibbs采樣
7.R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
8.R語言中基于混合數(shù)據(jù)抽樣(MIDAS)回歸的HAR-RV模型預(yù)測(cè)GDP增長
9.使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM