如何用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)|附
全文下載鏈接:http://tecdat.cn/?p=24647
線性混合模型假設(shè) N 個受試者的群體是同質(zhì)的,并且在群體水平上由獨特的曲線 Xi(t)β 描述 。 最近我們被客戶要求撰寫關(guān)于線性混合模型的研究報告,包括一些圖形和統(tǒng)計輸出。
背景和定義
相比之下,潛在類別混合模型在于假設(shè)人口是異質(zhì)的,并且由 G 潛在類別的受試者組成,其特征是 G 平均軌跡曲線。
潛類別混合模型
潛在類別成員由離散隨機變量 ci 定義,如果主題 i 屬于潛在類別 g (g = 1, …,G),則該變量等于 g。變量 ci 是潛在的;根據(jù)協(xié)變量 Xci 使用多項邏輯模型描述其概率:
其中 ξ0g 是 g 類的截距,ξ1g 是與時間無關(guān)協(xié)變量 Xci 的 q1 向量相關(guān)的類特定參數(shù)的 q1 向量。當(dāng)沒有協(xié)變量預(yù)測潛在類成員資格時,該模型將簡化為特定于類的概率。
后驗分類
在涉及潛在類別的模型中,可以對每個潛在類別中的主體進(jìn)行后驗分類。它基于類成員概率的后驗計算,用于表征對象的分類以及評估模型的擬合優(yōu)度(Proust-Lima et al. 2014 ?).
使用貝葉斯定理計算后類成員概率作為給定收集信息的潛在類的概率。在縱向模型中,它們?yōu)橹黝} ii 和潛在類別 g 定義為:
其中:??θ^G 是 G 潛在類模型中估計的參數(shù)向量。
高斯數(shù)據(jù)示例
在此示例中,我們研究了認(rèn)知標(biāo)記的二次軌跡,即在老年人樣本(納入時年齡 65 歲及以上)中進(jìn)行預(yù)先標(biāo)準(zhǔn)化(具有高斯分布)并對簡易智能量表評分 (?MMSE?)進(jìn)行了長達(dá) 15 年的跟蹤研究,可根據(jù)教育水平進(jìn)行調(diào)整。盡管可以考慮任何回歸,但模型在此處不考慮交互作用。
數(shù)據(jù)集
子樣本
這是來自原始前瞻性研究 的 500 名受試者的子樣本。該數(shù)據(jù)集不能用于流行病學(xué)目的,因為子樣本不代表原始隊列(特別是癡呆病例已被過度采樣)。
用于可視化數(shù)據(jù)(僅限表頭):
head(data)
在不同的時間收集不同的標(biāo)記。在數(shù)據(jù)集中,時間尺度是年齡。
獲取數(shù)據(jù)的快速摘要:
summary(data)
一些變量有缺失值。
簡易智能量表評分結(jié)果
簡易智能量表評分通常被視為結(jié)果。簡易智能量表評分是一種非常常見的神經(jīng)心理學(xué)測試,用于測量老年人的整體認(rèn)知功能。它具有非常不對稱的分布,因此通常將其歸一化以應(yīng)用于高斯變量的方法。預(yù)歸一化函數(shù)完成的:
?hist(?MMSE?)hist(?norm?)
要建模單個重復(fù)測量是:
color?<-ID
xyplot
考慮的模型
我們考慮以下潛在類線性混合模型,其中 g 表示類別,i表示主題,j 表示重復(fù)測量:
其中_:_
?和?
固定效應(yīng)部分?是?
?混合?
?和?
; 在?隨機效應(yīng)部分?是?
,
因變量:歸一化 簡易智能量表評分
由于 簡易智能量表評分的分布非常傾斜,我們使用標(biāo)準(zhǔn)化版本
normMMSE?<-?norm
估計只有一個類的模型 (G=1)
根據(jù)年齡進(jìn)行分析。為了避免任何數(shù)值問題,我們重新調(diào)整和標(biāo)準(zhǔn)化年齡:
?
age65?<-?(age?-?65)/10
我們?yōu)?norm 擬合線性混合模型:
?
lme(norm?~?age65+I(age65^2)+CEP?rand?=~?age65+I(age65^2)?subject?=?'ID'
估計具有多個類的模型 (G > 1)
從通過假設(shè)單個潛在類估計的模型,我們現(xiàn)在可以搜索異構(gòu)概況。下一行提供了使用? G>1 時初始值對 2 個潛在類的模型的估計。
?#考慮到2類的估計lme(ng?=?2,?mix=~age65+I(age65^2))
初始值
初始值在參數(shù)中指定?B
。該選項會?B=m1
?根據(jù) 1 類模型(此處為m1
)的最大似然估計自動生成初始值?。不指定B
?或?不指定?B=NULL
?是不推薦的,因為它會導(dǎo)致 G=1G=1 的模型的內(nèi)部預(yù)估計(即?m1
),這可能會顯著增加計算時間。
點擊標(biāo)題查閱往期內(nèi)容
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
左右滑動查看更多
01
02
03
04
用戶預(yù)先指定的值
在以下示例中,初始值由用戶預(yù)先指定:方差協(xié)方差的參數(shù)取自線性混合模型的估計值,并針對特定于類嘗試任意初始值:
lme(?B?=?c(0,?50,?30,?3,?-1))
隨機生成的值
另一種方法是從 1 類模型的估計值的漸近分布中隨機生成初始值(此處為?m1
):
lme(rand(m1))
網(wǎng)格搜索
最后,grid可用于運行自動網(wǎng)格搜索。在接下來的示例中,G=2 和 G=3 類,?hlme
?從 100 個初始值的隨機向量運行最多 30 次迭代。然后,僅針對在 30 次迭代后提供最佳對數(shù)似然的偏離完成估計程序。
grid(lme?iter=30,)
推薦使用此方法,因為它可以在重復(fù)次數(shù)足夠大且迭代次數(shù)相當(dāng)大時更好地探索參數(shù)空間。
選擇最佳模型
一組模型(通常具有不同數(shù)量的潛在類)的估計過程可以用 來概括?summary
。
summary
我們在這里總結(jié)了我們之前估計的 6 個模型。我們可以看到所有的 2-class 模型都收斂于同一個估計點。
這個例子說明了定義“潛在類的最佳數(shù)量”的復(fù)雜性。事實上,根據(jù)推薦的 BIC,應(yīng)該保留 2 類模型(因為它提供了最低值)。但是 AIC 和 Size 調(diào)整 BIC(涉及較小的懲罰)都支持 3-class 模型。熵也有利于 3 類模型,因為它具有更好的判別能力(熵接近 1)。最后,3-class 模型創(chuàng)建了一個非常小的類,這通常不是那些搜索和感興趣的異質(zhì)性。在這個例子中,根據(jù)統(tǒng)計和臨床標(biāo)準(zhǔn),2-或 3-可以保留類模型。下面,我們保留了最終輸出描述的 2-class 模型。
2-class 線性混合模型的描述
模型概要
?summary(m2d)
模型的預(yù)測
只要模型中指定的所有協(xié)變量都包含在數(shù)據(jù)框中,就可以為數(shù)據(jù)框中包含的任何數(shù)據(jù)計算特定于類的預(yù)測。在接下來的幾行中,通過生成年齡值介于 65 和 95 之間的向量并將 CEP定義為 1 或 0,來創(chuàng)建這樣的數(shù)據(jù)框?。計算和繪制?預(yù)測?。
data.frame(age=seq(65,95,l=50))
在點估計中為每個類計算預(yù)測:
predictY
然后可以繪制預(yù)測:
plot(prd0)plot(prd1,add=TRUE)
如果我們想了解可變性,我們可以計算具有置信區(qū)間的預(yù)測并繪制它們:
plot(IC,,?shades=TRUE)
最后,1 類、2 類和 3 類模型的預(yù)測軌跡可以一起表示在下圖中:
par(mfrow=c(1,3))plot(pr1?)plot(pr0??
plot(pr3)
最終潛在類混合模型的評估
殘差圖
?plot(m)
預(yù)測與觀察的圖表
為了評估所選模型的擬合,我們同時繪制每個潛在類別的觀察值和預(yù)測值。
plot(m,?shad?=?TRUE)
該圖在此處顯示了對數(shù)據(jù)的非常好的擬合。
分類
模型的后驗分類通過以下方式獲得:
postprob(m2d)
Class 1
?由 62 個樣本 (12.4%) 組成,而 438 個樣本屬于第二類。
我們還可以通過以下方式查看有關(guān)模型辨別能力的信息:
后驗分類表:分類在?
class 1
?(resp.??class 2
) 中的對象屬于該類的平均概率為 0.8054 (resp. 0.8730)。這顯示了類別的良好區(qū)分。高于閾值的分類的比例:這里 90.18%(分別為 61.29%)的第 1 類(分別為 2)的后驗概率大于 70%。
本文摘選?《R語言潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)》?,點擊“閱讀原文”獲取全文完整資料。
點擊標(biāo)題查閱往期內(nèi)容
R語言貝葉斯廣義線性混合(多層次/水平/嵌套)模型GLMM、邏輯回歸分析教育留級影響因素數(shù)據(jù)R語言估計多元標(biāo)記的潛過程混合效應(yīng)模型(lcmm)分析心理測試的認(rèn)知過程
R語言因子實驗設(shè)計nlme擬合非線性混合模型分析有機農(nóng)業(yè)施氮水平
R語言非線性混合效應(yīng) NLME模型(固定效應(yīng)&隨機效應(yīng))對抗哮喘藥物茶堿動力學(xué)研究
R語言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度R語言nlme、nlmer、lme4用(非)線性混合模型non-linear mixed model分析藻類數(shù)據(jù)實例
R語言混合線性模型、多層次模型、回歸模型分析學(xué)生平均成績GPA和可視化
R語言線性混合效應(yīng)模型(固定效應(yīng)&隨機效應(yīng))和交互可視化3案例
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級調(diào)查數(shù)據(jù)R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言建立和可視化混合效應(yīng)模型mixed effect model
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題
基于R語言的lmer混合線性回歸模型
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
R語言分層線性模型案例
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
SPSS中的多層(等級)線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計HLM多層(層次)線性模型模型