如何用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)|附
全文下載鏈接:http://tecdat.cn/?p=24647
最近我們被客戶要求撰寫(xiě)關(guān)于LCMM的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
線性混合模型假設(shè) N 個(gè)受試者的群體是同質(zhì)的,并且在群體水平上由獨(dú)特的曲線 Xi(t)β 描述 。
背景和定義
相比之下,潛在類別混合模型在于假設(shè)人口是異質(zhì)的,并且由 G 潛在類別的受試者組成,其特征是 G 平均軌跡曲線。
潛類別混合模型
潛在類別成員由離散隨機(jī)變量 ci 定義,如果主題 i 屬于潛在類別 g (g = 1, …,G),則該變量等于 g。變量 ci 是潛在的;根據(jù)協(xié)變量 Xci 使用多項(xiàng)邏輯模型描述其概率:
其中 ξ0g 是 g 類的截距,ξ1g 是與時(shí)間無(wú)關(guān)協(xié)變量 Xci 的 q1 向量相關(guān)的類特定參數(shù)的 q1 向量。當(dāng)沒(méi)有協(xié)變量預(yù)測(cè)潛在類成員資格時(shí),該模型將簡(jiǎn)化為特定于類的概率。
后驗(yàn)分類
在涉及潛在類別的模型中,可以對(duì)每個(gè)潛在類別中的主體進(jìn)行后驗(yàn)分類。它基于類成員概率的后驗(yàn)計(jì)算,用于表征對(duì)象的分類以及評(píng)估模型的擬合優(yōu)度(Proust-Lima et al. 2014 ?).
使用貝葉斯定理計(jì)算后類成員概率作為給定收集信息的潛在類的概率。在縱向模型中,它們?yōu)橹黝} ii 和潛在類別 g 定義為:
其中:??θ^G 是 G 潛在類模型中估計(jì)的參數(shù)向量。
高斯數(shù)據(jù)示例
在此示例中,我們研究了認(rèn)知標(biāo)記的二次軌跡,即在老年人樣本(納入時(shí)年齡 65 歲及以上)中進(jìn)行預(yù)先標(biāo)準(zhǔn)化(具有高斯分布)并對(duì)簡(jiǎn)易智能量表評(píng)分 (?MMSE?)進(jìn)行了長(zhǎng)達(dá) 15 年的跟蹤研究,可根據(jù)教育水平進(jìn)行調(diào)整。盡管可以考慮任何回歸,但模型在此處不考慮交互作用。
數(shù)據(jù)集
子樣本
這是來(lái)自原始前瞻性研究 的 500 名受試者的子樣本。該數(shù)據(jù)集不能用于流行病學(xué)目的,因?yàn)樽訕颖静淮碓缄?duì)列(特別是癡呆病例已被過(guò)度采樣)。
用于可視化數(shù)據(jù)(僅限表頭):
head(data)
在不同的時(shí)間收集不同的標(biāo)記。在數(shù)據(jù)集中,時(shí)間尺度是年齡。
獲取數(shù)據(jù)的快速摘要:
summary(data)
一些變量有缺失值。
簡(jiǎn)易智能量表評(píng)分結(jié)果
簡(jiǎn)易智能量表評(píng)分通常被視為結(jié)果。簡(jiǎn)易智能量表評(píng)分是一種非常常見(jiàn)的神經(jīng)心理學(xué)測(cè)試,用于測(cè)量老年人的整體認(rèn)知功能。它具有非常不對(duì)稱的分布,因此通常將其歸一化以應(yīng)用于高斯變量的方法。預(yù)歸一化函數(shù)完成的:
?hist(?MMSE?)hist(?norm?)
要建模單個(gè)重復(fù)測(cè)量是:
color?<-ID
xyplot
考慮的模型
我們考慮以下潛在類線性混合模型,其中 g 表示類別,i表示主題,j 表示重復(fù)測(cè)量:
其中_:_
?和?
固定效應(yīng)部分?是?
?混合?
?和?
; 在?隨機(jī)效應(yīng)部分?是?
,
因變量:歸一化 簡(jiǎn)易智能量表評(píng)分
由于 簡(jiǎn)易智能量表評(píng)分的分布非常傾斜,我們使用標(biāo)準(zhǔn)化版本
normMMSE?<-?norm
估計(jì)只有一個(gè)類的模型 (G=1)
根據(jù)年齡進(jìn)行分析。為了避免任何數(shù)值問(wèn)題,我們重新調(diào)整和標(biāo)準(zhǔn)化年齡:
?
age65?<-?(age?-?65)/10
我們?yōu)?norm 擬合線性混合模型:
?
lme(norm?~?age65+I(age65^2)+CEP?rand?=~?age65+I(age65^2)?subject?=?'ID'
估計(jì)具有多個(gè)類的模型 (G > 1)
從通過(guò)假設(shè)單個(gè)潛在類估計(jì)的模型,我們現(xiàn)在可以搜索異構(gòu)概況。下一行提供了使用? G>1 時(shí)初始值對(duì) 2 個(gè)潛在類的模型的估計(jì)。
?#考慮到2類的估計(jì)lme(ng?=?2,?mix=~age65+I(age65^2))
初始值
初始值在參數(shù)中指定?B
。該選項(xiàng)會(huì)?B=m1
?根據(jù) 1 類模型(此處為m1
)的最大似然估計(jì)自動(dòng)生成初始值?。不指定B
?或?不指定?B=NULL
?是不推薦的,因?yàn)樗鼤?huì)導(dǎo)致 G=1G=1 的模型的內(nèi)部預(yù)估計(jì)(即?m1
),這可能會(huì)顯著增加計(jì)算時(shí)間。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語(yǔ)言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
左右滑動(dòng)查看更多
01
02
03
04
用戶預(yù)先指定的值
在以下示例中,初始值由用戶預(yù)先指定:方差協(xié)方差的參數(shù)取自線性混合模型的估計(jì)值,并針對(duì)特定于類嘗試任意初始值:
lme(?B?=?c(0,?50,?30,?3,?-1))
隨機(jī)生成的值
另一種方法是從 1 類模型的估計(jì)值的漸近分布中隨機(jī)生成初始值(此處為?m1
):
lme(rand(m1))
網(wǎng)格搜索
最后,grid可用于運(yùn)行自動(dòng)網(wǎng)格搜索。在接下來(lái)的示例中,G=2 和 G=3 類,?hlme
?從 100 個(gè)初始值的隨機(jī)向量運(yùn)行最多 30 次迭代。然后,僅針對(duì)在 30 次迭代后提供最佳對(duì)數(shù)似然的偏離完成估計(jì)程序。
grid(lme?iter=30,)
推薦使用此方法,因?yàn)樗梢栽谥貜?fù)次數(shù)足夠大且迭代次數(shù)相當(dāng)大時(shí)更好地探索參數(shù)空間。
選擇最佳模型
一組模型(通常具有不同數(shù)量的潛在類)的估計(jì)過(guò)程可以用 來(lái)概括?summary
。
summary
我們?cè)谶@里總結(jié)了我們之前估計(jì)的 6 個(gè)模型。我們可以看到所有的 2-class 模型都收斂于同一個(gè)估計(jì)點(diǎn)。
這個(gè)例子說(shuō)明了定義“潛在類的最佳數(shù)量”的復(fù)雜性。事實(shí)上,根據(jù)推薦的 BIC,應(yīng)該保留 2 類模型(因?yàn)樗峁┝俗畹椭担?。但?AIC 和 Size 調(diào)整 BIC(涉及較小的懲罰)都支持 3-class 模型。熵也有利于 3 類模型,因?yàn)樗哂懈玫呐袆e能力(熵接近 1)。最后,3-class 模型創(chuàng)建了一個(gè)非常小的類,這通常不是那些搜索和感興趣的異質(zhì)性。在這個(gè)例子中,根據(jù)統(tǒng)計(jì)和臨床標(biāo)準(zhǔn),2-或 3-可以保留類模型。下面,我們保留了最終輸出描述的 2-class 模型。
2-class 線性混合模型的描述
模型概要
?summary(m2d)
模型的預(yù)測(cè)
只要模型中指定的所有協(xié)變量都包含在數(shù)據(jù)框中,就可以為數(shù)據(jù)框中包含的任何數(shù)據(jù)計(jì)算特定于類的預(yù)測(cè)。在接下來(lái)的幾行中,通過(guò)生成年齡值介于 65 和 95 之間的向量并將 CEP定義為 1 或 0,來(lái)創(chuàng)建這樣的數(shù)據(jù)框?。計(jì)算和繪制?預(yù)測(cè)?。
data.frame(age=seq(65,95,l=50))
在點(diǎn)估計(jì)中為每個(gè)類計(jì)算預(yù)測(cè):
predictY
然后可以繪制預(yù)測(cè):
plot(prd0)plot(prd1,add=TRUE)
如果我們想了解可變性,我們可以計(jì)算具有置信區(qū)間的預(yù)測(cè)并繪制它們:
plot(IC,,?shades=TRUE)
最后,1 類、2 類和 3 類模型的預(yù)測(cè)軌跡可以一起表示在下圖中:
par(mfrow=c(1,3))plot(pr1?)plot(pr0??
plot(pr3)
最終潛在類混合模型的評(píng)估
殘差圖
?plot(m)
預(yù)測(cè)與觀察的圖表
為了評(píng)估所選模型的擬合,我們同時(shí)繪制每個(gè)潛在類別的觀察值和預(yù)測(cè)值。
plot(m,?shad?=?TRUE)
該圖在此處顯示了對(duì)數(shù)據(jù)的非常好的擬合。
分類
模型的后驗(yàn)分類通過(guò)以下方式獲得:
postprob(m2d)
Class 1
?由 62 個(gè)樣本 (12.4%) 組成,而 438 個(gè)樣本屬于第二類。
我們還可以通過(guò)以下方式查看有關(guān)模型辨別能力的信息:
后驗(yàn)分類表:分類在?
class 1
?(resp.??class 2
) 中的對(duì)象屬于該類的平均概率為 0.8054 (resp. 0.8730)。這顯示了類別的良好區(qū)分。高于閾值的分類的比例:這里 90.18%(分別為 61.29%)的第 1 類(分別為 2)的后驗(yàn)概率大于 70%。
本文摘選?《R語(yǔ)言潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)》?,點(diǎn)擊“閱讀原文”獲取全文完整資料。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語(yǔ)言貝葉斯廣義線性混合(多層次/水平/嵌套)模型GLMM、邏輯回歸分析教育留級(jí)影響因素?cái)?shù)據(jù)R語(yǔ)言估計(jì)多元標(biāo)記的潛過(guò)程混合效應(yīng)模型(lcmm)分析心理測(cè)試的認(rèn)知過(guò)程
R語(yǔ)言因子實(shí)驗(yàn)設(shè)計(jì)nlme擬合非線性混合模型分析有機(jī)農(nóng)業(yè)施氮水平
R語(yǔ)言非線性混合效應(yīng) NLME模型(固定效應(yīng)&隨機(jī)效應(yīng))對(duì)抗哮喘藥物茶堿動(dòng)力學(xué)研究
R語(yǔ)言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系
R語(yǔ)言LME4混合效應(yīng)模型研究教師的受歡迎程度R語(yǔ)言nlme、nlmer、lme4用(非)線性混合模型non-linear mixed model分析藻類數(shù)據(jù)實(shí)例
R語(yǔ)言混合線性模型、多層次模型、回歸模型分析學(xué)生平均成績(jī)GPA和可視化
R語(yǔ)言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例
R語(yǔ)言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)R語(yǔ)言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語(yǔ)言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語(yǔ)言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語(yǔ)言建立和可視化混合效應(yīng)模型mixed effect model
R語(yǔ)言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語(yǔ)言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語(yǔ)言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語(yǔ)言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語(yǔ)言如何解決線性混合模型中畸形擬合(Singular fit)的問(wèn)題
基于R語(yǔ)言的lmer混合線性回歸模型
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
R語(yǔ)言分層線性模型案例
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語(yǔ)言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
SPSS中的多層(等級(jí))線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計(jì)HLM多層(層次)線性模型模型