R語言、SAS潛類別(分類)軌跡模型LCTM分析體重指數(shù) (BMI)數(shù)據(jù)可視化|附代碼數(shù)據(jù)
全文下載鏈接:?http://tecdat.cn/?p=26105?
最近我們被客戶要求撰寫關(guān)于LCTM的研究報告,包括一些圖形和統(tǒng)計輸出。
在本文中,潛類別軌跡建模 (LCTM) 是流行病學(xué)中一種相對較新的方法,用于描述生命過程中的暴露,它將異質(zhì)人群簡化為同質(zhì)模式或類別。然而,對于給定的數(shù)據(jù)集,可以根據(jù)類的數(shù)量、模型結(jié)構(gòu)和軌跡屬性得出不同模型的分?jǐn)?shù)
本文說明了LCTM的基本用法,用于匯總擬合的潛在類軌跡模型對象的輸出。
例子
目的:通過將 BMI 建模為年齡函數(shù),識別具有不同軌跡的參與者亞組。根據(jù)迄今為止可用的文獻(xiàn),我們假設(shè)初始 K=5 類 BMI 軌跡。
我們使用體重指數(shù) (BMI) 重復(fù)測量 10,000 個樣本的長格式數(shù)據(jù)框。
提供了一個示例(模擬)數(shù)據(jù)集?bmi?來描述整個步驟。
包含的變量有:
id - 個人 ID
年齡 - BMI 測量的年齡,以年為單位
bmi - 個人在 T1、T2、T3 和 T4 時間的體重指數(shù),以 kg/m^2 為單位 true_class - 用于識別模擬個人 BMI 數(shù)據(jù)的類別的標(biāo)簽
加載數(shù)據(jù)
繪制數(shù)據(jù)

潛在類軌跡建模的八步示例
為了對縱向結(jié)果 yijk 進(jìn)行建模,對于 k=1:K,類,對于個體 i,在時間點 j,tj可以使用許多建模選擇。我們在這里給出方程來說明這些,并按照復(fù)雜度增加的順序?qū)⑺鼈兠麨槟P?A 到 G。
模型 A:無隨機(jī)效應(yīng)模型 | 固定效應(yīng)同方差 | - 解釋個人軌跡與其平均類軌跡的任何偏差僅是由于隨機(jī)誤差

其中假設(shè)所有類的殘差方差相等,

模型 B:具有特定類別殘差的固定效應(yīng)模型 | 異方差 | 與模型 A 相同的解釋,隨機(jī)誤差在不同的類別中可能更大或更小。

其中假設(shè)殘差方差不同

模型 C:隨機(jī)截距 解釋是允許個體的初始體重不同,但假設(shè)每個班級成員遵循平均軌跡的相同形狀和大小
對于 k=1:K, classes, 對于個體 i, 在時間點 j, tj,

其中隨機(jī)效應(yīng)分布

模型 D:隨機(jī)斜率 允許個體在初始權(quán)重和平均軌跡的斜率上有所不同
對于 k=1:K,類,對于個體 i,在時間點 j?, tj,

其中假設(shè)隨機(jī)效應(yīng)分布為

模型 E:隨機(jī)二次 - 跨類的共同方差結(jié)構(gòu) 允許個體在類內(nèi)通過初始權(quán)重變化,但是假設(shè)每個類具有相同的變異量。對于 k=1:K, 類, 對于個體 i, 在時間點 j, tj,

其中假設(shè)隨機(jī)效應(yīng)分布為?

模型 F 和 G:隨機(jī)二次 - 允許方差結(jié)構(gòu)跨類變化的比例約束 ,增加模型 E 的靈活性,因為允許方差結(jié)構(gòu)相差一個乘法因子,以允許某些類具有更大或更小的類內(nèi)方差。該模型可以被認(rèn)為是模型 G 的更簡潔版本(將要估計的方差-協(xié)方差參數(shù)的數(shù)量從 6xK 參數(shù)減少到 6+(K-1)個參數(shù)。
對于 k=1:K, classes, 對于個體 i, 在時間點 j, tj,

其中假設(shè)隨機(jī)效應(yīng)分布為?

第一步:選擇隨機(jī)效應(yīng)結(jié)構(gòu)的形式
為了確定隨機(jī)效應(yīng)的初始工作模型結(jié)構(gòu),可以遵循 Verbeke 和 Molenbergh 的基本原理來檢查沒有隨機(jī)效應(yīng)的模型中每個 K 類的標(biāo)準(zhǔn)化殘差圖的形狀。
如果殘差輪廓可以近似為平坦、直線或曲線,則分別考慮隨機(jī)截距、斜率或二次項。
為了擬合沒有隨機(jī)效應(yīng)的潛在類模型。
hlmfixed(bmig)


然后,我們將擬合模型輸入 LCTM中的 step1 函數(shù),以檢查特定類別的殘差。
第2步
優(yōu)化步驟 1 中的初步工作模型以確定最佳類數(shù),測試 K=1,...7??梢愿鶕?jù)最低貝葉斯信息標(biāo)準(zhǔn) (BIC) 來選擇所選類別的數(shù)量。
set.seed(100)for?(i?in?2:4)?{
??mi?<-?lchlme(?data.frame(bmg[1:500,])
??
}#>?Be?patient,?hlme?is?running?...?#>?The?program?took?0.29?seconds?#>?Be?patient,?hlme?is?running?...?#>?The?program?took?0.69?seconds?#>?Be?patient,?hlme?is?running?...?#>?The?program?took?2.3?secondsmodelut?<-kable(lin)

第 3 步
使用步驟 2 中推導(dǎo)出的偏好 K 進(jìn)一步細(xì)化模型,測試最優(yōu)模型結(jié)構(gòu)。我們測試了七個模型,從簡單的固定效應(yīng)模型(模型 A)到允許殘差在類別之間變化的基本方法(模型 B)到一組具有不同方差結(jié)構(gòu)的五個隨機(jī)效應(yīng)模型(模型 CG)。
A(SAS、PROC TRAJ)

B型(R,mmlcr)
調(diào)用 source() 命令。
mmldata?=?bmi_l01#?????????????)
#?model_b$BIC
C (SAS、PROC TRAJ)

D 型(SAS、PROC TRAJ)

E型 (R, lcmm)
moe?<-?hlmfixed?=?bmi?~1+?age?+?I(age^2),
???????????mixture?=?~1?+?age?+?I(age^2)
??????????#>?Be?patient,?hlme?is?running?...?#>?The?program?took?0.77?seconds
me$BIC
F型 (R, lcmm)
fixed?=?bmi?~1+?age?+?I(age^2),
???????????mixture?=?~1?+?age?+?I(age^2)
mod$BIC

G (SAS、PROC TRAJ)
第四步
執(zhí)行一些模型充分性評估。首先,對于每個參與者,計算被分配到每個軌跡類的后驗概率,并將個體分配到概率最高的類。在所有類別中,這些最大后驗分配概率 (APPA) 的平均值高于 70% 被認(rèn)為是可以接受的。使用正確分類、不匹配的幾率進(jìn)一步評估模型的充分性。
LCTMdel_f
第 5 步
圖形表示方法;
繪制包含每個類的時間平均軌跡
每個類具有 95% 預(yù)測區(qū)間的平均軌跡圖,顯示每個類內(nèi)預(yù)測的隨機(jī)變化
plotpred?<-?predictY
plototp
個人水平的“面條圖”隨時間變化,取決于樣本量,可能使用參與者的隨機(jī)樣本
ggplot(bm,?aes(x?=?age,?y?=?bmi))?+?geom_line
ggplot(bmong)?+?geom_line
點擊標(biāo)題查閱往期內(nèi)容
R語言用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)
左右滑動查看更多
01
02
03
04

第 6 步
評估模型。
第 7 步
使用四種方法評估臨床特征和合理性;
1.?評估軌跡模式的臨床意義,旨在包括至少 1% 的人群的類別
postprb(?modf?)

2.?評估軌跡類別的臨床合理性
使用生成的圖?來評估預(yù)測的趨勢對于正在研究的組是否現(xiàn)實。例如,對于研究 BMI,顯示下降到 <5 kg/m2 的預(yù)測趨勢是不現(xiàn)實的。?
3.?潛在類別與傳統(tǒng)分類的特征列表
使用從所選模型中提取類分配;
然后用描述性變量反饋到主數(shù)據(jù)集中。
然后可以根據(jù)需要將這些制成表格。
等等。
4.?使用 kappa 統(tǒng)計的類成員與傳統(tǒng) BMI 類別成員的一致性
#?定義BMI類別,這些類別的數(shù)量需要與類別的數(shù)量相等?confusionMatrix(bmi_class,?bmclass
kable(y,?row.names?=?)
第 8 步
酌情進(jìn)行敏感性分析。

本文摘選?《?R語言潛類別(分類)軌跡模型LCTM分析體重指數(shù) (BMI)數(shù)據(jù)可視化?》?,點擊“閱讀原文”獲取全文完整資料。

點擊標(biāo)題查閱往期內(nèi)容
R語言用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)
R語言貝葉斯廣義線性混合(多層次/水平/嵌套)模型GLMM、邏輯回歸分析教育留級影響因素數(shù)據(jù)R語言估計多元標(biāo)記的潛過程混合效應(yīng)模型(lcmm)分析心理測試的認(rèn)知過程
R語言因子實驗設(shè)計nlme擬合非線性混合模型分析有機(jī)農(nóng)業(yè)施氮水平
R語言非線性混合效應(yīng) NLME模型(固定效應(yīng)&隨機(jī)效應(yīng))對抗哮喘藥物茶堿動力學(xué)研究
R語言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度R語言nlme、nlmer、lme4用(非)線性混合模型non-linear mixed model分析藻類數(shù)據(jù)實例
R語言混合線性模型、多層次模型、回歸模型分析學(xué)生平均成績GPA和可視化
R語言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級調(diào)查數(shù)據(jù)R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言建立和可視化混合效應(yīng)模型mixed effect model
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語言 線性混合效應(yīng)模型實戰(zhàn)案例
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題
基于R語言的lmer混合線性回歸模型
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
R語言分層線性模型案例
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語言用WinBUGS 軟件對學(xué)術(shù)能力測驗建立層次(分層)貝葉斯模型
SPSS中的多層(等級)線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計HLM多層(層次)線性模型模型