漂亮!大咖杰作!中國(guó)學(xué)者Lancet文章展示如何利用回歸方法巧妙探討影響因素
2021年8月27日,中國(guó)中日友好醫(yī)院國(guó)家呼吸內(nèi)科中心曹彬教授聯(lián)合首都醫(yī)科大學(xué)等研究人員在國(guó)際頂級(jí)期刊《柳葉刀》上在線發(fā)表了題為" 1-year outcomes in hospital survivors with COVID-19:a longitudinal cohort study "的研究論文。

曹彬教授,是2021年的中國(guó)工程院院士候選人(第一輪)。這兩年以來(lái),圍繞著新冠肺炎防治方面開(kāi)展了一系列卓有成效的工作。
這篇《柳葉刀》正刊發(fā)表了一項(xiàng)我國(guó)學(xué)者進(jìn)行的最大規(guī)模新冠后遺癥研究。該研究追蹤了1276名從武漢金銀潭醫(yī)院出院的新冠患者康復(fù)情況。結(jié)果顯示,新冠出院患者1年后健康狀況相比出院6個(gè)月時(shí)有明顯改善,但仍未恢復(fù)至基線健康水平。
該研究對(duì)2020 年 1 月 7 日至 5 月 29 日期間從金銀潭醫(yī)院出院的 COVID-19 幸存者進(jìn)行了一項(xiàng)雙向隊(duì)列研究。在 6 個(gè)月和 12 個(gè)月的隨訪中,幸存者接受了有關(guān)癥狀和健康相關(guān)生活質(zhì)量 (HRQoL) 的問(wèn)卷調(diào)查,并接受了體檢、6 分鐘步行測(cè)試和實(shí)驗(yàn)室測(cè)試。他們被要求在出院后報(bào)告他們的醫(yī)療保健使用情況,并在 12 個(gè)月的訪問(wèn)中報(bào)告他們的工作狀態(tài)。主要結(jié)果是癥狀、改良的英國(guó)醫(yī)學(xué)研究委員會(huì) (mMRC) 評(píng)分、HRQoL 和 6 分鐘步行距離 (6MWD)。多變量調(diào)整logistic回歸模型用于評(píng)估 12 個(gè)月結(jié)果的危險(xiǎn)因素。
研究結(jié)果顯示,至少還有一種后遺癥癥狀的人群比例從6個(gè)月時(shí)的68%,下降到12個(gè)月時(shí)的49%;疲勞或肌肉無(wú)力是最常見(jiàn)報(bào)告的癥狀,從 6個(gè)月時(shí)的52%下降到 12 個(gè)月時(shí)的20%。不過(guò),疲勞或肌肉無(wú)力、睡眠困難、脫發(fā)、嗅覺(jué)障礙和味覺(jué)障礙等癥狀均隨著時(shí)間推移顯著消退。
1、疲勞或肌肉無(wú)力:6個(gè)月時(shí)52%→12個(gè)月時(shí)20%。
2、睡眠障礙:6個(gè)月時(shí)27%→12個(gè)月時(shí)17%;
3、脫發(fā):6個(gè)月時(shí)22%→12個(gè)月時(shí)11%;
4、嗅覺(jué)失靈:6個(gè)月時(shí)11%→12個(gè)月時(shí)4%
5、心悸、關(guān)節(jié)疼痛的比例則沒(méi)有明顯變化。
因此,大多數(shù) COVID-19 幸存者在 1 年的隨訪期間身體和功能恢復(fù)良好,并恢復(fù)了原來(lái)的工作和生活。但總體上該研究的 COVID-19 幸存者隊(duì)列在 12 個(gè)月時(shí)的健康狀況仍低于對(duì)照組。
劃重點(diǎn):如何利用回歸開(kāi)展新冠患者預(yù)后的影響因素?
針對(duì)疲勞或肌肉無(wú)力、焦慮或抑郁、彌散功能障礙三個(gè)結(jié)局指標(biāo),作者開(kāi)展了影響因素研究。本文重點(diǎn)就是學(xué)習(xí)這篇文章如何開(kāi)展影響因素分析。我發(fā)現(xiàn)這篇文章的影響研究非常非常值得我們來(lái)借鑒!
為了學(xué)習(xí)這個(gè)文章的思路,首先要明確它的結(jié)局和暴露因素。
Outcome:它的結(jié)局是疲勞或肌肉無(wú)力、焦慮或抑郁、彌散功能障礙三個(gè),是分類(lèi)變量的結(jié)局:疲勞或肌肉無(wú)力(是/否)、焦慮或抑郁(是/否)、彌散功能障礙(是/否)
Expoure暴露因素:這是個(gè)隊(duì)列研究,但它同時(shí)聚焦了多個(gè)影響因素。這些影響包括age, sex, cigarette smoking, education, comorbidity, corticosteroids, antivirals, and intravenous immunoglobulin、disease severity 。數(shù)量也不多。
問(wèn)題1:結(jié)局是二分類(lèi)的變量,用什么回歸?
答:logistic回歸

問(wèn)題2:開(kāi)展影響因素是否需要“先單后多”
這是非常值得聊一聊的話題,現(xiàn)在很多人在開(kāi)展影響因素的時(shí)候,采取的策略是先單因素分析,再將單因素分析P值較小者納入到多因素回歸模型。其實(shí)我是不推薦的,我在之前的文章已經(jīng)寫(xiě)過(guò):
回歸分析時(shí),一定要單因素回歸P<0.05的自變量納入多因素回歸嗎?
答案:不一定,在自變量個(gè)數(shù)較少的時(shí)候,可以全部自變量納入多因素回歸模型
問(wèn)題3:這篇文章是全部自變量納入多因素回歸分析嗎?
答案:嘿嘿,又不是的!
啥?你鄭老師是耍我么?怎么又不是所有變量納入分析了?
我在之前文中說(shuō)過(guò),構(gòu)建回歸模型要“嚴(yán)進(jìn)嚴(yán)納”:嚴(yán)進(jìn)嚴(yán)納的方法基本理念是,即在納入自變量的時(shí)候需要嚴(yán)格納入,在排除自變量的時(shí)候,沒(méi)有多大意義的別放在最終模型中來(lái)。
嚴(yán)進(jìn):合理的挑選自變量納入多因素回歸模型
嚴(yán)納:少留變量在最終模型,多淘汰一些變量出
開(kāi)展回歸,(1)要考慮那些理論上具有因果關(guān)系的變量和潛在混雜變量納入到回歸模型中,嚴(yán)格限制無(wú)關(guān)變量、中介變量進(jìn)入統(tǒng)計(jì)模型。(2)在上述限制條件下,當(dāng)樣本量足夠大,自變量不多時(shí)候,可以不必按照“先單后多”原則,可一次性納入所有符合上述條件的變量進(jìn)入。
所以剛才講的所有變量納入模型,是第(2)步,但第(1)步要選篩選變量,特別是要區(qū)分哪些是目標(biāo)暴露因素,哪些是混雜因素,哪些是中介變量。
有句話在回歸分析一般要記?。?strong>混雜因素一定要納入,中介變量一般不納入。這篇文章就是這么干的。
(1)首先討論的暴露因素是疾病嚴(yán)重程度(disease severity),對(duì)于這個(gè)變量而言,年齡、性別、吸煙狀態(tài)、教育程度、并發(fā)癥、皮質(zhì)類(lèi)固醇、抗病毒治療、靜脈注射免疫球蛋白是潛在混雜變量,所以回歸分析的時(shí)候都一同納入。

(2)如果要分析教育和吸煙程度與結(jié)局的關(guān)系,那么并發(fā)癥、疾病嚴(yán)重程度不能放了,因?yàn)樗鼈兛赡苁侵薪樽兞俊?
When exploring the associations of education and smoking with outcome, the aforementioned variables except for comorbidity, and both comorbidity and disease severity?(due to the potential mediation)?were included, respectively?
(3)如果要分析年齡和結(jié)局的關(guān)系,那么只有性別、吸煙狀態(tài)、教育程度能放了,因?yàn)槠渌兞靠赡苁侵薪樽兞俊?

(4)如果要分析并發(fā)癥和結(jié)局的關(guān)系,那么疾病嚴(yán)重程度不能放了,因?yàn)樗鼈兛赡苁侵薪樽兞俊?

所以,開(kāi)展回歸分析,在考慮是否先單后多的策略前,要考慮哪些是目標(biāo)暴露因素,哪些是混雜因素(包括潛在),那么些中介變量。特別注意,中介變量不好納入。
我強(qiáng)烈建議,開(kāi)展回歸分析之前,好好考慮變量之間的關(guān)系網(wǎng)絡(luò),推薦繪制有向無(wú)環(huán)圖(DAG)來(lái)描述因果關(guān)系。

詳情請(qǐng)點(diǎn)擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650389085&idx=1&sn=6a0012c2f51649f912dd05ebbcc3cda9&chksm=8351c7f5b4264ee365bd1ba52f6fd33e57aa820bec71dd5aa54aaac95f137c76bf2866b3a356&scene=21#wechat_redirect
