多因素回歸要不要做逐步回歸法? 美國(guó)top雜志《內(nèi)科學(xué)年鑒》給出答案
內(nèi)科學(xué)年鑒(Annals of Internal Medicine)的統(tǒng)計(jì)分析指南(二)
美國(guó)醫(yī)師協(xié)會(huì)的雜志Ann?Intern?Med(影響因子17.0左右)是醫(yī)學(xué)界十分具有影響力的期刊。它里面有一份詳細(xì)的投稿論文的統(tǒng)計(jì)學(xué)要求,我認(rèn)為很多的東西是我們國(guó)內(nèi)雜志社應(yīng)該學(xué)習(xí)的,特翻譯過(guò)來(lái)并進(jìn)行解讀。
我將分為4篇推文說(shuō)明內(nèi)科學(xué)年鑒的統(tǒng)計(jì)學(xué)要求。
第1篇??結(jié)果報(bào)告應(yīng)注意的細(xì)節(jié)
第2篇? 回歸統(tǒng)計(jì)分析方法和效應(yīng)評(píng)估
第3篇??缺失、混雜和P值
第4篇??Meta分析
有興趣的朋友們可以一起學(xué)習(xí)和感悟!
第2篇??回歸統(tǒng)計(jì)分析方法和效應(yīng)評(píng)估
1. 多因素回歸
1.1 自變量篩選
關(guān)于自變量篩選,Ann?Intern?Med說(shuō),自變量篩選不推薦基于單因素回歸,挑選"statistically significant"的自變量。很多混雜因素,雖然P值>0.05,但是對(duì)于我們感興趣的目標(biāo)變量的效應(yīng)有干擾,或者很多因素只在另外因素存在的時(shí)候會(huì)變成混雜因素。
鄭老師:自變量篩選方面,最好不是數(shù)據(jù)驅(qū)動(dòng)法,無(wú)論P(yáng)值<0.05,還是<0.2,納入多因素回歸,都是一種懶人的做法。
1.2 逐步回歸法?
這是諸位比較關(guān)心的事情。Ann Intern Med明確說(shuō):Authors should avoid stepwise methods of model building, except for the narrow application of hypothesis generation for subsequent studies. Stepwise methods include forward, backward, or combined procedures for the inclusion and exclusion of variables in a statistical model based on predetermined?P?value criteria. 這段英文翻譯過(guò)來(lái)就是應(yīng)該避免使用逐步回歸方法進(jìn)行多因素回歸。
鄭老師:本人在11月17日舉行的“2019年杭州真實(shí)世界研究培訓(xùn)班”也明確指出,先單因素后多因素+逐步回歸的方法是一種垃圾方法,不推薦。推薦使用DAG的方法和效應(yīng)改變方法,具體可以后續(xù)關(guān)注本培訓(xùn)班的視頻。
劃重點(diǎn)來(lái)了?。?!中山大學(xué)方積乾對(duì)此的意見(jiàn)是:回歸分析目的很多,主要包括研究影響因素、預(yù)測(cè)結(jié)局;如果控制混雜、探討影響因素,那么不推薦逐步回歸法;但如果回歸用于構(gòu)建預(yù)測(cè)模型,那么逐步回歸法仍然是一種好方法。
1.3 回歸分析表格
Ann Intern Med認(rèn)為,很多人在論文內(nèi)容中提供了單因素回歸分析的結(jié)果,那其實(shí)沒(méi)有必要的!如果存在著混雜因素,那么單因素結(jié)果只是中間見(jiàn)過(guò),在討論和結(jié)論中沒(méi)有太大價(jià)值,純粹增加篇幅!
鄭老師:我們很多中文論文就是放了單因素和多因素兩個(gè)結(jié)果,實(shí)在沒(méi)有必要!
2. 縱向隨訪(fǎng)分析
縱向隨訪(fǎng)分析主要基于多時(shí)間點(diǎn)隨訪(fǎng)數(shù)據(jù)開(kāi)展回歸分析,常見(jiàn)的是重復(fù)測(cè)量方差分析、混合效應(yīng)模型等。對(duì)此,Ann Intern Med也有話(huà)要說(shuō)。
1.1 對(duì)于縱向研究,我們可以匯報(bào)同組不同時(shí)間、同時(shí)不同組、以及總體上不同組效應(yīng)的差異、也可以構(gòu)建模型控制協(xié)變量。
1.2 縱向研究可以采用重復(fù)測(cè)量方差分析或者廣義估計(jì)方程(generalized estimating equations [GEEs])
1.3 另外一種方法,便是混合效應(yīng)模型,或者說(shuō)隨機(jī)系數(shù)模型
1.4 縱向研究容易存在著數(shù)據(jù)缺失,因此在建模過(guò)程中,必須考慮數(shù)據(jù)缺失問(wèn)題,是隨機(jī)缺失還是非隨機(jī)缺失。在GEE模型中,缺失必須必須是完全隨機(jī)的,而隨機(jī)系數(shù)模型,缺失可以針對(duì)已觀(guān)察的數(shù)據(jù)是隨機(jī)的,但針對(duì)未 觀(guān)察的數(shù)據(jù)是不隨機(jī)的
3. 關(guān)于效應(yīng)指標(biāo)報(bào)告
3.1 論文應(yīng)該報(bào)告具有臨床意義的結(jié)局指標(biāo),比如OR、RR、RD等。Ann Intern Med統(tǒng)計(jì)指南指出,不建議報(bào)告1個(gè)單位改變所有引起的OR值或RR等,因?yàn)檫@樣沒(méi)有實(shí)際意義(比如年齡每改變一歲引起的OR值變化或者血壓每改變一個(gè)單位引起的變化、BMI指數(shù)沒(méi)改變一個(gè)單位引起的變化)。
鄭老師:這是什么意思?我們構(gòu)建回歸分析的時(shí)候,效應(yīng)值也就是回歸系數(shù)或者EXP(b)反應(yīng)的是自變量每增加一個(gè)單位,應(yīng)變量改變的量。如果自變量是連續(xù)性的定量數(shù)據(jù),得到的OR值或者RR值就是改變一個(gè)點(diǎn)位得到的結(jié)果。這樣的結(jié)果沒(méi)有意義,比如年齡增加一歲,OR值為1.005,沒(méi)有太大的臨床意義!建議的做法是,將年齡轉(zhuǎn)為等級(jí)數(shù)據(jù)進(jìn)行分析并開(kāi)展趨勢(shì)性檢驗(yàn)。
3.2 效應(yīng)指標(biāo)都要需要同時(shí)提供置信區(qū)間。
3.3 效應(yīng)指標(biāo)更關(guān)注組間的比較結(jié)果,而不是組內(nèi)。一般建議提供組間差異性結(jié)果,比如均屬差值或者率的差值,以及置信區(qū)間!結(jié)果討論建議從差值角度討論而不是從P值是否小于0.05的角度。
3.4 OR值的結(jié)果解釋
很多時(shí)候,我們用logistic回歸分析產(chǎn)生的Odds ratios(OR)值來(lái)反應(yīng) 研究因素的效應(yīng),但是不容易解釋。Ann Intern Med說(shuō)不容易解釋的原因是我們需要知道的:
第一,當(dāng)對(duì)照組的的陽(yáng)性事件發(fā)生率比較高時(shí),我們一般會(huì)高估研究因素的效應(yīng)。比如當(dāng)然對(duì)照組發(fā)生率為25%的時(shí)候,我們計(jì)算出來(lái)OR值為3.0,而實(shí)際上用于準(zhǔn)確估計(jì)效應(yīng)值的RR值不過(guò)是2.0;暴露組的發(fā)生率將是對(duì)照組3倍的說(shuō)法是不對(duì)的。
第二,讀者很多時(shí)候更喜歡用風(fēng)險(xiǎn)增加的倍數(shù)來(lái)反應(yīng)效應(yīng)值,因此OR值就會(huì)帶來(lái)不容易解釋的局面。
因此,Ann?Intern Med建議提供一個(gè)預(yù)期概率和置信區(qū)間(?predicted probabilities and confidence bounds)來(lái)反應(yīng)OR值帶來(lái)的信息。
3.5 HR值的結(jié)果報(bào)告
生存分析中,hazard ratios(HR)也是非常重要的結(jié)果。HR值從COX回歸分析結(jié)果得到,可以反應(yīng)干預(yù)因素或者暴露因素的效應(yīng)。但這個(gè)結(jié)果也不容易解釋?zhuān)碗S訪(fǎng)時(shí)間長(zhǎng)短有關(guān)系,而且必須要要求COX回歸符合等比例的的假設(shè)要求。因此這個(gè)結(jié)果往往也有誤導(dǎo)性。Ann?Intern Med建議提供給累計(jì)生存曲線(xiàn),也就是Kaplan-Meier曲線(xiàn)結(jié)合不同時(shí)期的生存人數(shù)表來(lái)反應(yīng)生存時(shí)間變化,如果存在著混雜因素,建議提供調(diào)整混雜因素后的生存曲線(xiàn)。
本篇就到此結(jié)束,歡迎繼續(xù)關(guān)注!

詳情請(qǐng)點(diǎn)擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650387041&idx=1&sn=0bfdcc8240ecdc594420f451ea9de07b&chksm=8351cfc9b42646df01f5f31d99d838d65d3d16c0a6e68d7ed06f2b08e604c0dc033cb0cc8d18&scene=21#wechat_redirect
