“病例對照研究”也能發(fā)BMJ雜志?作者用了一幅圖征服了審稿專家

2023年鄭老師多門科研統(tǒng)計課程:多次直播,含孟德爾隨機(jī)化方法? ??

病例對照研究”的文章很難在頂級醫(yī)學(xué)期刊發(fā)表。
病例對照研究是醫(yī)學(xué)研究進(jìn)行病因推斷的重要方法。它在醫(yī)學(xué)研究中,將研究對象分為病例組/ 對照組(更廣泛來說是,陽性組/陰性組) ,比較發(fā)病/陽性事件發(fā)生前接觸某暴露因素的狀況,比較暴露水平的差異性,初步分析暴露因素與陽性事件之間的因果關(guān)系。
比如,歷史上最有名的一個病例對照研究是,英國著名流行病學(xué)家Hill爵士在20世紀(jì)40年代發(fā)起的吸煙與肺癌的研究,他通過比較肺癌患者和非肺癌患者的過去的吸煙狀況,發(fā)現(xiàn)肺癌患者吸煙比例遠(yuǎn)高于正常的人群,因此證明了吸煙(暴露因素)與肺癌(陽性事件)的因果關(guān)系。

但是病例對照研究存在著很多缺陷,導(dǎo)致這類研究的因果推斷結(jié)論不那么可靠。
主要的問題有三點:(1)病例對照研究存在著回憶偏倚? (2)病例對照研究的暴露因素與結(jié)局的發(fā)生時間在順序上可能無法厘清,可能會出現(xiàn)因果顛倒(先發(fā)生結(jié)果,再出現(xiàn)原因) ;(3)暴露因素與結(jié)局的關(guān)系可能存在著干擾因素,很多人把干擾因素直接認(rèn)定為混雜因素,通過回歸分析來控制。但實際上,很多干擾因素可能是中介變量,但病例對照研究很難區(qū)別中介還是混雜。
今天我要說的是12月初發(fā)表在BMJ的雜志的論文,它用一張圖,成功地理清了暴露因素與結(jié)局、暴露因素與干擾因素的關(guān)系,當(dāng)然最終贏得了審稿人的認(rèn)可!
好,進(jìn)入正題吧。

論文的概況與統(tǒng)計方法
四大醫(yī)學(xué)頂級醫(yī)學(xué)期刊之一的BMJ發(fā)表過一篇病例對照研究?:“出生缺陷患者的癌癥風(fēng)險:基于北歐兒童、青少年和成人的病例對照大型研究” 。該研究就是研究“癌癥----出生缺陷”兩個變量的關(guān)系。

為了探討出生缺陷與癌癥發(fā)生之間的聯(lián)系,該研究收集了四個北歐國家、總共62295例癌癥病例和724542例對照樣本的出生缺陷和癌癥診斷信息,以兒童、青少年和成人 (0~46歲) 為研究對象評估出生缺陷與癌癥類型的關(guān)系,癌癥發(fā)生風(fēng)險是否隨出生缺陷的數(shù)量而改變,并評估這些聯(lián)系是否會持續(xù)到成年。
點評:這篇文章能發(fā)表,大樣本量是關(guān)鍵的原因之一。
統(tǒng)計分析方法
對于病例對照研究,logistic回歸是不二選擇,同時計算OR值;由于癌癥發(fā)生率很低,因此這里的OR值幾乎等同于RR值。


論文的分析結(jié)果
(1)癌癥患者的出生缺陷發(fā)生情況
本研究收集了四個北歐國家 (丹麥、芬蘭、挪威和瑞典) 1967至2014年間所有活產(chǎn)兒信息 (出生情況及出生缺陷信息等)、1943年以來的癌癥患者信息 (Table 1)。總研究人數(shù)為62,295例癌癥患者 (其中2160例患有嚴(yán)重出生缺陷,占3.5%),724542例對照樣本 (其中15,826例患有嚴(yán)重出生缺陷,占2.2%)。
摘要:癌癥患者,出生缺陷比例3.5%;對照組,出生缺陷比例2.2%,差別顯著。

(2)出生缺陷患者患癌癥的總體風(fēng)險
與沒有嚴(yán)重出生缺陷的人相比,有嚴(yán)重出生缺陷的人總體患癌風(fēng)險增加 (OR=1.74)。
患有嚴(yán)重出生缺陷的人群中,染色體異?;颊叩幕及╋L(fēng)險最高 (OR=5.53),遺傳綜合征/微缺失綜合征患者 (OR=5.44)、非染色體異常出生缺陷患者的癌癥風(fēng)險也較高 (OR=1.54)。此外,還觀察到患有眼睛、消化系統(tǒng)、泌尿器官、心臟、生殖器和四肢先天缺陷的人患癌癥的風(fēng)險增加。

(3)出生缺陷患者患特定癌癥的風(fēng)險
◆與沒有嚴(yán)重出生缺陷的人相比,非染色體異常出生缺陷的人群患泌尿器官癌 (主要是腎癌,OR=2.7)、周圍神經(jīng)和自主神經(jīng)系統(tǒng)癌 (OR=2.4)、中樞神經(jīng)系統(tǒng)癌 (OR=2.3) 的相對風(fēng)險最高。
◆?染色體異常人群患淋巴組織癌和造血組織癌的風(fēng)險增加,其中急性髓系白血病的風(fēng)險最高 (OR=88)。

那幅圖來了
那么,大家要那幅圖是怎么回事?其實,很多人采用logistic回歸開展病例對照研究,一般是多因素logistic回歸,而且最常見的方法是“先單因素后多因素”---先單因素logistic回歸,將P值<0.2或者P<0.05的挑選出來,和出生缺陷一起開展多因素回歸,探討出生缺陷和癌癥發(fā)生的關(guān)系。logistic回歸分析中,除了缺失缺陷之外,其它的自變量可能是干擾因素,一般我們?nèi)苏J(rèn)為是混雜因素。現(xiàn)在用logistic回歸控制了混雜因素,似乎結(jié)果相對可靠。
對不對?諸位一直以來,可能就是這么干的!

來~~~~來個笑容
實際上,大家很多時候,忽視了一個重要的概念--中介變量,并在回歸中錯誤地把它認(rèn)為是混雜因素,并把它納入回歸分析中。
我在這里想告訴大家,回歸分析時,千萬記住一句話:回歸分析,混雜變量一定要納入模型,中介變量,一般不要納入模型。
在本病例對照研究,干擾因素中,既有干擾因素又有混雜因素。比如:混雜因素包括母親年齡、是否吸煙、是否試管嬰兒;而中介變量,則包括出生體重,早產(chǎn)等。
所以作者也說:我們不把中介變量納入到回歸分析中。

那么問題就來了,如何篩選混雜變量納入模型呢?

詳情請點擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650407241&idx=1&sn=53920405b39a91d8b7d34978a1996f0b&chksm=83527ce1b425f5f7199254d606e65bc4d9eae21c99446346a4aa083eefab0798d008512fe509&token=1814709572&lang=zh_CN#rd
