科研論文:這4個統(tǒng)計(jì)錯誤,你需要絕對避免
用來確定變量間的關(guān)系、評估研究問題效度。說得再細(xì)點(diǎn),生物統(tǒng)計(jì)學(xué)主要用來解決生物醫(yī)學(xué)中的問題,它包含統(tǒng)計(jì)、概率、數(shù)學(xué)、計(jì)算等多個元素。

把生物統(tǒng)計(jì)運(yùn)用到研究中,可以測試新藥、尋找病因、估算患者的壽命、統(tǒng)計(jì)死亡率和發(fā)病率等。
盡管統(tǒng)計(jì)是生物醫(yī)學(xué)研究中的主要工具之一,但它一直或有意或無意地被人濫用,已經(jīng)到了見怪不怪的程度。事實(shí)上,越來越多人表示統(tǒng)計(jì)錯誤是造成拒稿的主要原因之一。
本文先后探究了生物醫(yī)學(xué)研究中濫用統(tǒng)計(jì)數(shù)據(jù)的原因和解決辦法。下面我們先來了解一下造成統(tǒng)計(jì)錯誤的原因。
造成統(tǒng)計(jì)錯誤的原因
一、數(shù)據(jù)呈現(xiàn)不清:通常論文中會提及統(tǒng)計(jì)方法、分析數(shù)據(jù)。不過在呈現(xiàn)數(shù)據(jù)時很容易出現(xiàn)表述上的灰色地帶,讓讀者對研究缺乏全面的了解,歸根結(jié)底是因?yàn)楹芏嗾撐牡慕y(tǒng)計(jì)假設(shè)都沒講清。
在一項(xiàng)樣本為醫(yī)學(xué)院學(xué)生、教職工的橫向調(diào)查中,有 53.87% 的人認(rèn)為統(tǒng)計(jì)學(xué)很難,52.9% 的人說不清 p 值是什么,36.45% 的人對標(biāo)準(zhǔn)差的定義有誤,50.97% 的人無法正確統(tǒng)計(jì)樣本大小。這些數(shù)據(jù)說明研究人員能正確分析數(shù)據(jù)還不夠,還要會正確使用、呈現(xiàn)數(shù)據(jù)。
二、重理論、輕數(shù)據(jù):同行評審?fù)ǔεR床研究的數(shù)據(jù)統(tǒng)計(jì)進(jìn)行嚴(yán)格篩查,但基礎(chǔ)科學(xué)就另當(dāng)別論了?;A(chǔ)科學(xué)涵蓋生物化學(xué)、行為學(xué)、動物模型、細(xì)胞培養(yǎng)等多個領(lǐng)域,這種跨學(xué)科性質(zhì)讓統(tǒng)計(jì)分析更棘手。
通常研究人員會在實(shí)驗(yàn)結(jié)束后才開始著手?jǐn)?shù)據(jù)分析。這種事后分析帶來的真知灼見通常都比較有限。

三、采集數(shù)據(jù)前規(guī)劃不到位:規(guī)劃好每個關(guān)鍵步驟要做的統(tǒng)計(jì)工作非常重要。比如說,確定樣本大小時,老鼠的數(shù)量可能會對研究結(jié)果產(chǎn)生重大影響。由于樣本的體重、身體質(zhì)量等多個變量都可能影響實(shí)驗(yàn)結(jié)果,最好根據(jù)不同變量進(jìn)行樣本容量計(jì)算,然后選擇最大的可行樣本進(jìn)行實(shí)驗(yàn)。
理想情況下,研究人員應(yīng)在數(shù)據(jù)采集之前確定暴露變量和結(jié)果之間的關(guān)系,這能有效避免誤報(bào)。研究人員還應(yīng)該提前定好主要結(jié)果變量、 確認(rèn)是否使用 A、B 對照組、設(shè)置相關(guān)組(測試 A 在患有焦慮癥和抑郁癥的樣本身上的變量效應(yīng))。
四、數(shù)據(jù)采集和統(tǒng)計(jì)分析中出現(xiàn)偏差:同樣的,研究人員在設(shè)計(jì)實(shí)驗(yàn)時也要注意對照組(條件)、隨機(jī)性、盲法實(shí)驗(yàn)、可重復(fù)性。隨機(jī)的大容量樣本能避免偏差和誤導(dǎo)。比如說,假如有人想測試藥物 A 對動物體重、心率、身體質(zhì)量的影響,通常會有研究人員把它切分成三個單獨(dú)的實(shí)驗(yàn)。
但這種做法容易產(chǎn)生偏差。相反,當(dāng)對照組和實(shí)驗(yàn)組樣本數(shù)夠大,且采取隨機(jī)抽樣時,用一個實(shí)驗(yàn)就可以監(jiān)測心率、體重、身體質(zhì)量三種變量。
事后分析法缺少事前合理的因果論證,它不是為了驗(yàn)證某個特定的假設(shè),而是反過來通過多項(xiàng)分析試圖找出某種潛在關(guān)系。這種情況下,就很容易出現(xiàn)在數(shù)據(jù)中硬找關(guān)聯(lián)的“釣魚”研究。
所以,在說明試驗(yàn)方法和原理時,確保統(tǒng)計(jì)部分遵循相關(guān)標(biāo)準(zhǔn),比如國際醫(yī)學(xué)期刊編輯委員會 (International Committee of Medical Journal Editors, ICMJE) 提供的指南。
造成統(tǒng)計(jì)錯誤的原因
一、數(shù)據(jù)呈現(xiàn)不清;
二、重理論、輕數(shù)據(jù);
三、采集數(shù)據(jù)前規(guī)劃不到位;
四、數(shù)據(jù)采集和統(tǒng)計(jì)分析中出現(xiàn)偏差。

統(tǒng)計(jì)錯誤對發(fā)表流程的影響
要想得到準(zhǔn)確的研究結(jié)果,就得正確處理數(shù)據(jù)。而統(tǒng)計(jì)的準(zhǔn)確性對發(fā)表也非常重要。一旦期刊在文章中發(fā)現(xiàn)統(tǒng)計(jì)錯誤,作者可能會面臨大修或被拒稿的決定。很可惜,研究中的統(tǒng)計(jì)錯誤不算罕見。以下是研究中最常見的幾種統(tǒng)計(jì)錯誤:
研究設(shè)計(jì)錯誤。比如沒隨機(jī)抽樣對照組樣本、選擇不合適的對照組。
數(shù)據(jù)分析錯誤。比如缺少配對數(shù)據(jù)、不給出相關(guān)數(shù)據(jù)而直接得出 p 值、沒確認(rèn)線性關(guān)系的情況下直接用回歸分析法。
數(shù)據(jù)呈現(xiàn)錯誤。比如該用標(biāo)準(zhǔn)差用了標(biāo)準(zhǔn)誤差、用餅圖表示連續(xù)變量、沒對多重比較進(jìn)行調(diào)整。
數(shù)據(jù)說明/解釋錯誤。比如把相關(guān)和因果劃等號、做砸的試驗(yàn)硬說是好實(shí)驗(yàn)。
如果統(tǒng)計(jì)錯誤只是由于筆誤,編輯、修改一下稿件就能解決問題。但如果是數(shù)據(jù)分析、呈現(xiàn)和結(jié)果討論中存在技術(shù)問題,文章就很可能要大改。而當(dāng)實(shí)驗(yàn)設(shè)計(jì)出了問題,除了把試驗(yàn)重做一遍沒有別的補(bǔ)救辦法,這種情況下期刊極有可能會選擇拒稿。
如何解決濫用數(shù)據(jù)問題?
在生物醫(yī)學(xué)的前沿領(lǐng)域,數(shù)據(jù)統(tǒng)計(jì)扮演著非常重要的角色。然而,要想研究出新銳科技,研究人員必須有意識地在各個環(huán)節(jié)避免濫用數(shù)據(jù),不管是數(shù)據(jù)的收集、分析,還是呈現(xiàn)。
研究人員應(yīng)該了解數(shù)據(jù)處理的各項(xiàng)規(guī)則并嚴(yán)格遵守。比如 ICMJE 提出的“生物醫(yī)學(xué)期刊投稿的統(tǒng)一要求”(Uniform Requirements for Manuscripts Submitted to Biomedical Journals) 就對統(tǒng)計(jì)方法的應(yīng)用、解釋給出了建議。
此外,研究人員還要了解其他的同類型指南,比如“文獻(xiàn)中的分析與統(tǒng)計(jì)方法” (Statistical Analysis and Methods in the Published Literature, SAMPL) 指南。它將不同的統(tǒng)計(jì)方法分類,依次解說,對試驗(yàn)的設(shè)計(jì)、操作和解釋都有很大指導(dǎo)作用。
多數(shù)情況下,生物醫(yī)學(xué)論文都以統(tǒng)計(jì)數(shù)據(jù)為依據(jù)。因此多數(shù)生物醫(yī)學(xué)期刊,尤其是高影響因子的,像《柳葉刀》《自然》《科學(xué)》《細(xì)胞》《美國醫(yī)學(xué)會期刊》,除了動用編輯和審稿人,還會指派專門的生物統(tǒng)計(jì)學(xué)家評估稿件內(nèi)容。目前有越來越多期刊開始采取這種做法。
必須要說,由于要綜合考慮研究中的多個變量、樣本量、測量結(jié)果等多個因素,總結(jié)數(shù)據(jù)并得出結(jié)論從來都不是件輕松的事。計(jì)算機(jī)和統(tǒng)計(jì)軟件讓解釋、分析數(shù)據(jù)有更多可能,但同時也給錯誤創(chuàng)造了更多空間。

挪威數(shù)學(xué)家、生物統(tǒng)計(jì)學(xué)家、醫(yī)學(xué)研究員、斯塔萬格大學(xué) (University of Stavanger) 健康科學(xué)系副教授 Jo R?islien 說過,“統(tǒng)計(jì)量化了你研究結(jié)果的可信或不可信程度”??傊?,研究人員在開始實(shí)驗(yàn)之前就該自行學(xué)習(xí)統(tǒng)計(jì)方法。只有正確使用統(tǒng)計(jì)這個工具,它才能幫研究人員達(dá)到拓展現(xiàn)有生物醫(yī)學(xué)知識的目的。