最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

小衛(wèi)智庫(kù) | 對(duì)于P值問(wèn)題,你怎么看?

2022-02-22 13:34 作者:衛(wèi)燦公衛(wèi)研習(xí)社  | 我要投稿


對(duì)于公衛(wèi)人來(lái)說(shuō),在統(tǒng)計(jì)學(xué)的殿堂中,P值是神圣的,有著超乎尋常的地位。然而,P值總是給我們的實(shí)驗(yàn)和數(shù)據(jù)分析帶來(lái)一些意想不到的結(jié)果,或好或壞,令人深受P值的荼毒。

那么,我們今天就來(lái)探討一項(xiàng)近幾年來(lái)在學(xué)術(shù)界引起的爭(zhēng)議問(wèn)題——P值以及P值該不該廢?


首先,和大家說(shuō)一下,P值是什么?


P值是什么

P值是用來(lái)判定假設(shè)檢驗(yàn)結(jié)果的一個(gè)依據(jù),根據(jù)不同的分布類(lèi)型使用分布的拒絕域來(lái)比較P值與檢驗(yàn)水準(zhǔn)的大小以做出對(duì)應(yīng)的推斷結(jié)論。


P值的意義

P值(P value)就是當(dāng)原假設(shè)為真時(shí),所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。


如果P值很小,說(shuō)明原假設(shè)情況的發(fā)生的概率很小,那么一旦出現(xiàn)了原假設(shè)的結(jié)果,根據(jù)小概率原理,我們就有理由拒絕原假設(shè)。P值越小,我們拒絕原假設(shè)的理由越充分。總之,P值越小,只能越有理由拒絕原假設(shè)。


但是檢驗(yàn)的結(jié)果究竟是“顯著的”、“中度顯著的”還是“高度顯著的”需要我們自己根據(jù)P值的大小和實(shí)際問(wèn)題來(lái)判斷。


P值與Ⅰ類(lèi)錯(cuò)誤的關(guān)系

說(shuō)到P值,我們就會(huì)想到Ⅰ類(lèi)錯(cuò)誤。在我們統(tǒng)計(jì)課本的學(xué)習(xí)中,我們認(rèn)為P值和Ⅰ類(lèi)錯(cuò)誤是等價(jià)的。但是在實(shí)際的應(yīng)用中,這種誤解會(huì)極大地影響研究的可重復(fù)性、醫(yī)療實(shí)踐中的治療選擇和實(shí)證分析中的模型規(guī)范[1]。


P值哪里存在爭(zhēng)議(缺點(diǎn))


眾所周知的,P值是統(tǒng)計(jì)有效性的“黃金標(biāo)準(zhǔn)”。在計(jì)算機(jī)時(shí)代,即使是復(fù)雜的統(tǒng)計(jì),P值也很容易計(jì)算,P值的范圍在0-1之間,并且可以被人們直接的理解;大多數(shù)受過(guò)統(tǒng)計(jì)學(xué)訓(xùn)練的人可能都同意:P值低表示可能有(統(tǒng)計(jì)學(xué))意義,而當(dāng)P值較高時(shí),這一點(diǎn)就不那么明顯了。


低P值通常出現(xiàn)在一些臨床研究出版物的結(jié)果中;這些文章經(jīng)常對(duì)P值進(jìn)行重復(fù)的評(píng)價(jià),P值的含義幾乎普遍被曲解,很多學(xué)者認(rèn)為僅僅通過(guò)P值得出的結(jié)論是不可靠的,而且會(huì)經(jīng)??浯蟛焕诹愕淖C據(jù)[2]。


P值還被指責(zé)本質(zhì)上具有欺騙性,因?yàn)樗鼈儗⑿?yīng)大小和樣本量混淆成一個(gè)令人困惑的數(shù)字。另外,還需注意,P值不是客觀的衡量標(biāo)準(zhǔn),它們不具備我們認(rèn)為的證據(jù)的性質(zhì)。但從邏輯上講,似乎有資格作為支持或反對(duì)任何事情的衡量標(biāo)準(zhǔn)。


舉個(gè)例子:

假設(shè)一種止痛藥有24小時(shí)的有效記錄,而現(xiàn)在另一家制藥商聲稱(chēng)其新的非處方藥可以持續(xù)更長(zhǎng)時(shí)間。


一名調(diào)查員想要測(cè)試這一說(shuō)法是否屬實(shí)。研究人員沒(méi)有從所有服用新藥的患者那里收集數(shù)據(jù)(這通常是不可行的),而是決定隨機(jī)調(diào)查50名患者,以收集新止痛藥持續(xù)多長(zhǎng)時(shí)間(小時(shí))的數(shù)據(jù)。


因此,研究人員現(xiàn)在有了一個(gè)隨機(jī)變量X,即來(lái)自50名患者樣本的平均小時(shí)數(shù)。這是一個(gè)隨機(jī)變量,因?yàn)?0名患者是隨機(jī)選擇的,在進(jìn)行調(diào)查和計(jì)算平均值之前,沒(méi)有人知道這個(gè)變量的值是多少。


然而,每個(gè)調(diào)查都產(chǎn)生一個(gè)固定的數(shù)字X,它本身不是隨機(jī)變量,而是隨機(jī)變量X的實(shí)現(xiàn)或觀測(cè)(以下,設(shè)X表示隨機(jī)變量,X表示固定值,即X的觀測(cè))。


直觀地說(shuō),如果調(diào)查得出的值(止痛藥的平均持續(xù)時(shí)間)非常接近24,比如23或25,研究人員就不會(huì)相信新的止痛藥更糟或更好。如果調(diào)查達(dá)到平均32小時(shí),調(diào)查者會(huì)相信它確實(shí)持續(xù)了更長(zhǎng)時(shí)間。


如果調(diào)查顯示平均持續(xù)時(shí)間為22或26小時(shí),很難得出結(jié)論。這種新止痛藥的使用時(shí)間真的更短、更長(zhǎng),還是隨機(jī)產(chǎn)生的(畢竟,只有50名患者接受了調(diào)查)?[2]


這樣的話(huà),我們難以得知,很難僅僅通過(guò)P值的大小,進(jìn)行判斷誰(shuí)更有效。


歸根到底,就是因?yàn)槲覀兺ㄟ^(guò)統(tǒng)計(jì)學(xué)方法算出來(lái)的P值存在不確定性,統(tǒng)計(jì)測(cè)試的結(jié)果確實(shí)會(huì)影響我們做出推斷——即:是否認(rèn)為一個(gè)經(jīng)過(guò)測(cè)試的假設(shè)可能是正確的。


因此,評(píng)估統(tǒng)計(jì)測(cè)試結(jié)果就是判斷它們對(duì)科學(xué)命題的證據(jù)支持與否。不幸的是,P值不是在該過(guò)程中使用的可靠度量。P值也不是一個(gè)假設(shè)真實(shí)性的可靠指標(biāo),無(wú)論它是零假設(shè)還是替代假設(shè)。


P值該廢么?


對(duì)于P值何去何從的問(wèn)題,一直爭(zhēng)論不休,沒(méi)有統(tǒng)一的學(xué)術(shù)界標(biāo)準(zhǔn)。引起熱議的是在2019年,3位統(tǒng)計(jì)學(xué)家在《Nature》上發(fā)布公開(kāi)信,號(hào)召專(zhuān)家們放棄追求“統(tǒng)計(jì)學(xué)意義”,這封公開(kāi)信一周之內(nèi)吸引了超過(guò)800名研究人員共同支持。這不禁引起作為小白的我們深思,統(tǒng)計(jì)學(xué)還有用么,我們還要不要繼續(xù)學(xué)習(xí)統(tǒng)計(jì)學(xué)呢?


三位統(tǒng)計(jì)學(xué)家提出建議,首先要明確必須停止的事:永遠(yuǎn)不應(yīng)該僅僅因?yàn)镻值大于閾值(如0.05)就得出“沒(méi)有差異”或“沒(méi)有關(guān)聯(lián)”的結(jié)論;或者,僅僅因?yàn)橹眯艆^(qū)間包含0就得出這樣的結(jié)論。


然而,在我們學(xué)習(xí)統(tǒng)計(jì)學(xué)的過(guò)程,我們卻理所當(dāng)然的把P=0.05作為顯著性的標(biāo)準(zhǔn)。同時(shí),我們?cè)陂_(kāi)始學(xué)習(xí)統(tǒng)計(jì)學(xué)的時(shí)候,一直被告誡,統(tǒng)計(jì)學(xué)上的顯著性,并不等于臨床上的顯著性。我們要回到具體問(wèn)題具體分析上。


也就是說(shuō),統(tǒng)計(jì)學(xué)的結(jié)果有不確定性,然而我們沒(méi)有一種方法,能夠明確的進(jìn)行不確定性的判斷,所以說(shuō),禁止顯著性檢驗(yàn)和接受不確定性,盡管在許多情況下是合理的,但幾乎沒(méi)有提供一個(gè)新的方法對(duì)我們的研究來(lái)進(jìn)行判斷。


簡(jiǎn)而言之,我們迫切的需要正確的理解P值,需要進(jìn)一步探索如何更好的進(jìn)行統(tǒng)計(jì)分析,選擇合適的指標(biāo)來(lái)取代P值。讓統(tǒng)計(jì)分析更好地理解運(yùn)用于實(shí)際中。


同時(shí),三位科學(xué)家指出,停止使用P值,并不是禁止。在某些情況下,P值仍然可以作為決策的標(biāo)準(zhǔn)。這其實(shí)與我們學(xué)習(xí)的統(tǒng)計(jì)學(xué)并不沖突,也就是說(shuō),避免P值的決定性標(biāo)準(zhǔn),改變傳統(tǒng)的非黑即白的判斷,即如果僅僅側(cè)重于統(tǒng)計(jì)學(xué)意義的估計(jì)和討論是有偏見(jiàn)的。


總之,我們對(duì)待科學(xué)研究要抱有懷疑的態(tài)度,切莫以偏概全,要做到具體問(wèn)題具體分析。不要太相信統(tǒng)計(jì)分析的數(shù)據(jù)結(jié)果,要結(jié)合實(shí)際情況和專(zhuān)業(yè)知識(shí)去判斷是否具有實(shí)際意義。


小衛(wèi)智庫(kù) | 對(duì)于P值問(wèn)題,你怎么看?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
博罗县| 天门市| 隆子县| 上高县| 泸州市| 黄陵县| 吉木萨尔县| 高唐县| 高要市| 双流县| 金塔县| 襄汾县| 赞皇县| 大竹县| 从江县| 河源市| 鄄城县| 台州市| 葫芦岛市| 馆陶县| 海口市| 贵港市| 耒阳市| 罗山县| 富裕县| 托克逊县| 和林格尔县| 桑日县| 大冶市| 全椒县| 互助| 大英县| 云和县| 乌兰浩特市| 四川省| 常熟市| 旬阳县| 长岛县| 中西区| 布拖县| 阳泉市|