【文獻(xiàn)基礎(chǔ)003】論文圖表解讀(3)——箱式圖
背景介紹
做科研離不開閱讀文獻(xiàn),對科研小白來說,怎么讀文獻(xiàn)一直是一道難關(guān)。很多人剛接觸科研時,就會接到“多讀文獻(xiàn)”的命令,可是導(dǎo)師又不教怎么讀,然后就自己悶頭讀文獻(xiàn),讀來讀去也沒讀出個所以然。
讀文獻(xiàn)既要講方法,也要講基礎(chǔ)。對醫(yī)學(xué)專業(yè)的來說,給你一篇化學(xué)或者數(shù)學(xué)的文獻(xiàn),你又能理解多少呢?
我們平時讀的文獻(xiàn),大部分還是以研究型為主,對中文文章,圖表結(jié)合的多,比較看重文字,而SCI論文,更多是以圖說話,因為圖片更加直觀。圖片是SCI論文中結(jié)果呈現(xiàn)的主要形式,很多人剛開始讀文獻(xiàn),可能不重視看圖,從頭至尾把文字讀個遍,結(jié)果搞得自己一頭霧水,不知所云。這種研究型的文章,在讀完摘要之后,要先看圖,大致了解作者都做了哪些工作,每組圖要證明的是什么問題,然后再讀文字的內(nèi)容。
可是,沒有文獻(xiàn)基礎(chǔ),看到圖連是什么類型的圖都不知道,又怎么能知道作者要表達(dá)什么呢?
這個系列,一起來學(xué)習(xí)文獻(xiàn)里那些導(dǎo)師以為你都會常見圖都代表什么意思。
今天是第三期,講講另一種常見的圖:箱式圖
箱式圖,又叫箱形圖(Box-plot),是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖,因形狀如箱子而得名。箱圖主要用于反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較。
先來直觀感受一下,文獻(xiàn)中看到這樣的圖就是箱式圖了


箱式圖主要需要關(guān)注的其實是5條線,即下圖中的上界線、上四分位線、中位數(shù)線、下四分位線、下界線。
理解箱式圖的含義,需要先回顧一下四分位數(shù)的知識,一組數(shù)據(jù)按照從小到大順序排列后,把該組數(shù)據(jù)四等分的數(shù),稱為四分位數(shù)。
第一四分位數(shù) (Q1),第二四分位數(shù) (Q2,也叫“中位數(shù)”),第三四分位數(shù) (Q3)分別等于該樣本中所有數(shù)值由小到大排列后第25%、第50%和第75%的數(shù)字。第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(interquartile range, IQR)

下面這張圖詳細(xì)的解釋了箱式圖不同線的含義,先看箱體結(jié)構(gòu),箱體的上線(上四分位線)是Q3,下線(下四分位線)是Q1,所以箱體表示的即是四分位間距(IQR)箱體中間的線表示中位線(Q2)。上界線表示的是數(shù)據(jù)可能出現(xiàn)的最大值Q3+1.5IQR,下界表示可能出現(xiàn)的最小值Q1-1.5IQR。上界和下界背后有著一種概率的含義,并不是表示這組數(shù)據(jù)的最大值和最小值。對于小于下界、大于上界的數(shù)值,會以散點(diǎn)表示出來,通常被稱作離群值或異常值。

至此,應(yīng)該就可以明白箱式圖所表達(dá)的主要意思了。
箱式圖有什么用:
1、直觀地識別異常數(shù)據(jù)
由于可以利用中位數(shù)、25/%分位數(shù)、75/%分位數(shù)、上邊界、下邊界等統(tǒng)計量的計算,可生成一個箱圖,箱體區(qū)域包含的大部分為正常數(shù)據(jù),而在箱體上邊界和下邊界之外的,就是異常數(shù)據(jù)。反之,箱形圖可以用來直接觀察數(shù)據(jù)整體的分布情況,憑借中位數(shù)、25/%分位數(shù)、75/%分位數(shù)等統(tǒng)計量,來描述數(shù)據(jù)的整體分布情況。
2、判斷數(shù)據(jù)的偏態(tài)和尾重
對于標(biāo)準(zhǔn)正態(tài)分布的大樣本,中位數(shù)位于上下四分位數(shù)的中央,箱形圖的方盒關(guān)于中位線對稱。中位數(shù)越偏離上下四分位數(shù)的中心位置,分布偏態(tài)性越強(qiáng)。異常值集中在較大值一側(cè),則分布呈現(xiàn)右偏態(tài);異常值集中在較小值一側(cè),則分布呈現(xiàn)左偏態(tài)。
3、多批數(shù)據(jù)通過形狀來比較
箱子的上下限,分別是數(shù)據(jù)的上四分位數(shù)和下四分位數(shù)。這意味著箱子包含了50%的數(shù)據(jù)。因此,箱子的寬度在一定程度上反映了數(shù)據(jù)的波動程度。箱體越扁說明數(shù)據(jù)越集中,端線越短,也說明數(shù)據(jù)集中。(如本文的第一張圖)
箱式的繪制,Prism、R都可以完成,Prism簡單易操作,后期出教程。
今天的分享就到這里,下期見。