箱線(xiàn)圖繪制
一、案例介紹
某研究者在一項(xiàng)回顧性調(diào)查中搜集了部分資料,其目的是研究抗生素的使用效果,數(shù)據(jù)為某醫(yī)院內(nèi)、外科25例住院患者使用抗生素的情況,想要使用可視化圖形進(jìn)行比較用與不用抗生素的住院患者住院天數(shù)的差異以及數(shù)據(jù)是否存在異常值。
二、問(wèn)題分析
本案例的分析目的是想要使用可視化圖形進(jìn)行比較用與不用抗生素的住院患者住院天數(shù)的差異以及數(shù)據(jù)是否存在異常值。對(duì)此,為了解決該問(wèn)題,可以使用箱線(xiàn)圖進(jìn)行查看與比較,箱線(xiàn)圖一般用于多組計(jì)量資料的分布比較,一般會(huì)提供5個(gè)基本統(tǒng)計(jì)量,其中包括最小值、第一四分位數(shù)、第二四分位數(shù)、第三四分位數(shù)以及最大值。并且箱線(xiàn)圖還可以直觀查看到數(shù)據(jù)中是否含有異常值。所以使用箱線(xiàn)圖進(jìn)行分析比較合適。
三、軟件操作及結(jié)果解讀
(一) 數(shù)據(jù)導(dǎo)入
1.數(shù)據(jù)格式
首先將數(shù)據(jù)整理成正確的格式然后進(jìn)行上傳,一般一列為一個(gè)指標(biāo),由于指標(biāo)涉及“用與不用抗生素”所以需要上傳帶有標(biāo)簽的數(shù)據(jù),比如1代表是,2代表否,整理如下:
2.導(dǎo)入數(shù)據(jù)
將整理好的數(shù)據(jù)導(dǎo)入到SPSSAU系統(tǒng)內(nèi),點(diǎn)擊頁(yè)面右上角“上傳數(shù)據(jù)”按鈕,點(diǎn)擊上傳文件,將數(shù)據(jù)進(jìn)行上傳即可,如下:
將數(shù)據(jù)上傳到系統(tǒng)內(nèi)。上傳結(jié)果如下:
(二) 繪制箱線(xiàn)圖
1.軟件操作
箱線(xiàn)圖可以反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較,其繪制方法一般是先找出一組數(shù)據(jù)的上限、下限、中位數(shù)和兩個(gè)四分位數(shù),然后,連接兩個(gè)四分位數(shù)畫(huà)箱子,再將上限和下限與箱子連接,中位數(shù)在箱子中間。箱線(xiàn)圖如何操作以SPSSAU為例,點(diǎn)擊【可視化】→【箱線(xiàn)圖】進(jìn)行分析。操作如下:
2. 結(jié)果解讀
結(jié)果如下:
從分析結(jié)果可以看出,使用抗生素的患者住院天數(shù)整體上要高于沒(méi)有使用抗生素的患者住院天數(shù)。具體數(shù)值如下:
SPSSAU箱線(xiàn)圖共由五個(gè)數(shù)值點(diǎn)構(gòu)成,分別是最小觀察值(下限),25%分位數(shù)(Q1),中位數(shù),75%分位數(shù)(Q3),最大觀察值(上限)。最小觀察值和最大觀察值定義如下:
最小觀察值 = Q1 – 1.5(IQR四分位差), IQR = Q3 –Q1
最大觀察值 = Q3 + 1.5(IQR四分位差), IQR = Q3 –Q1
箱線(xiàn)圖中,‘下限’為最小觀察值與真實(shí)最小值之間的較大值;‘上限’為最大觀察值與最大值之間的較小值。
并且從圖中發(fā)現(xiàn)使用抗生素的住院天數(shù)有一個(gè)異常值,具體異常值如下:
可以看到數(shù)據(jù)有一個(gè)異常值,異常值為“使用抗生素的住院天數(shù)”數(shù)據(jù)組中的30,“未使用抗生素的住院天數(shù)”中沒(méi)有異常值。異常值的判斷標(biāo)準(zhǔn)如下:如果數(shù)據(jù)出現(xiàn)大于 Q3+1.5IQR(極大值),則為異常值,也或者數(shù)據(jù)小于 Q1-1.5IQR(極小值),則為異常值。
四、結(jié)論
所以通過(guò)箱線(xiàn)圖的查看,我們發(fā)現(xiàn)使用抗生素的患者住院天數(shù)整體上要高于沒(méi)有使用抗生素的患者住院天數(shù)。,并且“使用抗生素的住院天數(shù)”數(shù)據(jù)組中有一個(gè)異常值30,如果后續(xù)進(jìn)行其它分析需要將異常值篩選后分析,以免因?yàn)楫惓V祵?dǎo)致分析結(jié)果不準(zhǔn)確或者出現(xiàn)其它情況。
五、知識(shí)小貼士
1、極大值和極小值,最大值和最小值問(wèn)題?
箱線(xiàn)圖里面的極大值并非最大值,極小值也不是最小值。其計(jì)算公式為:最小觀察值 =Q1 - 1.5(IQR), IQR = Q3 –Q1;最大觀察值 =Q3 + 1.5(IQR), IQR = Q3 –Q1
2、箱線(xiàn)圖共有兩個(gè)用途。
分別如下:
直觀地識(shí)別數(shù)據(jù)中異常值(離群點(diǎn));
直觀地判斷數(shù)據(jù)離散分布情況,了解數(shù)據(jù)分布狀態(tài)。