科研統(tǒng)計圖匯總整理
一、常用統(tǒng)計圖
常用統(tǒng)計圖的適用情況和舉例說明如下:
比如:散點圖適用于展示兩個變量之間的關(guān)系情況;直方圖適用于展示連續(xù)變量的分布情況,判斷是否符合正態(tài)分布等;箱線圖展示一組數(shù)據(jù)的中位數(shù)、四分位數(shù)、最大值、最小值等信息,可以用于分析數(shù)據(jù)分布情況或者是否存在異常值等等。
二、作圖思路
首先區(qū)分數(shù)據(jù)類型:畫圖通常是體現(xiàn)X和Y之間的關(guān)系情況。那么首先需要知道X和Y分別的數(shù)據(jù)類型是什么,下面總結(jié)一個表格說明如下:
按照X和Y的思維,先識別出X和Y分別的數(shù)據(jù)類型情況,然后找到適合的統(tǒng)計圖作圖即可。
舉例說明:比如想要分析不同品種和不同施肥方式下,水稻產(chǎn)量的差異,希望通過圖形直觀展示差異情況。很明顯這里2個X均為定類數(shù)據(jù),而水稻產(chǎn)量為定量數(shù)據(jù),所以可以使用“簇狀圖”進(jìn)行可視化分析。
將數(shù)據(jù)上傳至SPSSAU系統(tǒng),選擇“簇狀圖”,拖拽變量至右側(cè)相應(yīng)分析框,操作如下圖:
得到簇狀圖結(jié)果如下:
簇狀折線圖
簇狀柱形圖
簇狀條形圖
SPSSAU當(dāng)前提供累計共30類圖形,分布于各個方法中自動生成,當(dāng)然還有一些復(fù)雜或者特殊的圖形需要自己作圖。
三、SPSSAU自動出圖
在使用SPSSAU進(jìn)行數(shù)據(jù)分析時,選擇相應(yīng)方法進(jìn)行分析得到分析結(jié)果的同時,SPSSAU會默認(rèn)自動輸出對應(yīng)的統(tǒng)計圖分析結(jié)果。
舉例說1:定類數(shù)據(jù)進(jìn)行頻數(shù)分析時,SPSSAU會默認(rèn)輸出對應(yīng)的餅狀圖、圓環(huán)圖、柱狀圖、條形圖。如果需要切換不同的統(tǒng)計圖,點擊圖形右上角選擇即可,如下圖:
舉例說明2:使用獨立樣本t檢驗研究不同組別空腹血糖下降值的差異時,SPSSAU會默認(rèn)輸出對應(yīng)的柱形圖、條形圖、折線圖。如下圖:
舉例說明3:使用卡方檢驗研究不同療法治療效果的差異時,SPSSAU會默認(rèn)輸出對應(yīng)的堆積柱形圖、堆積條形圖等,如下圖:
提示:SPSSAU可視化結(jié)合了數(shù)據(jù)分析方法的思想,默認(rèn)提供準(zhǔn)確的可視化圖形展示,這是SPSSAU智能系統(tǒng)的一個組成部分。通常自動輸出的第一個統(tǒng)計圖是最優(yōu)的即最合適的。
四、統(tǒng)計圖詳細(xì)說明
1、散點圖
散點圖用于考察定量數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,即查看X和Y之間的關(guān)系情況。散點圖通常用于探索性研究,直觀展示出數(shù)據(jù)間的關(guān)聯(lián)關(guān)系情況。
使用場景
(1) 相關(guān)分析之前,查看X和Y之間的關(guān)系情況。
(2) 回歸分析后模型檢驗,查看殘差分別與自變量間的關(guān)聯(lián)性【回歸模型假定殘差不應(yīng)該與自變量有關(guān)聯(lián)性,即異方差性】。
(3)
其它用于直觀展示數(shù)據(jù)關(guān)系的場景。
散點圖示例
2、直方圖
直方圖用于直觀展示數(shù)據(jù)分布情況,觀察數(shù)據(jù)的正態(tài)分布特性,檢驗數(shù)據(jù)是否滿足正態(tài)性。
使用場景
(1) 相關(guān)分析時,數(shù)據(jù)的正態(tài)性查看;
(2) 回歸分析后模型檢驗,將殘差進(jìn)行正態(tài)性檢驗,如果殘差呈現(xiàn)出正態(tài)性意味著模型構(gòu)建良好,反之說明模型構(gòu)建較差。
(3)
其他用于查看數(shù)據(jù)分布、檢驗正態(tài)性的場景等等。
直方圖展示
3、箱線圖
箱線圖(也稱盒圖,箱盒圖等)是在1977年由美國統(tǒng)計學(xué)家John
Tukey發(fā)明,分析數(shù)據(jù)需要為定量數(shù)據(jù)。通過箱線圖,可以直觀的探索數(shù)據(jù)特征。
(1)
查看可能的異常值數(shù)據(jù)情況;(2)
非參數(shù)檢驗時查看不同類別X時,Y的數(shù)據(jù)分布情況;(3)
其它涉及查看數(shù)據(jù)分布或者異常值查看時。
4、詞云圖
詞云圖是由美國西北大學(xué)新聞學(xué)教授Rich
Gordon提出,“詞云”可對文字中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而使瀏覽者只要一眼掃過文本就可以領(lǐng)略文本的主旨。
(1)直觀地展示文本信息,并且突出展示關(guān)鍵信息;
(2)針對有權(quán)重的數(shù)據(jù)信息進(jìn)行詞云展示。
5、誤差線圖
誤差線圖用于展示數(shù)據(jù)的不確定性程度,顯示潛在的誤差或每個數(shù)據(jù)標(biāo)志的不確定程度。樣本數(shù)據(jù)的波動是通過標(biāo)準(zhǔn)差體現(xiàn),因而樣本均值不確定性程度為標(biāo)準(zhǔn)差。
誤差線圖展示6、P-P圖/Q-Q圖
P-P圖和Q-Q圖常用于直觀查看數(shù)據(jù)是否正態(tài)分布。P-P圖和Q-Q圖的目的性基本一致,但原理上有著區(qū)別。
(1) 方差分析對應(yīng)的Y值是否具有正態(tài)性特質(zhì)的判斷;
(2) 回歸分析前,對應(yīng)的Y值是否具有正態(tài)性特質(zhì)判斷;回歸分析后,使用P-P圖和Q-Q圖檢查殘差值是否有正態(tài)性特質(zhì);
(3) 二元Logit回歸后的殘差值是否有正態(tài)性特質(zhì)。
(4) 其它用于直觀展示數(shù)據(jù)正態(tài)性的場景。
P-P圖/Q-Q圖展示7、ROC曲線
ROC曲線,也稱受試者工作特征曲線;ROC曲線最初是運用在軍事上,當(dāng)前在醫(yī)學(xué)領(lǐng)域使用非常廣泛,用于研究X對于Y的預(yù)測準(zhǔn)確率情況。
ROC曲線展示

8、象限圖
象限圖可對數(shù)據(jù)分類進(jìn)行直觀展示;使用水平和垂直分割線將圖表區(qū)域劃分成四個象限,而且每個象限呈現(xiàn)對應(yīng)的數(shù)據(jù)。通常情況下,象限圖呈現(xiàn)目的在于直接展示數(shù)據(jù)劃分區(qū)域。
9、帕累托圖
帕累托圖是“二八原則”的圖形化體現(xiàn),80%的問題是由20%的原因所致;通常情況下帕累托圖可用來展現(xiàn)某‘問題’的占比情況,通過圖形找出最重要的原因。
10、簇狀圖
從展示的圖形類型上,簇狀圖可分為簇狀折線圖、簇狀柱形圖和簇狀條形圖等,SPSSAU默認(rèn)均提供;SPSSAU共提供平均值、計數(shù)、求和以及中位數(shù)四種匯總值。簇狀圖時,分類數(shù)據(jù)為0個,1個或2個,SPSSAU均提供對應(yīng)的圖形展示。
11、組合圖
組合圖用于兩類維度值之間有較大差異時的圖形化展示,其有兩個坐標(biāo)軸,分別是主軸和次軸,通常情況下,主軸為數(shù)量較大項,次軸為數(shù)量較大項。比如展示GDP與GDP增長率,主軸為GDP,次軸為GDP增長率。
12、氣泡圖
氣泡圖可用于展示X和Y之間的關(guān)系情況,并且利用Z標(biāo)識每個點的氣泡大小。同時,SPSSAU支持直接在氣泡中展示‘標(biāo)簽’,并且可使用不同顏色標(biāo)識氣泡。
13、核密度圖
核密度圖是一種非參數(shù)檢驗方法,其是對直方圖的進(jìn)一步抽象化,但其更加直觀,其曲線下面積為1,通常用于連續(xù)數(shù)據(jù)的直觀展示,比如年齡的分布情況,身高的分布情況等。
14、小提琴圖
小提琴是是箱線圖和核密度圖的集合,其可通過箱線思維展示數(shù)據(jù)的各個百分位點,與此同時,還可使用核密度圖展示數(shù)據(jù)分布的‘輪廓’效果,‘輪廓’越大,即意味著數(shù)據(jù)越集中于該處,反之則說明該處時數(shù)據(jù)越少。