臨床醫(yī)師看過來:5個理由告訴你,為什么JMP軟件更適合你?

關(guān)于統(tǒng)計(jì)分析軟件的比較已經(jīng)有不少文章都介紹過,但大都是針對專業(yè)統(tǒng)計(jì)人員而言。在醫(yī)學(xué)中,絕大多數(shù)使用統(tǒng)計(jì)軟件的人員其實(shí)更多的是非統(tǒng)計(jì)學(xué)專業(yè)的臨床醫(yī)師。由于各種原因,他們不得不自學(xué)使用統(tǒng)計(jì)軟件。根據(jù)作者十多年的醫(yī)學(xué)統(tǒng)計(jì)分析經(jīng)驗(yàn),深知臨床醫(yī)師自行使用統(tǒng)計(jì)軟件之困苦。
為了幫助更多的臨床醫(yī)師從這種困苦中解脫出來,幫助臨床醫(yī)師學(xué)習(xí)如何運(yùn)用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,即日起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計(jì)學(xué)家馮國雙博士及其團(tuán)隊(duì)將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計(jì)及數(shù)據(jù)分析、JMP實(shí)戰(zhàn)操作等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運(yùn)用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用哦!
本文為此系列文章的第一期,馮博士及其團(tuán)隊(duì)分享了他們使用JMP軟件的歷程和心得經(jīng)驗(yàn),并舉例說明了為什么JMP軟件是更適合臨床醫(yī)師的統(tǒng)計(jì)學(xué)軟件。為方便閱讀,文章以第一人稱描述。
那么,為什么我們認(rèn)為JMP軟件更適合臨床醫(yī)師來使用呢?理由其實(shí)有很多,下面給出幾個主要的:
01?全菜單式操作
這一點(diǎn)大概是臨床醫(yī)師最關(guān)心的。因?yàn)榻y(tǒng)計(jì)學(xué)并不是臨床醫(yī)師的主業(yè),沒必要花大量時間去學(xué)習(xí)統(tǒng)計(jì)軟件,而菜單式操作相比編程而言,肯定更符合臨床醫(yī)生的需求。
可以直觀感受一下JMP的菜單(圖1)。

從分析菜單可以看出JMP在統(tǒng)計(jì)分類中的一些特色。它不是簡單按具體的方法歸類,而是根據(jù)統(tǒng)計(jì)方法的結(jié)構(gòu)進(jìn)行大的歸類。
比如,要做兩組均值的比較,從統(tǒng)計(jì)學(xué)的角度來看,所謂的“組間比較”,其實(shí)就是單因素分析,組別是自變量,欲比較的指標(biāo)(結(jié)局指標(biāo))是因變量,統(tǒng)計(jì)學(xué)中都是將自變量作為x,因變量作為y。所以,組間比較,也就是分析組別因素(自變量x)對結(jié)局指標(biāo)(因變量y)的影響。
因此,在JMP中,所有的組間比較,或者更廣泛一些,所有的單因素分析,都包含在“以X擬合Y”菜單中。
這種方式有利于理解統(tǒng)計(jì)學(xué)的思維。一開始可能有的臨床醫(yī)生不一定習(xí)慣JMP的這種方式,然而一旦使用后就會發(fā)現(xiàn),其實(shí)這種方式更為方便,因?yàn)樗前唇y(tǒng)計(jì)學(xué)方法分了大類,更有利于體會統(tǒng)計(jì)學(xué)方法之間的關(guān)聯(lián)。
另外,JMP的菜單可以隨時在中英文之間切換,對于要發(fā)表英文文章的科研工作者,可以先用中文做出分析結(jié)果,然后直接在菜單(文件→首選項(xiàng))中把語言改為英文,即時生效,無需重啟。這一點(diǎn)很人性化。
02?更方便的分析過程
以往絕大多數(shù)菜單類的統(tǒng)計(jì)軟件,想使用某統(tǒng)計(jì)方法時,都是點(diǎn)開相應(yīng)菜單,然后有各種選項(xiàng)等著你,都設(shè)置完畢后,點(diǎn)擊確定,直接進(jìn)入結(jié)果部分。
例如,假定我們有圖2所示的一份數(shù)據(jù)(部分顯示),現(xiàn)在想做一下飲酒和不飲酒的人群他們的軀體健康評分有無統(tǒng)計(jì)學(xué)差異。

如果用某軟件做這兩組比較,分析菜單如圖3所示,你需要把各種東西都設(shè)置好,然后確定,進(jìn)入結(jié)果界面。

JMP則不同,在分析菜單中非常簡單,沒有任何選項(xiàng),就是拖拽需要的變量到相應(yīng)位置(圖4)。無需做多余的設(shè)置,JMP會自動根據(jù)x的類型(分類或連續(xù),如圖4中,紅色變量為分類,藍(lán)色變量為連續(xù))和y的類型確定該進(jìn)入到哪些方法的結(jié)果中。
圖4中,由于x是分類變量,y是連續(xù)變量,所以軟件自動選擇“單因子”(見圖4左下角,相當(dāng)于方差分析)的方法。如果x和y都是分類,圖4左下角就會變成“列聯(lián)”(相當(dāng)于卡方檢驗(yàn))。

可能有人會問,沒有選項(xiàng),那如果要做一些改變怎么辦?比如,雖然y是連續(xù)變量,但如果不滿足正態(tài)分布,需要做非參數(shù)檢驗(yàn)怎么辦呢?這就是JMP的特色了。JMP分析界面非常簡潔,但是結(jié)果界面卻非常豐富,所有的選項(xiàng)都在結(jié)果界面中(圖5)。
當(dāng)我們在圖4界面中點(diǎn)擊確定,就進(jìn)入了JMP結(jié)果界面(圖5)。結(jié)果界面默認(rèn)很簡單,但是選項(xiàng)很豐富。

從圖5可以看到,如果你想顯示其它結(jié)果,隨時可通過紅色下拉菜單(紅三角)勾選自己所需的方法,如果不需要了,也可以隨時把它們勾選掉。這種方式讓數(shù)據(jù)分析和探索更加方便。在其它軟件中,如果想重新做一次,那就得返回去重新來一遍操作。但在JMP中不用,你想換個方法(比如你做了t檢驗(yàn),突然發(fā)現(xiàn)數(shù)據(jù)可能不符合正態(tài)分布,又想做非參數(shù)檢驗(yàn)),無需返回,直接在結(jié)果中勾選其它方法即可,非常方便。
03?半智能化的操作
對于所有臨床科研工作者來說,可能都有一個夢想,那就是:如果能把數(shù)據(jù)輸入軟件,然后一切都交給軟件該多好。
雖然說沒有全智能化的統(tǒng)計(jì)軟件,半智能還是能做到的。也就是說,統(tǒng)計(jì)軟件雖然不能完全根據(jù)數(shù)據(jù)選擇方法,但在某些特定的場合,還是可以幫你做出選擇的。比如,如果你要做多組均值比較,肯定不能直接用t檢驗(yàn);如果你要做一個回歸分析,且結(jié)局是分類資料,絕大多數(shù)情況下,都會先考慮Logistic回歸等等。JMP就是在這一點(diǎn)幫助大家做到了半智能化。
其實(shí)從前面介紹的圖4中,相信大家已經(jīng)有所感受了,在JMP的“以X擬合Y”這一菜單中,其實(shí)已經(jīng)自動基于x和y的類型做出了基本選擇。
下面進(jìn)一步演示一下JMP在半智能化中的表現(xiàn)。
我們再次以比較飲酒和不飲酒兩組人群的軀體健康評分來說明。先回顧一下圖5中的結(jié)果,由于是兩組比較,通??煽紤]t檢驗(yàn),我們注意看到,結(jié)果中是有t檢驗(yàn)的(圖6中“合并的t”)。

現(xiàn)在我們換一個分組變量,比較不同心功能分級之間的軀體健康評分情況。心功能分級是多分類,首先考慮方差分析。我們同樣以圖4中的操作方式(只是把圖4中的飲酒換成心功能分級),得到圖7的分析結(jié)果界面。
這時候你會驚奇地發(fā)現(xiàn),圖7中“合并的t”不見了。

為什么呢?因?yàn)槎嘟M比較不能用t檢驗(yàn),JMP自動把不應(yīng)該用的方法給你去掉了。這一點(diǎn)非常重要,尤其對非統(tǒng)計(jì)學(xué)專業(yè)人員。
再比如,假設(shè)我們以軀體健康評分為因變量,分析其它幾個指標(biāo)對軀體健康評分的影響,這一般可以考慮線性回歸。
我們通過“擬合模型”菜單,將因變量和自變量拖入相應(yīng)位置(圖8)。然后注意看一下,JMP默認(rèn)就選擇了“標(biāo)準(zhǔn)最小二乘法”(相當(dāng)于線性回歸),而自動把兩個Logistic回歸方法變灰了,讓你沒法選擇。

這又為什么呢?因?yàn)榻Y(jié)局(軀體健康評分)是連續(xù)變量,連續(xù)變量的回歸,不能使用Logistic回歸,最常用的是線性回歸。對于這種最基本的錯誤,JMP直接就幫你避免了。
通過上述兩個例子,大家可以看到JMP軟件處處體現(xiàn)了對非統(tǒng)計(jì)學(xué)專業(yè)人群的愛意,細(xì)節(jié)之處見專業(yè),真可謂是用心良苦了。
04?全交互式的操作
大多數(shù)統(tǒng)計(jì)軟件,都是從數(shù)據(jù)到結(jié)果,基于數(shù)據(jù)做出結(jié)果后,一般都難以從結(jié)果再到數(shù)據(jù)。
而JMP則不同,結(jié)果出來,僅僅是真正分析的開始,不僅結(jié)果中可以根據(jù)需求任意添加或刪除相應(yīng)結(jié)果(如圖5),而且結(jié)果始終跟數(shù)據(jù)是關(guān)聯(lián)的。
如圖9展示了age的分布情況,給出了統(tǒng)計(jì)描述指標(biāo),而且給出了圖形。關(guān)鍵的是,這些圖形,都是可以用鼠標(biāo)選定的,而且當(dāng)你選定任一變量的圖形時,其它變量的相應(yīng)觀測也被選中。
比如,圖9中,有兩個變量,age和年齡分層,當(dāng)我們選中了age這個變量的相應(yīng)數(shù)據(jù),你會發(fā)現(xiàn),“年齡分層”這個變量也被選中了,而且“年齡分層”的頻數(shù)列表中相應(yīng)的也被選中。如果到數(shù)據(jù)集中看看,你會發(fā)現(xiàn),在數(shù)據(jù)集中這些數(shù)據(jù)也被選中了。也就是說,JMP軟件不是簡單的“數(shù)據(jù)→結(jié)果”,而是數(shù)據(jù)和結(jié)果是交互式的,可以“數(shù)據(jù)→結(jié)果”,也可以“結(jié)果→數(shù)據(jù)”,數(shù)據(jù)和結(jié)果之間一直是關(guān)聯(lián)的。

可能有人覺得,這種關(guān)聯(lián)有什么用呢?在實(shí)際工作中非常有用。比如,如果想單獨(dú)把“飲酒”人群選出來,甚至都無需用篩選這些功能,直接在圖中把“飲酒”選中,然后數(shù)據(jù)集中就同步選中了(圖10),然后通過“子集”功能就把飲酒人群的數(shù)據(jù)選出來即可。

再比如,如果我們發(fā)現(xiàn)散點(diǎn)圖中有異常點(diǎn),想快速定位到這個數(shù)據(jù),就可以直接在圖中選中該點(diǎn),然后到數(shù)據(jù)集中就發(fā)現(xiàn)這個點(diǎn)被標(biāo)出來了,可以直接用定位功能定位到這一觀測,省去了自己去核對這個數(shù)據(jù)的時間。
05?其它人性化的功能
JMP其實(shí)有很多人性化的功能,本文也難以說完,在后續(xù)的系列文章中都會一一介紹。最后再提幾個比較實(shí)用且能節(jié)省時間的功能。
比如,JMP數(shù)據(jù)表中,變量名和變量的值命名不受任何限制。不管是中文英文,特殊符號等等都沒有問題。目前絕大多數(shù)統(tǒng)計(jì)軟件都做不到這一點(diǎn),往往對變量名有一定限制,這導(dǎo)致做出結(jié)果后還得修圖,太麻煩。JMP則直接根據(jù)變量名做出來結(jié)果就行,無需修改。
再比如,JMP的作圖功能是交互式的,跟以往其它統(tǒng)計(jì)軟件都不同,不是靠指定變量來作圖,而且完全通過拖拽即可實(shí)現(xiàn)(圖11),而且多種圖形之間可以任意切換,只需鼠標(biāo)點(diǎn)擊一下即可(圖11中上方的圖形,鼠標(biāo)一點(diǎn)即時切換)。

當(dāng)然,JMP的優(yōu)點(diǎn)并不只此,以上只是基于我們在實(shí)際工作中所使用到的部分總結(jié)出來的一些心得體會。在后續(xù)的系列文章中,我們也會通過案例和說明來逐一介紹JMP在數(shù)據(jù)整理與清洗、作圖、統(tǒng)計(jì)分析中的特點(diǎn),相信這些會為大家提供更快捷、更高效的分析方式。敬請期待!
最后,如果你也想成為JMP專欄作者或者想投稿,歡迎私信小編留下你的個人簡介及聯(lián)系方式,或發(fā)送郵件至jmpmarketing@sas.com與我們聊聊。期待你的加入哦!
