3招教你花式導(dǎo)入Excel數(shù)據(jù)至JMP

在上篇文章《臨床醫(yī)師看過來:5個理由告訴你,為什么JMP軟件更適合你?》中,我們簡單介紹了JMP軟件對于非專業(yè)統(tǒng)計人員的優(yōu)勢:JMP以其友好的菜單界面、強大的可視化工具、豐富的數(shù)據(jù)清洗功能、系列的統(tǒng)計分析方法、交互的結(jié)果展示方式等,對非統(tǒng)計學(xué)專業(yè)的分析人員非常友好。
為了幫助更多的臨床醫(yī)師學(xué)習(xí)如何運用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計學(xué)家馮國雙博士及其團(tuán)隊將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計及數(shù)據(jù)分析、JMP實戰(zhàn)操作等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運用JMP軟件進(jìn)行數(shù)據(jù)分析的小伙伴都適用。
本文為此系列文章的第二期。馮博士及其團(tuán)隊介紹了JMP數(shù)據(jù)分析的第一步:導(dǎo)數(shù)據(jù)!文章將以Excel為例,教大家如何花式導(dǎo)入已有數(shù)據(jù)以及注意事項,其他類型數(shù)據(jù)集(如SPSS數(shù)據(jù)、csv數(shù)據(jù)等)的導(dǎo)入方式非常類似。為方便閱讀,文章以第一人稱描述。
JMP導(dǎo)入數(shù)據(jù)的三種常見方式有:復(fù)制和粘貼、直接在JMP中導(dǎo)入、通過Excel中的JMP插件。下面我們就逐一看看吧!
01 復(fù)制和粘貼
首先,打開JMP軟件,在菜單【文件】下方有一個類似數(shù)據(jù)集的小圖標(biāo),當(dāng)光標(biāo)移動到上面的時候顯示【新建數(shù)據(jù)表】,點擊此小圖標(biāo)(圖1),就會看到圖2的界面。這時,回到Excel數(shù)據(jù)集中,找到你想要分析的數(shù)據(jù)集,將想要分析的數(shù)據(jù)單元格全部選中,進(jìn)行復(fù)制。


這里有一個小技巧,如果你的變量(列)特別多,或者觀測(行)很多,用拖拉的方式進(jìn)行選中有點麻煩,不妨點擊一下表格最左上角的小三角將整個頁面都選中,再到JMP里進(jìn)行復(fù)制。不要擔(dān)心,JMP可以準(zhǔn)確識別出有數(shù)據(jù)內(nèi)容的單元格。
數(shù)據(jù)選中并復(fù)制完成后,再回到剛才新建立的JMP空數(shù)據(jù)表中。

在這里,可不是簡簡單單的粘貼或者ctrl+v了,因為我們在Excel里進(jìn)行復(fù)制的時候,第一行是變量名,直接粘貼的話,變量名就變成JMP數(shù)據(jù)集里的第一行觀測了(如圖3所示),這是萬萬不可的。
正確的做法是,在JMP中的菜單欄中點擊【編輯】下的【帶列名一起粘貼】,這時,你的Excel第一行就放到JMP的變量名位置上了。當(dāng)然,你也可以通過快捷組合鍵方式,只不過不是ctrl+v,而是ctrl+shift+v。
至此,第一種導(dǎo)入Excel數(shù)據(jù)的方法就結(jié)束了。是不是很簡單?
02 直接打開已有數(shù)據(jù)
這種將Excel導(dǎo)入JMP的方法可能是日常實踐操作中大家最常用的方法。
首先,仍然是打開JMP軟件,選擇【文件】下拉菜單中點擊【打開(O)…】,然后在彈出的文件瀏覽器中定位到你的Excel數(shù)據(jù)集(圖4,如果看不到Excel類型的文件,在文件名右側(cè)的下拉菜單中選擇Excel文件即可。JMP可以導(dǎo)入目前常用的絕大多數(shù)數(shù)據(jù)文件,包括文本文件、PDF文件、SAS程序文件、R代碼、MATLAB代碼、HTML文件、Shape文件、JSON數(shù)據(jù)文件等),單擊選中,然后打開。

這里有個需要注意的地方是 ???當(dāng)文件類型定位Excel文件時,文件名上方會出現(xiàn)一行小字和一個選項,提示是否強制使用Excel的第一行作為標(biāo)簽,一般我們會選擇“最佳推測”,沒錯,JMP就是這么聰明,總能正確判斷出我的第一行是不是變量名。當(dāng)然了,你也可以選擇“始終”或者“從不”,視你的數(shù)據(jù)情況而定。
點擊“打開”后,就到了數(shù)據(jù)正式導(dǎo)入前的預(yù)覽階段了,如圖5。左上角是數(shù)據(jù)的預(yù)覽,你可以在這里拖拽滾動條,看看觀測和變量的數(shù)量是否正確(只要你的Excel格式?jīng)]有問題,JMP是不會出錯啦)。
預(yù)覽窗口這里還有另一個比較實用的功能,你可以選中某個列,單擊右鍵指定數(shù)據(jù)的輸入格式。比如更改數(shù)值型變量的小數(shù)位,改成百分比形式或者更改成日期格式等,當(dāng)然,這些在數(shù)據(jù)導(dǎo)成JMP數(shù)據(jù)表之后再操作也可以,而且,如果你在這里操作錯了想重來,那最下面的“恢復(fù)默認(rèn)設(shè)置”可以幫助你。
右上方的sheet的選擇,也就是Excel里的工作表,如果你的Excel表里有多個sheet,這里要注意確認(rèn)好sheet的名稱。如果你想把表里所有的sheet都導(dǎo)入,這里可以選擇全選,那么Excel里有多少個sheet,JMP就會導(dǎo)入多少個數(shù)據(jù)表。

左下方是單個工作表的設(shè)置,默認(rèn)設(shè)置是列標(biāo)題起始于第一行,帶標(biāo)題的行數(shù)為1,數(shù)據(jù)起始于第一列第二行,如果你的數(shù)據(jù)格式特殊,那么這里要根據(jù)情況進(jìn)行修改。其它的我們維持其默認(rèn)狀態(tài)就好了。
萬事俱備,現(xiàn)在,點擊【導(dǎo)入】就大功告成了!
03 通過Excel中的JMP插件(此為Excel獨有功能)
這種方法可能是三種方法中操作最簡單的了!
正常情況下,當(dāng)我們安裝完JMP軟件后,Excel里也會安裝JMP插件,打開你的Excel數(shù)據(jù)表,就能看到JMP的選項卡,就像我們在Word里看到的EndNote插件一樣(圖6)。

在生成JMP數(shù)據(jù)表之前,我們要先點擊首選項進(jìn)行設(shè)置。點擊【首選項】后會彈出圖7界面,需要勾選“使用首行作為列名”,即把Excel數(shù)據(jù)的第一行作為列變量名稱,點擊確定之后再點擊首選項旁邊的【數(shù)據(jù)表】(圖8),便可直接生成JMP數(shù)據(jù)表。


以上就是三種最常用、最簡便的將Excel數(shù)據(jù)導(dǎo)入JMP的方法。
數(shù)據(jù)導(dǎo)入看似簡單但如果掌握了一些小技巧,便可以讓你事半功倍。下面根據(jù)我們多年使用JMP的經(jīng)驗,給大家分享兩個數(shù)據(jù)導(dǎo)入的“雷區(qū)”,幫助你輕松避雷。
01 原始數(shù)據(jù)中的數(shù)據(jù)一定不要有任何非數(shù)值的符號
在JMP中,“連續(xù)型”的變量名稱前顯示為藍(lán)色三角, “名義型”的變量名稱前顯示為紅色柱狀(圖9,有序型顯示為綠色,圖中無有序型變量,因此未顯示)。
導(dǎo)入數(shù)據(jù)后,如果軟件認(rèn)定該變量為數(shù)值型的,那么你可以將其改為任意類型,而如果軟件認(rèn)定某變量是字符型的,那么該變量只能在“有序型”和“名義型”之間更改。

正常情況下,數(shù)據(jù)導(dǎo)入后,JMP默認(rèn)所有數(shù)值均為“連續(xù)型”,凡是變量中有任意的非數(shù)值(如不小心把8.6寫成了8。6,或者某個單元格有“+”、“#”等各種非數(shù)字的符號,等等),均認(rèn)為是“名義型”。因此,如果某變量本來應(yīng)該是數(shù)值(如年齡、身高等),但導(dǎo)入后發(fā)現(xiàn)默認(rèn)為“名義型”,說明該變量一定存在非數(shù)值的字母或符號(如小數(shù)點寫成了逗號等),此時需要檢查原始數(shù)據(jù),否則名義型的變量是不能當(dāng)作數(shù)值來分析的。
例如,圖10中BMI在原始數(shù)據(jù)(如Excel)中都是數(shù)值,因此導(dǎo)入后直接默認(rèn)為連續(xù)型變量,并無問題。

圖11中BMI,在原始數(shù)據(jù)集(如Excel)中,由于不小心,其中一個數(shù)值把小數(shù)點敲成了句號,這時候這個看起來像是數(shù)值的單元格就不是數(shù)值了。因此如果直接導(dǎo)入到JMP,可以成功導(dǎo)入,但是由于BMI中有一個非數(shù)值(21。6),因此默認(rèn)就是名義型變量。

所以一定要注意 ???當(dāng)你從Excel等數(shù)據(jù)集中導(dǎo)入到JMP時,如果你發(fā)現(xiàn)本來應(yīng)該是數(shù)值的變量,卻默認(rèn)為字符型變量(紅色標(biāo)記),那只有一種可能性:一定是你的原始數(shù)據(jù)中該變量至少有一個包含了非數(shù)值的字符,可能是句號、頓號等不經(jīng)意的東西,也可能是你習(xí)慣把空格加個“-”、“/”等這些字符,也可能是有的軟件默認(rèn)把空值填上了“#NULL”等??傊彩欠菙?shù)值的東西,一律都不行。
02 JMP導(dǎo)入時對變量名限制最寬松
講到最后,不得不提一下JMP導(dǎo)入Excel數(shù)據(jù)時的另一個巨大的優(yōu)勢——你不必?fù)?dān)心你的變量名軟件無法識別!
目前絕大多數(shù)統(tǒng)計軟件都對變量名有限制,比如不能有括號,不能有各種特殊字符等等。比如age(年齡),這樣的變量名在其他分析軟件或編程軟件中根本無法直接導(dǎo)入,均提示不認(rèn)識(無法識別)。這在作圖時尤為麻煩,要么就得事后修圖,要么就得通過標(biāo)簽形式改一下變量顯示方式,多一道手續(xù)。
數(shù)據(jù)導(dǎo)入作為數(shù)據(jù)分析的第一步,看似簡單卻相當(dāng)重要,特別是當(dāng)你的數(shù)據(jù)量龐大繁多、數(shù)據(jù)類型雜亂無章、數(shù)據(jù)來源四面八方,你就會發(fā)現(xiàn)這些方法特別有用啦!
不要走開,關(guān)于JMP的各種操作,從數(shù)據(jù)導(dǎo)入到各種統(tǒng)計分析和結(jié)果報表的解讀,你所需要的,都將在后續(xù)文章中陸續(xù)推出。敬請期待!