最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

3招教你花式導(dǎo)入Excel數(shù)據(jù)至JMP

2020-10-30 16:41 作者:JMP數(shù)據(jù)分析  | 我要投稿

在上篇文章《臨床醫(yī)師看過來:5個理由告訴你,為什么JMP軟件更適合你?》中,我們簡單介紹了JMP軟件對于非專業(yè)統(tǒng)計人員的優(yōu)勢:JMP以其友好的菜單界面、強大的可視化工具、豐富的數(shù)據(jù)清洗功能、系列的統(tǒng)計分析方法、交互的結(jié)果展示方式等,對非統(tǒng)計學(xué)專業(yè)的分析人員非常友好。

為了幫助更多的臨床醫(yī)師學(xué)習(xí)如何運用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計學(xué)家馮國雙博士及其團(tuán)隊將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計及數(shù)據(jù)分析、JMP實戰(zhàn)操作等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運用JMP軟件進(jìn)行數(shù)據(jù)分析的小伙伴都適用。

本文為此系列文章的第二期。馮博士及其團(tuán)隊介紹了JMP數(shù)據(jù)分析的第一步:導(dǎo)數(shù)據(jù)!文章將以Excel為例,教大家如何花式導(dǎo)入已有數(shù)據(jù)以及注意事項,其他類型數(shù)據(jù)集(如SPSS數(shù)據(jù)、csv數(shù)據(jù)等)的導(dǎo)入方式非常類似。為方便閱讀,文章以第一人稱描述。


JMP導(dǎo)入數(shù)據(jù)的三種常見方式有:復(fù)制和粘貼、直接在JMP中導(dǎo)入、通過Excel中的JMP插件。下面我們就逐一看看吧!

01 復(fù)制和粘貼

首先,打開JMP軟件,在菜單【文件】下方有一個類似數(shù)據(jù)集的小圖標(biāo),當(dāng)光標(biāo)移動到上面的時候顯示【新建數(shù)據(jù)表】,點擊此小圖標(biāo)(圖1),就會看到圖2的界面。這時,回到Excel數(shù)據(jù)集中,找到你想要分析的數(shù)據(jù)集,將想要分析的數(shù)據(jù)單元格全部選中,進(jìn)行復(fù)制。

圖1 建立JMP空數(shù)據(jù)集
圖2 JMP空數(shù)據(jù)集

這里有一個小技巧,如果你的變量(列)特別多,或者觀測(行)很多,用拖拉的方式進(jìn)行選中有點麻煩,不妨點擊一下表格最左上角的小三角將整個頁面都選中,再到JMP里進(jìn)行復(fù)制。不要擔(dān)心,JMP可以準(zhǔn)確識別出有數(shù)據(jù)內(nèi)容的單元格。

數(shù)據(jù)選中并復(fù)制完成后,再回到剛才新建立的JMP空數(shù)據(jù)表中。

圖3 直接Ctrl + V

在這里,可不是簡簡單單的粘貼或者ctrl+v了,因為我們在Excel里進(jìn)行復(fù)制的時候,第一行是變量名,直接粘貼的話,變量名就變成JMP數(shù)據(jù)集里的第一行觀測了(如圖3所示),這是萬萬不可的。

正確的做法是,在JMP中的菜單欄中點擊【編輯】下的【帶列名一起粘貼】,這時,你的Excel第一行就放到JMP的變量名位置上了。當(dāng)然,你也可以通過快捷組合鍵方式,只不過不是ctrl+v,而是ctrl+shift+v。

至此,第一種導(dǎo)入Excel數(shù)據(jù)的方法就結(jié)束了。是不是很簡單?


02 直接打開已有數(shù)據(jù)

這種將Excel導(dǎo)入JMP的方法可能是日常實踐操作中大家最常用的方法。
首先,仍然是打開JMP軟件,選擇【文件】下拉菜單中點擊【打開(O)…】,然后在彈出的文件瀏覽器中定位到你的Excel數(shù)據(jù)集(圖4,如果看不到Excel類型的文件,在文件名右側(cè)的下拉菜單中選擇Excel文件即可。JMP可以導(dǎo)入目前常用的絕大多數(shù)數(shù)據(jù)文件,包括文本文件、PDF文件、SAS程序文件、R代碼、MATLAB代碼、HTML文件、Shape文件、JSON數(shù)據(jù)文件等),單擊選中,然后打開。

圖4 JMP打開已有數(shù)據(jù)集界面


這里有個需要注意的地方是 ???當(dāng)文件類型定位Excel文件時,文件名上方會出現(xiàn)一行小字和一個選項,提示是否強制使用Excel的第一行作為標(biāo)簽,一般我們會選擇“最佳推測”,沒錯,JMP就是這么聰明,總能正確判斷出我的第一行是不是變量名。當(dāng)然了,你也可以選擇“始終”或者“從不”,視你的數(shù)據(jù)情況而定。

點擊“打開”后,就到了數(shù)據(jù)正式導(dǎo)入前的預(yù)覽階段了,如圖5。左上角是數(shù)據(jù)的預(yù)覽,你可以在這里拖拽滾動條,看看觀測和變量的數(shù)量是否正確(只要你的Excel格式?jīng)]有問題,JMP是不會出錯啦)。

預(yù)覽窗口這里還有另一個比較實用的功能,你可以選中某個列,單擊右鍵指定數(shù)據(jù)的輸入格式。比如更改數(shù)值型變量的小數(shù)位,改成百分比形式或者更改成日期格式等,當(dāng)然,這些在數(shù)據(jù)導(dǎo)成JMP數(shù)據(jù)表之后再操作也可以,而且,如果你在這里操作錯了想重來,那最下面的“恢復(fù)默認(rèn)設(shè)置”可以幫助你。

右上方的sheet的選擇,也就是Excel里的工作表,如果你的Excel表里有多個sheet,這里要注意確認(rèn)好sheet的名稱。如果你想把表里所有的sheet都導(dǎo)入,這里可以選擇全選,那么Excel里有多少個sheet,JMP就會導(dǎo)入多少個數(shù)據(jù)表。

圖5 導(dǎo)入EXCEL數(shù)據(jù)集界面

左下方是單個工作表的設(shè)置,默認(rèn)設(shè)置是列標(biāo)題起始于第一行,帶標(biāo)題的行數(shù)為1,數(shù)據(jù)起始于第一列第二行,如果你的數(shù)據(jù)格式特殊,那么這里要根據(jù)情況進(jìn)行修改。其它的我們維持其默認(rèn)狀態(tài)就好了。

萬事俱備,現(xiàn)在,點擊【導(dǎo)入】就大功告成了!


03 通過Excel中的JMP插件(此為Excel獨有功能)

這種方法可能是三種方法中操作最簡單的了!

正常情況下,當(dāng)我們安裝完JMP軟件后,Excel里也會安裝JMP插件,打開你的Excel數(shù)據(jù)表,就能看到JMP的選項卡,就像我們在Word里看到的EndNote插件一樣(圖6)。

圖6 EXCEL中的JMP插件

在生成JMP數(shù)據(jù)表之前,我們要先點擊首選項進(jìn)行設(shè)置。點擊【首選項】后會彈出圖7界面,需要勾選“使用首行作為列名”,即把Excel數(shù)據(jù)的第一行作為列變量名稱,點擊確定之后再點擊首選項旁邊的【數(shù)據(jù)表】(圖8),便可直接生成JMP數(shù)據(jù)表。

圖7 EXCEL中JMP插件的設(shè)置
圖8 點擊“數(shù)據(jù)表”自動從EXCEL進(jìn)入JMP軟件


以上就是三種最常用、最簡便的將Excel數(shù)據(jù)導(dǎo)入JMP的方法。

數(shù)據(jù)導(dǎo)入看似簡單但如果掌握了一些小技巧,便可以讓你事半功倍。下面根據(jù)我們多年使用JMP的經(jīng)驗,給大家分享兩個數(shù)據(jù)導(dǎo)入的“雷區(qū)”,幫助你輕松避雷。

01 原始數(shù)據(jù)中的數(shù)據(jù)一定不要有任何非數(shù)值的符號

在JMP中,“連續(xù)型”的變量名稱前顯示為藍(lán)色三角, “名義型”的變量名稱前顯示為紅色柱狀(圖9,有序型顯示為綠色,圖中無有序型變量,因此未顯示)。

導(dǎo)入數(shù)據(jù)后,如果軟件認(rèn)定該變量為數(shù)值型的,那么你可以將其改為任意類型,而如果軟件認(rèn)定某變量是字符型的,那么該變量只能在“有序型”和“名義型”之間更改。

圖9 不同變量類型示意圖

正常情況下,數(shù)據(jù)導(dǎo)入后,JMP默認(rèn)所有數(shù)值均為“連續(xù)型”,凡是變量中有任意的非數(shù)值(如不小心把8.6寫成了8。6,或者某個單元格有“+”、“#”等各種非數(shù)字的符號,等等),均認(rèn)為是“名義型”。因此,如果某變量本來應(yīng)該是數(shù)值(如年齡、身高等),但導(dǎo)入后發(fā)現(xiàn)默認(rèn)為“名義型”,說明該變量一定存在非數(shù)值的字母或符號(如小數(shù)點寫成了逗號等),此時需要檢查原始數(shù)據(jù),否則名義型的變量是不能當(dāng)作數(shù)值來分析的。

例如,圖10中BMI在原始數(shù)據(jù)(如Excel)中都是數(shù)值,因此導(dǎo)入后直接默認(rèn)為連續(xù)型變量,并無問題。

圖10 原始數(shù)據(jù)為數(shù)值時導(dǎo)入后默認(rèn)為連續(xù)型變量


圖11中BMI,在原始數(shù)據(jù)集(如Excel)中,由于不小心,其中一個數(shù)值把小數(shù)點敲成了句號,這時候這個看起來像是數(shù)值的單元格就不是數(shù)值了。因此如果直接導(dǎo)入到JMP,可以成功導(dǎo)入,但是由于BMI中有一個非數(shù)值(21。6),因此默認(rèn)就是名義型變量。

圖11 數(shù)值型變量中存在非數(shù)值符號導(dǎo)致導(dǎo)入后成為名義型變量


所以一定要注意 ???當(dāng)你從Excel等數(shù)據(jù)集中導(dǎo)入到JMP時,如果你發(fā)現(xiàn)本來應(yīng)該是數(shù)值的變量,卻默認(rèn)為字符型變量(紅色標(biāo)記),那只有一種可能性:一定是你的原始數(shù)據(jù)中該變量至少有一個包含了非數(shù)值的字符,可能是句號、頓號等不經(jīng)意的東西,也可能是你習(xí)慣把空格加個“-”、“/”等這些字符,也可能是有的軟件默認(rèn)把空值填上了“#NULL”等??傊彩欠菙?shù)值的東西,一律都不行。

02 JMP導(dǎo)入時對變量名限制最寬松


講到最后,不得不提一下JMP導(dǎo)入Excel數(shù)據(jù)時的另一個巨大的優(yōu)勢——你不必?fù)?dān)心你的變量名軟件無法識別!

目前絕大多數(shù)統(tǒng)計軟件都對變量名有限制,比如不能有括號,不能有各種特殊字符等等。比如age(年齡),這樣的變量名在其他分析軟件或編程軟件中根本無法直接導(dǎo)入,均提示不認(rèn)識(無法識別)。這在作圖時尤為麻煩,要么就得事后修圖,要么就得通過標(biāo)簽形式改一下變量顯示方式,多一道手續(xù)。

數(shù)據(jù)導(dǎo)入作為數(shù)據(jù)分析的第一步,看似簡單卻相當(dāng)重要,特別是當(dāng)你的數(shù)據(jù)量龐大繁多、數(shù)據(jù)類型雜亂無章、數(shù)據(jù)來源四面八方,你就會發(fā)現(xiàn)這些方法特別有用啦!

不要走開,關(guān)于JMP的各種操作,從數(shù)據(jù)導(dǎo)入到各種統(tǒng)計分析和結(jié)果報表的解讀,你所需要的,都將在后續(xù)文章中陸續(xù)推出。敬請期待!


3招教你花式導(dǎo)入Excel數(shù)據(jù)至JMP的評論 (共 條)

分享到微博請遵守國家法律
城口县| 十堰市| 田阳县| 吉木萨尔县| 渭源县| 梅州市| 丹江口市| 雅安市| 崇左市| 洞头县| 大余县| 太和县| 鞍山市| 天祝| 莲花县| 依安县| 甘谷县| 乌兰浩特市| 多伦县| 海原县| 崇文区| 石棉县| 建宁县| 囊谦县| 唐山市| 龙门县| 师宗县| 崇明县| 永德县| 黄梅县| 金平| 梁河县| 陈巴尔虎旗| 遂宁市| 岗巴县| 顺义区| 淳安县| 二连浩特市| 浠水县| 江永县| 沭阳县|