R教程 | R語(yǔ)言簡(jiǎn)介

前言
和大家一樣,我也是R語(yǔ)言的學(xué)習(xí)者,本系列文章記錄我的學(xué)習(xí)過(guò)程。學(xué)習(xí)是痛苦的,至少對(duì)我來(lái)說(shuō)是這樣。因此我盡量采用通俗一點(diǎn)的語(yǔ)言描述代碼內(nèi)容,希望大家能夠愉快輕松的閱讀本系列推文。
以往的R系列教程總是先從數(shù)據(jù)結(jié)構(gòu)講起,先說(shuō)理論內(nèi)容總是有些枯燥。所以我們改用Code first教學(xué),直接講代碼。將有關(guān)數(shù)據(jù)結(jié)構(gòu)、向量之類(lèi)的理論內(nèi)容融入在代碼教學(xué)之中,遇到那些問(wèn)題解決哪些問(wèn)題。
大部分示例,來(lái)自于孫振球主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)(第四版)》,公眾號(hào)內(nèi)部回復(fù)“R語(yǔ)言示例”,獲得所有示例數(shù)據(jù)。
本片推文中,我們先認(rèn)識(shí)一下R語(yǔ)言吧!
什么是R語(yǔ)言
R語(yǔ)言可以說(shuō)是專(zhuān)門(mén)為統(tǒng)計(jì)學(xué)而生的語(yǔ)言。1992年,新西蘭奧克蘭大學(xué)的Ross Ihaka 和 Robert Gentleman為了方便的講解統(tǒng)計(jì)學(xué)課程,因而設(shè)計(jì)了這門(mén)語(yǔ)言。兩位教授的名字首字母都是R,因此將這門(mén)語(yǔ)言稱(chēng)作R語(yǔ)言。
R語(yǔ)言的優(yōu)點(diǎn)
與Python一樣,R是一個(gè)開(kāi)源語(yǔ)言,這意味著他有活躍的人群共同開(kāi)發(fā),以便R語(yǔ)言變得更好,2020年R4.0.0發(fā)布時(shí),CRAN上的宏包數(shù)量已經(jīng)達(dá)到了16054個(gè),幾乎所有統(tǒng)計(jì)學(xué)操作都可以找到對(duì)應(yīng)的R包應(yīng)用。
與python的區(qū)別
python是一種通用的編程語(yǔ)言,不僅可以用于數(shù)據(jù)分析,也可以用于其他的計(jì)算機(jī)項(xiàng)目。而R是專(zhuān)門(mén)為統(tǒng)計(jì)學(xué)項(xiàng)目而生的。術(shù)業(yè)有專(zhuān)攻,盡管python的用途更廣,但和深耕統(tǒng)計(jì)學(xué)領(lǐng)域二十余年的R語(yǔ)言相比,還是稍遜一籌。在學(xué)術(shù)領(lǐng)域,R語(yǔ)言幾乎是統(tǒng)計(jì)學(xué)工作者默認(rèn)使用的計(jì)算機(jī)語(yǔ)言。
R的缺點(diǎn)
數(shù)據(jù)管理:R的弱勢(shì)在于數(shù)據(jù)管理,處理大文件時(shí),使用R的速度會(huì)比較慢。這種情況下,可以在其他環(huán)境將數(shù)據(jù)處理好,再導(dǎo)入到R中進(jìn)行分析。熟練的數(shù)據(jù)工作者通常擅長(zhǎng)使用不同種類(lèi)的統(tǒng)計(jì)軟件,發(fā)揮各軟件之所長(zhǎng)。比如另一大統(tǒng)計(jì)軟件SAS,在數(shù)據(jù)管理上就很有優(yōu)勢(shì)。
宏包的可靠性:R官網(wǎng)上有數(shù)以萬(wàn)計(jì)的宏包可供使用,但沒(méi)有專(zhuān)門(mén)的人員進(jìn)行質(zhì)量把關(guān),因此使用上要謹(jǐn)慎。另外,R的版本更新較快,可能會(huì)出現(xiàn)宏包不匹配的情況,低版本下編寫(xiě)的宏包可能不適用與更高版本的R語(yǔ)言。
以上是對(duì)R語(yǔ)言的一個(gè)簡(jiǎn)要介紹,之后要使用的案例數(shù)據(jù)請(qǐng)?jiān)诠娞?hào)后臺(tái)回復(fù)“R語(yǔ)言教程示例”下載
快來(lái)關(guān)注俺?。?!