爾云間生信代碼|9+SCI純生信,模型構(gòu)建中的“流量明星”,你不得不知的LASSO
小云編發(fā)現(xiàn)近年來,LASSO應(yīng)用程度較廣。已有大量研究將LASSO算法應(yīng)用于生信文章,有高到20分的SCI。今天,小云給大家分享這篇影響因子 > 9分簡(jiǎn)單純生信文章的代碼。?
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計(jì)50+持續(xù)新增中),也可以點(diǎn)擊右側(cè)【目錄】,可以看到更多有趣的代碼;真香提示:文末可以知道如何獲取代碼~
LASSO回歸的特色:一是對(duì)數(shù)據(jù)的要求是極其低的,無論是一維連續(xù)因變量、多維連續(xù)因變量、非負(fù)次數(shù)因變量、二元離散因變量、多元離散因變,此外,無論因變量是連續(xù)的還是離散的,LASSO都能對(duì)其處理。二是LASSO能夠?qū)ψ兞窟M(jìn)行篩選和對(duì)模型的復(fù)雜程度進(jìn)行降低。而變量篩選是指把所有的變量都放入模型中進(jìn)行擬合,而是有選擇的把變量放入模型從而得到更好的性能參數(shù)。 復(fù)雜度調(diào)整是指通過一系列參數(shù)控制模型的復(fù)雜度,從而避免過度擬合。
LASSO的復(fù)雜程度由λ來控制,λ越大對(duì)變量較多的線性模型的懲罰力度就越大,從而最終獲得一個(gè)變量較少的模型。我們可以通過嘗試若干次不同值下的λ,來選取最優(yōu)λ下的參數(shù)。
小編發(fā)現(xiàn)近年來,LASSO應(yīng)用程度較廣。已有大量研究將LASSO算法應(yīng)用于生信文章,有高到20分的SCI。如下圖。這篇影響因子 > 9分簡(jiǎn)單純生信文章。

但是具體要如何實(shí)現(xiàn)??? 今天,小云以代碼提供的數(shù)據(jù)為例進(jìn)行說明。
代碼具體包括:
Step1輸入數(shù)據(jù)并構(gòu)建LASSO
Step2 CV交叉驗(yàn)證
Step3最佳組合的篩選與繪圖?
下面是代碼中附帶數(shù)據(jù)逐步分析結(jié)果


神奇吧,就是如此簡(jiǎn)單,我們用的都是入門級(jí)函數(shù),稍微懂點(diǎn)R語言就能實(shí)現(xiàn)。
.這是小云做的LASSO回歸模型構(gòu)建,也可以按照粉絲的要求復(fù)現(xiàn)哦,掃碼找我。

如需代碼及示例數(shù)據(jù)等文件,請(qǐng)掃碼聊天框回復(fù) “B28”領(lǐng)??!??
