【零代碼生信分析小工具】第3更,Lasso回歸模型構(gòu)建,生信必備,超級實(shí)用!

【零代碼生信分析小工具】三更嘍~?~
模型構(gòu)建是生信分析最常見、最常用的一個(gè)分析內(nèi)容,基本覆蓋80%以上的生信文章,但基本上都是用R包來完成的,新手小白上手比較困難。
不過,不用擔(dān)心,小云已經(jīng)想你所想啦,推薦剛?cè)腴T的選手用一些零代碼小工具來解決問題,可以讓大家能更快的上手分析!(ps:感覺對自己有用的小伙伴麻煩點(diǎn)個(gè)關(guān)注哦,布小谷會(huì)多多更新的!)

再安利一下這個(gè)零代碼小工具的分析網(wǎng)站——“云生信在線分析平臺”,它包含200多個(gè)零代碼分析小工具,只需上傳數(shù)據(jù),直接一鍵成圖,超級適合生信小白使用哦。網(wǎng)址:http://www.biocloudservice.com/home.html?,分析平臺開源、注冊登錄后可免費(fèi)使用。

今天分享Lasso回歸模型構(gòu)建小工具(小云前面也推薦了2個(gè)免疫浸潤分析小工具,感興趣的小伙伴點(diǎn)擊文末鏈接就可以觀看啦?。?/strong>,下面跟著小云一起來看看吧!
p?LASSO回歸模型構(gòu)建小工具分析原理
LASSO 全稱 Least absolute shrinkage and selection operator(最小絕對收縮和
選擇算子),特點(diǎn)是在擬合廣義線性模型的同時(shí)進(jìn)行變量篩選和復(fù)雜度調(diào)整。 因此,不論目標(biāo)因變量是連續(xù)的,還是二元或者多元離散的,都可以用?LASSO 回歸建模然后預(yù)測,通過?LASSO Cox 回歸模型獲得的特征基因。因此本軟件基于腫瘤樣本的基因表達(dá)譜并結(jié)合患者生存信息,利用?LASSO 回歸(最小絕對收縮和選擇算子)算法,得到特征基因。用戶只需要輸入表達(dá)矩陣,軟件將自行構(gòu)造LASSO 回歸模型以獲取特征基因,同時(shí)繪制 LASSO 回歸模型圖。
p?操作方法
n?Step 1 :首先打開云生信在線分析平臺,并登錄使用。點(diǎn)擊“自動(dòng)化繪制套索算法回歸模型圖”進(jìn)入小工具頁面:

n?Step 2:進(jìn)入小工具頁面后,可以看到上傳數(shù)據(jù)選項(xiàng),點(diǎn)擊進(jìn)入后,提示上傳數(shù)據(jù)需要“文件名和文件格式需要和示例數(shù)據(jù)一致”?;氐焦ぞ唔撁婵梢愿鶕?jù)左上角輸入數(shù)據(jù)模板制作數(shù)據(jù)。


n?Step 3:點(diǎn)擊“輸入數(shù)據(jù)模板”,進(jìn)入以下頁面,可以看到給出了1個(gè)數(shù)據(jù)模板,點(diǎn)擊數(shù)據(jù)可以在線預(yù)覽和下載。

輸入數(shù)據(jù):表達(dá)矩陣?txt 文件lasso_data.txt
(包括每個(gè)患者的生存狀態(tài)(0=存活,1=死亡)和生存時(shí)間,以及每個(gè)患者樣本中的基因表達(dá)。第一列是生存狀態(tài),第二列是生存時(shí)間,其他列是基因,每一例患者樣本作為行)

n?Step 4:制作好數(shù)據(jù)后,在文件上傳界面上傳所有輸入數(shù)據(jù),點(diǎn)擊上傳文件。再返回到工具主頁面點(diǎn)擊“運(yùn)行自有數(shù)據(jù)”即可跳轉(zhuǎn)到結(jié)果展示頁面。


n?Step 5:LASSO 回歸模型構(gòu)建工具共得到4個(gè)結(jié)果,包括3圖1表,每個(gè)結(jié)果都附帶簡單說明??梢栽诮Y(jié)果展示頁面直接點(diǎn)擊某個(gè)圖進(jìn)入預(yù)覽頁面,也可以直接下載使用。

p?結(jié)果說明
n?LASSO lambda圖:圖中的每一條曲線代表了每一個(gè)自變量系數(shù)的變化軌跡,縱坐標(biāo)是系數(shù)的值,橫坐標(biāo)是log(λ)。

LASSO norm圖:圖中的每一條曲線代表了每一個(gè)自變量系數(shù)的變化軌跡,縱坐標(biāo)是系數(shù)的值,橫坐標(biāo)是?L1 norm。? ? ? ? ? ?

n?LASSO 系數(shù)譜?(lambda.pdf):基于該圖選擇最佳的λ,兩條虛線分別指示了兩個(gè)特殊的λ值:?lambda.min和?lambda.1se 這兩個(gè)值之間的 lambda 都認(rèn)為是合適的。lambda.1se 構(gòu)建的模型最簡單,即使用的基因數(shù)量少,而?lambda.min 則準(zhǔn)確率更高一點(diǎn),使用的基因數(shù)量更多一點(diǎn),默認(rèn)選擇?lambda.min。

n?特征基因表(lasso_gene.txt):通過?LASSO 系數(shù)譜,λ 使用的是 lambda.min 時(shí)篩選得到的特征基因,及基因?qū)?yīng)的相關(guān)系數(shù)。

p?結(jié)語
LASSO 這種方法是在最小二乘基礎(chǔ)上增加了一個(gè)懲罰項(xiàng)來對估計(jì)參數(shù)進(jìn)行壓縮,當(dāng)參數(shù)縮小到小于一個(gè)閾值的時(shí)候,就令它變?yōu)?/span>?0,從而選擇出對因變量影響較大的自變量并計(jì)算出相應(yīng)的回歸系數(shù),最終能得到一個(gè)比較精簡的模型。lasso 回歸簡單來說就是從一堆的基因中找到幾個(gè)關(guān)鍵的用來建?;蛘哳A(yù)測。本軟件通過基于腫瘤樣本的表達(dá)譜及生存信息,利用?lasso 回歸模型的算法來篩選特征基因。設(shè)置參數(shù)少,用戶只需要輸入表達(dá)矩陣,軟件將自行計(jì)算出?lasso 模型中的特征基因,同時(shí)繪制?lasso 回歸模型圖。非常適用于生信新手朋友,感興趣的小伙伴趕快來嘗試一波吧!后面還有更多小工具推薦,敬請期待哦!
