最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

機(jī)器學(xué)習(xí)領(lǐng)域最經(jīng)典的算法有哪些?那一定有它——嶺回歸!

2023-07-07 19:00 作者:爾云間  | 我要投稿


談到機(jī)器學(xué)習(xí),不能忽視的就是回歸。今天小云給大家推薦一個(gè)機(jī)器學(xué)習(xí)領(lǐng)域的常青樹——嶺回歸。嶺回歸是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,通過放棄最小二乘法的無(wú)偏性,以損失部分信息、降低精度為代價(jià)獲得回歸系數(shù)更為符合實(shí)際、更可靠的回歸方法,對(duì)病態(tài)數(shù)據(jù)的擬合要強(qiáng)于最小二乘法。怎么樣?是不是有點(diǎn)意思?

小云為今天的學(xué)習(xí)過程準(zhǔn)備了一個(gè)分析案例,使用的數(shù)據(jù)是一個(gè)前列腺癌數(shù)據(jù)集。該數(shù)據(jù)集來源是斯坦福大學(xué)醫(yī)學(xué)中心為接受根治性前列腺切除術(shù)的患者臨床數(shù)據(jù)。共有97個(gè)病人樣本,每個(gè)樣本包含9個(gè)特征。數(shù)據(jù)樣例如下圖所示。其中l(wèi)psa為結(jié)果變量,即為前列腺特異性抗原 (PSA)值的對(duì)數(shù)值,本次分析即為預(yù)測(cè)病人術(shù)后PSA值,以探索PSA水平是否是有效的預(yù)后特征。

這個(gè)數(shù)據(jù)集包含在R中的ElemStatLearn中,小伙伴們可以自行下載哦!話不多少,分析流程開始吧!

#收費(fèi)區(qū)域

加載R包及數(shù)據(jù)

library(ElemStatLearn)

library(caret)

library(glmnet)

data(prostate)

str(prostate)

#數(shù)據(jù)預(yù)處理

展示數(shù)據(jù)后,我們發(fā)現(xiàn)gleason特征有6或者比6大的數(shù)值,為了方便我們將其轉(zhuǎn)換為二分類變量,用0代表6,1代表比6大的數(shù)值。

prostate$gleason<-ifelse(prostate$gleason==6, 0, 1)

#測(cè)試集訓(xùn)練集劃分

train<-subset(prostate, train ==TRUE)[, 1:9]

str(train)

test <-subset(prostate, train==FALSE)[,1:9]

str(test)

#構(gòu)建回歸模型

x <-as.matrix(train[, 1:8])

y <-train[, 9]

#嶺回歸

ridge <-glmnet(x, y, family =“gaussian”, alpha =0)

print(ridge)

#查看系數(shù)和L1范數(shù)的關(guān)系

plot(ridge, label =TRUE)

#查看系數(shù)隨著lambda值變化的趨勢(shì)

plot(ridge, xvar =“l(fā)ambda”, label =TRUE)

#十折交叉驗(yàn)證

cvfit <- cv.glmnet(x, y,nfolds = 10)

plot(cvfit)

#選擇超參數(shù)

print(cvfit$lambda.min) ?#0.001572009

print(cvfit$lambda.1se) ?#0.1367253

#可以查看不同超參數(shù)下模型參數(shù)估計(jì)結(jié)果,此處為0.1

coef(ridge,s=0.1)

#指定測(cè)試數(shù)據(jù)

newx<-as.matrix(test[, 1:8])

#預(yù)測(cè)結(jié)果,此處為了方便指定超參數(shù)為0.1

ridge.y=predict(ridge,newx =newx, type =“response”, s=0.1)

#預(yù)測(cè)結(jié)果與實(shí)際結(jié)果差異可視化

plot(ridge.y , test$lpsa, xlab ="Predicted", ylab ="Actual", main ="Ridge Regression")

結(jié)果總結(jié)

可以看出,整體預(yù)測(cè)結(jié)果基本在0-4范圍的對(duì)角線附近,只有最上方出現(xiàn)了兩個(gè)離群點(diǎn),說明PSA這個(gè)特征可以基本表示病人的臨床水平,可以作為有效特征。但是在實(shí)際情況中,我們建議對(duì)異常值進(jìn)行更深入的研究,以找出它們是否真的與其他數(shù)據(jù)不同。

通過上面的分析案例,屏幕前的你有沒有開始對(duì)嶺回歸感興趣了呢?相信已經(jīng)躍躍欲試了吧!那么快快去試試看,看看嶺回歸能不能給你帶來一些驚喜!(文章結(jié)尾推薦一下小云新開發(fā)的零代碼云生信分析工具平臺(tái)包含超多零代碼小工具,上傳數(shù)據(jù)一鍵出圖,感興趣的小伙伴歡迎來參觀喲,網(wǎng)址:http://www.biocloudservice.com/home.html)


機(jī)器學(xué)習(xí)領(lǐng)域最經(jīng)典的算法有哪些?那一定有它——嶺回歸!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
承德县| 阿坝| 岳阳市| 郧西县| 龙游县| 黄平县| 南京市| 宁乡县| 哈密市| 河间市| 新宁县| 崇左市| 浪卡子县| 洪泽县| 德清县| 南漳县| 汉源县| 日喀则市| 中卫市| 岑溪市| 汨罗市| 友谊县| 芜湖县| 南木林县| 崇仁县| 成安县| 宜川县| 大英县| 乐昌市| 长治市| 富阳市| 大宁县| 呈贡县| 福安市| 盐山县| 辉南县| 正定县| 三台县| 财经| 德安县| 正安县|