最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言中使用非凸懲罰函數(shù)回歸(SCAD、MCP)分析前列腺數(shù)據(jù)

2021-07-15 11:01 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=20828?

原文出處:拓端數(shù)據(jù)部落公眾號

本文使用lasso或非凸懲罰擬合線性回歸,GLM和Cox回歸模型的正則化,特別是最小最大凹度懲罰函數(shù)(MCP)和光滑切片絕對偏差懲罰(SCAD),以及其他L2懲罰的選項( “彈性網(wǎng)絡(luò)”)。還提供了用于執(zhí)行交叉驗證以及擬合后可視化,摘要,推斷和預(yù)測的實用程序。

我們研究?前列腺數(shù)據(jù),它具有8個變量和一個連續(xù)因變量,即將進行根治性前列腺切除術(shù)的男性的PSA水平(按對數(shù)尺度):


  1. X <- data$X

  2. y <- data$y

要將懲罰回歸模型擬合到此數(shù)據(jù),執(zhí)行以下操作:

reg(X, y)

此處的默認懲罰是最小最大凹度懲罰函數(shù)(MCP),但也可以使用SCAD和lasso懲罰。這將產(chǎn)生一個系數(shù)路徑,我們可以繪制


  1. plot(fit)

注意,變量一次輸入一個模型,并且在λ的任何給定值下,幾個系數(shù)均為零。要查看系數(shù)是多少,我們可以使用以下?coef?函數(shù):


  1. coef(fit, lambda=0.05)

  2. # (Intercept) ? ? ?lcavol ? ? lweight ? ? ? ? age ? ? ? ?lbph ? ? ? ? svi

  3. # ?0.35121089 ?0.53178994 ?0.60389694 -0.01530917 ?0.08874563 ?0.67256096

  4. # ? ? ? ? lcp ? ? gleason ? ? ? pgg45

  5. # ?0.00000000 ?0.00000000 ?0.00168038

該?summary?方法可用于后選擇推斷:


  1. summary(fit

  2. # MCP-penalized linear regression with n=97, p=8

  3. # At lambda=0.0500:

  4. # -------------------------------------------------

  5. # ? Nonzero coefficients ? ? ? ? : ? 6

  6. # ? Expected nonzero coefficients: ? 2.54

  7. # ? Average mfdr (6 features) ? ?: ? 0.424

  8. #

  9. # ? ? ? ? Estimate ? ? ?z ? ? mfdr Selected

  10. # lcavol ? 0.53179 ?8.880 ?< 1e-04 ? ? ? ?*

  11. # svi ? ? ?0.67256 ?3.945 0.010189 ? ? ? ?*

  12. # lweight ?0.60390 ?3.666 0.027894 ? ? ? ?*

  13. # lbph ? ? 0.08875 ?1.928 0.773014 ? ? ? ?*

  14. # age ? ? -0.01531 -1.788 0.815269 ? ? ? ?*

  15. # pgg45 ? ?0.00168 ?1.160 0.917570 ? ? ? ?*

在這種情況下,?即使調(diào)整了模型中的其他變量之后,lcavol,?svi以及?lweight?顯然與因變量關(guān)聯(lián),同時?lbph,?age和?pgg45?可能只是偶然包括。通常,為了評估模型在λ的各種值下的預(yù)測準確性,將執(zhí)行交叉驗證:


  1. plot(cvfit)

使交叉驗證誤差最小的λ的值由?cvfit$lambda.min給出,在這種情況下為0.017。將coef?在return的輸出?應(yīng)用于?cv.ncvreg?λ的值的系數(shù):


  1. coef

  2. # ?(Intercept) ? ? ? lcavol ? ? ?lweight ? ? ? ? ?age ? ? ? ? lbph ? ? ? ? ?svi

  3. # ?0.494154801 ?0.569546027 ?0.614419811 -0.020913467 ?0.097352536 ?0.752397339

  4. # ? ? ? ? ?lcp ? ? ?gleason ? ? ? ?pgg45

  5. # -0.104959403 ?0.000000000 ?0.005324465

可以通過predict來獲得預(yù)測值?,該選項有多種選擇:


  1. predict(cvfit

  2. # 預(yù)測新觀測結(jié)果的響應(yīng)

  3. # ? ? ? ? 1 ? ? ? ? 2 ? ? ? ? 3 ? ? ? ? 4 ? ? ? ? 5 ? ? ? ? 6

  4. # 0.8304040 0.7650906 0.4262072 0.6230117 1.7449492 0.8449595


  5. # 非零系數(shù)的數(shù)量

  6. # 0.01695

  7. # ? ? ? 7


  8. # 非零系數(shù)的特性

  9. # ?lcavol lweight ? ? age ? ?lbph ? ? svi ? ? lcp ? pgg45

  10. # ? ? ? 1 ? ? ? 2 ? ? ? 3 ? ? ? 4 ? ? ? 5 ? ? ? 6 ? ? ? 8

請注意,原始擬合(至完整數(shù)據(jù)集)的結(jié)果為?cvfit$fit;不必同時調(diào)用兩者?ncvreg?和?cv.ncvreg?分析數(shù)據(jù)集。

如,?plot(cvfit$fit)?將產(chǎn)生與上述相同的系數(shù)路徑圖?plot(fit)?。

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)

7.在R語言中實現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測股票價格

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標


拓端tecdat|R語言中使用非凸懲罰函數(shù)回歸(SCAD、MCP)分析前列腺數(shù)據(jù)的評論 (共 條)

分享到微博請遵守國家法律
大悟县| 大悟县| 邵武市| 新宁县| 南雄市| 白玉县| 桂林市| 永福县| 凤山市| 泰和县| 荥阳市| 黔南| 白玉县| 卢氏县| 祁东县| 义马市| 石泉县| 海丰县| 梁河县| 孟州市| 依兰县| 陕西省| 广灵县| 岐山县| 乐东| 吉林市| 东宁县| 吴桥县| 满洲里市| 临汾市| 体育| 班戈县| 宁安市| 峨山| 新平| 浪卡子县| 拉萨市| 温州市| 龙海市| 合阳县| 定日县|