【R 機(jī)器學(xué)習(xí)案例】Titanic 數(shù)據(jù) Logistic 回歸建模

來(lái)自知乎?@Mr數(shù)據(jù)楊?:
Python機(jī)器學(xué)習(xí)如何正確評(píng)估分類(lèi)模型的準(zhǔn)確性?
https://www.zhihu.com/question/573591611/answer/2810483759
他自己發(fā)個(gè)問(wèn)題就邀請(qǐng)我回答,我一般是懶得回答,真要回答的話(huà),各位看官自己看, 不是看不起 R 機(jī)器學(xué)習(xí)嗎?我把 Python sklearn 案例改用 R mlr3verse 實(shí)現(xiàn),到底哪個(gè)更簡(jiǎn)潔、優(yōu)雅?說(shuō)吊打,夸張嗎?
準(zhǔn)備數(shù)據(jù):

刪除?deck
?和?alive
?列,忽略缺失值,將目標(biāo)變量轉(zhuǎn)化為因子型:

創(chuàng)建任務(wù):
劃分訓(xùn)練集、測(cè)試集:
選擇學(xué)習(xí)器:
Logistic 回歸,超參數(shù)?maxit
?指定 1000 次迭代訓(xùn)練
設(shè)置?predict_type="prob"
?得到預(yù)測(cè)概率,以便繪制 ROC 曲線(xiàn)等
在訓(xùn)練集上訓(xùn)練模型,在測(cè)試集上做預(yù)測(cè)

評(píng)估模型性能






ROC 曲線(xiàn)
autoplot(predictions, type = "roc")


PR 曲線(xiàn)

更多?mlr3verse
?機(jī)器學(xué)習(xí)框架學(xué)習(xí)內(nèi)容,參閱我的知乎專(zhuān)欄:
https://www.zhihu.com/column/c_1450969849791479809
標(biāo)簽: