數(shù)據(jù)分享|Python在Scikit-Learn可視化隨機森林中的決策樹分析房價數(shù)據(jù)|附代碼數(shù)據(jù)
原文鏈接:http://tecdat.cn/?p=27050?
最近我們被客戶要求撰寫關(guān)于房價的研究報告,包括一些圖形和統(tǒng)計輸出。
隨機森林是決策樹的集合。在這篇文章中,我將向您展示如何從隨機森林中可視化決策樹?(?點擊文末“閱讀原文”獲取完整代碼數(shù)據(jù)********?)。
首先讓我們在房價數(shù)據(jù)集?(?查看文末了解數(shù)據(jù)獲取方式?)?上訓練隨機森林模型。
加載數(shù)據(jù)并訓練隨機森林。
X?=?pd.DataFrame(data,?columns=feature_names)
讓我們將森林中的樹數(shù)設(shè)置為 100:
RandomForestRegressor(n_estimators=100)
決策樹存儲在?模型list
?中的?estimators_
?屬性中?rf
?。我們可以檢查列表的長度,它應該等于?n_estiamtors
?值。
len(estimators_)>>>?100
我們可以從隨機森林中繪制第一棵決策樹(?0
?列表中有索引):
plot_tree(rf.estimators_[0])

這棵樹太大,無法在一個圖中將其可視化。
點擊標題查閱往期內(nèi)容

【視頻】從決策樹到隨機森林:R語言信用卡違約分析信貸數(shù)據(jù)實例|數(shù)據(jù)分享

左右滑動查看更多

01

02

03

04

讓我們檢查隨機森林中第一棵樹的深度:
tree_.max_depth>>>?16
我們的第一棵樹有?max_depth=16
. 其他樹也有類似的深度。為了使可視化具有可讀性,最好限制樹的深度。讓我們再次訓練隨機森林?max_depth=3
。
第一個決策樹的可視化圖:
plot_tree(rf.estimators_[0])

我們可以可視化第一個決策樹:
viz

概括
我將向您展示如何可視化隨機森林中的單個決策樹??梢酝ㄟ^?estimators_
?列表中的整數(shù)索引訪問樹。有時當樹太深時,值得用?max_depth
?超參數(shù)限制樹的深度。
數(shù)據(jù)獲取
在下面公眾號后臺回復“房價數(shù)據(jù)”,可獲取完整數(shù)據(jù)。

點擊文末?“閱讀原文”
獲取全文完整資料。
本文選自《P?ython在Scikit-Learn可視化隨機森林中的決策樹分析房價數(shù)據(jù)》。


點擊標題查閱往期內(nèi)容
PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯和KMEANS聚類用戶畫像
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預測分析
PYTHON集成機器學習:用ADABOOST、決策樹、邏輯回歸集成模型分類和回歸和網(wǎng)格搜索超參數(shù)優(yōu)化
R語言集成模型:提升樹boosting、隨機森林、約束最小二乘法加權(quán)平均模型融合分析時間序列數(shù)據(jù)
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預測分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機森林分析心臟病數(shù)據(jù)并高維可視化
R語言基于樹的方法:決策樹,隨機森林,Bagging,增強樹
R語言用邏輯回歸、決策樹和隨機森林對信貸數(shù)據(jù)集進行分類預測
spss modeler用決策樹神經(jīng)網(wǎng)絡預測ST的股票
R語言中使用線性模型、回歸決策樹自動組合特征因子水平
R語言中自編基尼系數(shù)的CART回歸決策樹的實現(xiàn)
R語言用rle,svm和rpart決策樹進行時間序列預測
python在Scikit-learn中用決策樹和隨機森林預測NBA獲勝者
python中使用scikit-learn和pandas決策樹進行iris鳶尾花數(shù)據(jù)分類建模和交叉驗證
R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語言用標準最小二乘OLS,廣義相加模型GAM?,樣條函數(shù)進行邏輯回歸LOGISTIC分類
R語言ISLR工資數(shù)據(jù)進行多項式回歸和樣條回歸分析
R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數(shù)量
R語言分位數(shù)回歸、GAM樣條曲線、指數(shù)平滑和SARIMA對電力負荷時間序列預測R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態(tài)可視化
如何用R語言在機器學習中建立集成模型?
R語言ARMA-EGARCH模型、集成預測算法對SPX實際波動率進行預測在python 深度學習Keras中計算神經(jīng)網(wǎng)絡集成模型R語言ARIMA集成模型預測時間序列分析R語言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹、森林分析心臟病患者
R語言基于樹的方法:決策樹,隨機森林,Bagging,增強樹
R語言基于Bootstrap的線性回歸預測置信區(qū)間估計方法
R語言使用bootstrap和增量法計算廣義線性模型(GLM)預測置信區(qū)間
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態(tài)可視化
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預測分析
R語言隨機森林RandomForest、邏輯回歸Logisitc預測心臟病數(shù)據(jù)和可視化分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機森林分析心臟病數(shù)據(jù)并高維可視化
Matlab建立SVM,KNN和樸素貝葉斯模型分類繪制ROC曲線
matlab使用分位數(shù)隨機森林(QRF)回歸樹檢測異常值