最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹檢測(cè)異常值|附代碼數(shù)據(jù)

2023-06-08 22:26 作者:拓端tecdat  | 我要投稿

全文鏈接:http://tecdat.cn/?p=22160?

最近我們被客戶要求撰寫關(guān)于分位數(shù)隨機(jī)森林(QRF)回歸樹的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。

這個(gè)例子展示了如何使用分位數(shù)隨機(jī)林來檢測(cè)異常值

分位數(shù)隨機(jī)林可以檢測(cè)到與給定X的Y的條件分布有關(guān)的異常值。

離群值是一些觀測(cè)值,它的位置離數(shù)據(jù)集中的大多數(shù)其他觀測(cè)值足夠遠(yuǎn),可以認(rèn)為是異常的。離群觀測(cè)的原因包括固有的變異性或測(cè)量誤差。異常值顯著影響估計(jì)和推斷,因此檢測(cè)它們決定是刪除還是穩(wěn)健分析非常重要。

為了演示異常值檢測(cè),此示例:
從具有異方差性的非線性模型生成數(shù)據(jù),并模擬一些異常值。
生長(zhǎng)回歸樹的分位數(shù)隨機(jī)森林。
估計(jì)預(yù)測(cè)變量范圍內(nèi)的條件四分位(Q1、Q2和Q3)和_四分位_距(IQR)。
將觀測(cè)值與邊界進(jìn)行比較,邊界為F1=Q1?1.5IQR和F2=Q3+1.5IQR。任何小于F1或大于F2的觀測(cè)值都是異常值。

生成數(shù)據(jù)

從模型中生成500個(gè)觀測(cè)值

在0 ~ 4π之間均勻分布,εt約為N(0,t+0.01)。將數(shù)據(jù)存儲(chǔ)在表中。

rng('default'); % 為保證重復(fù)性randsample(linspace(0,4*pi,1e6),n,true)';epsilon = randn(n,1).*sqrt((t+0.01));

將五個(gè)觀測(cè)值沿隨機(jī)垂直方向移動(dòng)90%的值。

numOut = 5;Tbl.y(idx) + randsample([-1 1],numOut,true)'.*(0.9*Tbl.y(idx));

繪制數(shù)據(jù)的散點(diǎn)圖并識(shí)別異常值。

plot(Tbl.t,Tbl.y,'.');plot(Tbl.t(idx),Tbl.y(idx),'*');title('數(shù)據(jù)散點(diǎn)圖');legend('數(shù)據(jù)','模擬異常值','Location','NorthWest');

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語言用LOESS(局部加權(quán)回歸)季節(jié)趨勢(shì)分解(STL)進(jìn)行時(shí)間序列異常檢測(cè)

左右滑動(dòng)查看更多

01

02

03

04

生成分位數(shù)隨機(jī)森林

生成200棵回歸樹。

Tree(200,'y','regression');

返回是一個(gè)TreeBagger集合。

預(yù)測(cè)條件四分位數(shù)和四分位數(shù)區(qū)間

使用分位數(shù)回歸,估計(jì)t范圍內(nèi)50個(gè)等距值的條件四分位數(shù)。

linspace(0,4*pi,50)';quantile(pred,'Quantile');

quartile是一個(gè)500 × 3的條件四分位數(shù)矩陣。行對(duì)應(yīng)于t中的觀測(cè)值,列對(duì)應(yīng)于概率。 在數(shù)據(jù)的散點(diǎn)圖上,繪制條件均值和中值因變量。

plot(pred,[quartiles(:,2) meanY]);legend('數(shù)據(jù)','模擬的離群值','中位數(shù)因變量','平均因變量',...

雖然條件均值和中位數(shù)曲線很接近,但模擬的離群值會(huì)影響均值曲線。
計(jì)算條件IQR、F1和F2。

iqr = quartiles(:,3) - quartiles(:,1);f1 = quartiles(:,1) - k*iqr;

k=1.5意味著所有小于f1或大于f2的觀測(cè)值都被認(rèn)為是離群值,但這一閾值并不能與極端離群值相區(qū)分。k為3時(shí),可確定極端離群值。

將觀測(cè)結(jié)果與邊界進(jìn)行比較

繪制觀察圖和邊界。

plot(Tbl.t,Tbl.y,'.');legend('數(shù)據(jù)','模擬的離群值','F_1','F_2');title('使用分位數(shù)回歸的離群值檢測(cè)')

所有模擬的異常值都在[F1,F(xiàn)2]之外,一些觀測(cè)值也在這個(gè)區(qū)間之外。

本文摘選?《?matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹檢測(cè)異常值?》?,點(diǎn)擊“閱讀原文”獲取全文完整資料。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

邏輯回歸、隨機(jī)森林、SVM支持向量機(jī)預(yù)測(cè)心臟病風(fēng)險(xiǎn)數(shù)據(jù)和模型診斷可視化|數(shù)據(jù)分享
貝葉斯分位數(shù)回歸、lasso和自適應(yīng)lasso貝葉斯分位數(shù)回歸分析免疫球蛋白、前列腺癌數(shù)據(jù)
用加性多元線性回歸、隨機(jī)森林、彈性網(wǎng)絡(luò)模型預(yù)測(cè)鮑魚年齡和可視化
PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機(jī)森林、決策樹、支持向量機(jī)、樸素貝葉斯和KMEANS聚類用戶畫像
PYTHON集成機(jī)器學(xué)習(xí):用ADABOOST、決策樹、邏輯回歸集成模型分類和回歸和網(wǎng)格搜索超參數(shù)優(yōu)化
R語言集成模型:提升樹boosting、隨機(jī)森林、約束最小二乘法加權(quán)平均模型融合分析時(shí)間序列數(shù)據(jù)
Python對(duì)商店數(shù)據(jù)進(jìn)行l(wèi)stm和xgboost銷售量時(shí)間序列建模預(yù)測(cè)分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
R語言基于樹的方法:決策樹,隨機(jī)森林,Bagging,增強(qiáng)樹
R語言用邏輯回歸、決策樹和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)
spss modeler用決策樹神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)ST的股票
R語言中使用線性模型、回歸決策樹自動(dòng)組合特征因子水平
R語言中自編基尼系數(shù)的CART回歸決策樹的實(shí)現(xiàn)
R語言用rle,svm和rpart決策樹進(jìn)行時(shí)間序列預(yù)測(cè)
python在Scikit-learn中用決策樹和隨機(jī)森林預(yù)測(cè)NBA獲勝者
python中使用scikit-learn和pandas決策樹進(jìn)行iris鳶尾花數(shù)據(jù)分類建模和交叉驗(yàn)證
R語言里的非線性模型:多項(xiàng)式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語言用標(biāo)準(zhǔn)最小二乘OLS,廣義相加模型GAM?,樣條函數(shù)進(jìn)行邏輯回歸LOGISTIC分類
R語言ISLR工資數(shù)據(jù)進(jìn)行多項(xiàng)式回歸和樣條回歸分析
R語言中的多項(xiàng)式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語言用泊松Poisson回歸、GAM樣條曲線模型預(yù)測(cè)騎自行車者的數(shù)量
R語言分位數(shù)回歸、GAM樣條曲線、指數(shù)平滑和SARIMA對(duì)電力負(fù)荷時(shí)間序列預(yù)測(cè)R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進(jìn)行回歸、分類和動(dòng)態(tài)可視化
如何用R語言在機(jī)器學(xué)習(xí)中建立集成模型?
R語言ARMA-EGARCH模型、集成預(yù)測(cè)算法對(duì)SPX實(shí)際波動(dòng)率進(jìn)行預(yù)測(cè)在python 深度學(xué)習(xí)Keras中計(jì)算神經(jīng)網(wǎng)絡(luò)集成模型R語言ARIMA集成模型預(yù)測(cè)時(shí)間序列分析R語言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹、森林分析心臟病患者
R語言基于樹的方法:決策樹,隨機(jī)森林,Bagging,增強(qiáng)樹
R語言基于Bootstrap的線性回歸預(yù)測(cè)置信區(qū)間估計(jì)方法
R語言使用bootstrap和增量法計(jì)算廣義線性模型(GLM)預(yù)測(cè)置信區(qū)間
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進(jìn)行回歸、分類和動(dòng)態(tài)可視化
Python對(duì)商店數(shù)據(jù)進(jìn)行l(wèi)stm和xgboost銷售量時(shí)間序列建模預(yù)測(cè)分析
R語言隨機(jī)森林RandomForest、邏輯回歸Logisitc預(yù)測(cè)心臟病數(shù)據(jù)和可視化分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
Matlab建立SVM,KNN和樸素貝葉斯模型分類繪制ROC曲線
matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹檢測(cè)異常值


matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹檢測(cè)異常值|附代碼數(shù)據(jù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
马公市| 平果县| 介休市| 堆龙德庆县| 荆门市| 睢宁县| 阳西县| 九龙坡区| 蓬安县| 邹城市| 英山县| 灌云县| 吉水县| 茂名市| 旅游| 乌苏市| 奈曼旗| 马边| 新源县| 赞皇县| 灵台县| 山阴县| 锡林郭勒盟| 崇礼县| 白玉县| 福海县| 永川市| 绥德县| 遵义市| 保靖县| 阳泉市| 鄂托克前旗| 嘉黎县| 靖安县| 平阴县| 彰化县| 本溪| 韶山市| 麦盖提县| 汽车| 阿拉尔市|