最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

R語(yǔ)言非參數(shù)PDF和CDF估計(jì)、非參數(shù)分位數(shù)回歸分析間歇泉、GDP增長(zhǎng)數(shù)據(jù)|附代碼數(shù)據(jù)

2023-04-17 23:52 作者:拓端tecdat  | 我要投稿

全文鏈接:http://tecdat.cn/?p=29841

最近我們被客戶要求撰寫關(guān)于非參數(shù)估計(jì)的研究報(bào)告。在應(yīng)用的設(shè)置中,我們經(jīng)常遇到分類數(shù)據(jù)類型和連續(xù)數(shù)據(jù)類型的組合

熟悉傳統(tǒng)非參數(shù)核平滑方法的人會(huì)明白,這些方法假定基礎(chǔ)數(shù)據(jù)本質(zhì)上是連續(xù)的,但事實(shí)往往并非如此。一種同時(shí)處理連續(xù)數(shù)據(jù)和分類數(shù)據(jù)存在的方法稱為“頻率”方法,其中數(shù)據(jù)被分解為對(duì)應(yīng)于分類變量假設(shè)值的子集(“單元格”),然后才將密度或位置應(yīng)用于每個(gè)單元格中剩余的連續(xù)數(shù)據(jù)。

非參數(shù)頻率方法被廣泛認(rèn)為是不令人滿意的,因?yàn)樗鼈兺ǔ?huì)導(dǎo)致使用樣品分裂引起的大量效率損失。

在本文中,我們通過(guò)許多經(jīng)驗(yàn)應(yīng)用來(lái)說(shuō)明R的使用。選擇每個(gè)應(yīng)用程序是為了在應(yīng)用的環(huán)境中突出顯示特定的計(jì)量經(jīng)濟(jì)學(xué)方法。

非參數(shù)無(wú)條件PDF和 CDF估計(jì)

間歇泉是位于黃石國(guó)家公園的旅游景點(diǎn)。這個(gè)包含 n = 272 次觀測(cè)的著名數(shù)據(jù)集由兩個(gè)變量組成,以分鐘為單位的噴發(fā)持續(xù)時(shí)間(以分鐘為單位)和等待下一次噴發(fā)的時(shí)間(以分鐘為單位)。公園服務(wù)使用此數(shù)據(jù)集來(lái)模擬預(yù)期持續(xù)時(shí)間,具體取決于自上次噴發(fā)以來(lái)經(jīng)過(guò)的時(shí)間量。然而,對(duì)聯(lián)合分布進(jìn)行建模本身就很有意義,并且核估計(jì)器很容易揭示聯(lián)合 PDF 和 CDF 的基本雙峰性質(zhì)。在本例中,我們加載舊的間歇泉數(shù)據(jù)并計(jì)算密度和分布函數(shù)。結(jié)果如圖所示。請(qǐng)注意,在此示例中,我們一步進(jìn)行帶寬選擇和估計(jì)

R> Ful <- npst(~ eruptions + waiting, data = fal) R> summary(f.fful)

R> summary(Fhful)

以下代碼將生成圖。

R> plot(f.fthful

如果用參數(shù)模型(例如二元正態(tài)(對(duì)稱、單峰和單調(diào)遞減)來(lái)模擬這種密度,當(dāng)然無(wú)法揭示核估計(jì)容易揭示的底層結(jié)構(gòu)。

圖 :Old Faithful 數(shù)據(jù)的非參數(shù)多變量 PDF 和 CDF 估計(jì)值。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語(yǔ)言非參數(shù)方法:使用核回歸平滑估計(jì)和K-NN(K近鄰算法)分類預(yù)測(cè)心臟病數(shù)據(jù)

左右滑動(dòng)查看更多

01

02

03

04

非參數(shù)條件PDF和CDF估計(jì)

我們考慮GDP增長(zhǎng),涵蓋1951-1998年期間的21個(gè)地區(qū)??偣灿衝 = 1008個(gè)觀測(cè)值,以及兩個(gè)變量,GDP和年份。首先,我們計(jì)算帶寬。請(qǐng)注意,這可能需要一兩分鐘,具體取決于計(jì)算機(jī)的速度。我們覆蓋搜索方法的默認(rèn)容差,因?yàn)槟繕?biāo)函數(shù)表現(xiàn)良好(當(dāng)然通常不要這樣做),然后我們計(jì)算。請(qǐng)注意,在本例中,我們一步進(jìn)行帶寬選擇和估計(jì)。

R> fat <- npns(gdp ~ year, + tol = 0.1, + ftol = 0.1,

R> Fat <- npst(gdp ~ year, + tol = 0.1, + ftol = 0.1,

圖繪制了 GDP 面板生成的條件 PDF 和 CDF。以下代碼將生成圖 。

R> plot

圖顯示,收入分配已從1950年代初的單峰分配演變?yōu)?990年代的明顯雙峰分配。此結(jié)果對(duì)帶寬選擇具有魯棒性,無(wú)論是使用簡(jiǎn)單的經(jīng)驗(yàn)法則還是數(shù)據(jù)驅(qū)動(dòng)的方法(如可能叉驗(yàn)證)都可以觀察到。核方法很容易揭示這種演變,如果使用收入分配的參數(shù)模型(例如,單峰對(duì)數(shù)正態(tài)分布通常用于模擬收入分配),則很容易被忽略。

非參數(shù)分位數(shù)回歸

我們?cè)俅慰紤]GDP增長(zhǎng)數(shù)據(jù)。首先,我們計(jì)算交叉驗(yàn)證帶寬的可能性(默認(rèn))。我們覆蓋了搜索方法的默認(rèn)容差,因?yàn)槟繕?biāo)函數(shù)表現(xiàn)良好(當(dāng)然,通常不要這樣做)。然后我們使用Li和Racine(2008)的方法計(jì)算結(jié)果的條件分位數(shù)估計(jì)。例如,我們計(jì)算第 25、50 和 75 條件分位數(shù)。請(qǐng)注意,這可能需要一兩分鐘,具體取決于計(jì)算機(jī)的速度。請(qǐng)注意,對(duì)于此示例,我們首先以避免不必要的帶寬對(duì)象重新計(jì)算。

R> bw <- npbw(formula = gdp ~ year, + tol = 0.1, + ftol = 0.1, R> modq0.25 <- nptau = 0.25) R> mo.q0.50 <- nbw, tau = 0.50) R> mod.q0.75 <- npq, tau = 0.75)

圖繪制了生成的分位數(shù)估計(jì)值。以下代碼將生成圖。

R> plotR> lines(It$year, mode.q0.25quantile )

此應(yīng)用程序的一個(gè)很好的功能是解釋變量是有序的,并且每年存在多個(gè)觀測(cè)值。將繪圖函數(shù)與有序數(shù)據(jù)一起使用會(huì)生成一個(gè)箱線圖,該箱線圖很容易顯示非平滑的第 25、50 和 75 個(gè)分位數(shù)。然后可以直接將這些非平滑分位數(shù)估計(jì)值與通過(guò)直接估計(jì)平滑CDF獲得的估計(jì)值進(jìn)行比較,如圖所示。

GDP 面板上的非參數(shù)分位數(shù)回歸。

參考文獻(xiàn)

Aitchison J, Aitken CGG (1976).“核方法的多元二元判別?!鄙镉?jì)量學(xué),63(3),413-420。

Baiocchi G (2006). “Economic Applications of Nonparametric Methods.” Ph.d. thesis, University of York

點(diǎn)擊文末?“閱讀原文”

獲取全文完整代碼數(shù)據(jù)資料。

本文選自《R語(yǔ)言非參數(shù)PDF和CDF估計(jì)、非參數(shù)分位數(shù)回歸分析間歇泉、GDP增長(zhǎng)數(shù)據(jù)》。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹(shù)檢測(cè)異常值
邏輯回歸、隨機(jī)森林、SVM支持向量機(jī)預(yù)測(cè)心臟病風(fēng)險(xiǎn)數(shù)據(jù)和模型診斷可視化|數(shù)據(jù)分享
貝葉斯分位數(shù)回歸、lasso和自適應(yīng)lasso貝葉斯分位數(shù)回歸分析免疫球蛋白、前列腺癌數(shù)據(jù)
用加性多元線性回歸、隨機(jī)森林、彈性網(wǎng)絡(luò)模型預(yù)測(cè)鮑魚(yú)年齡和可視化
PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機(jī)森林、決策樹(shù)、支持向量機(jī)、樸素貝葉斯和KMEANS聚類用戶畫(huà)像
PYTHON集成機(jī)器學(xué)習(xí):用ADABOOST、決策樹(shù)、邏輯回歸集成模型分類和回歸和網(wǎng)格搜索超參數(shù)優(yōu)化
R語(yǔ)言集成模型:提升樹(shù)boosting、隨機(jī)森林、約束最小二乘法加權(quán)平均模型融合分析時(shí)間序列數(shù)據(jù)
Python對(duì)商店數(shù)據(jù)進(jìn)行l(wèi)stm和xgboost銷售量時(shí)間序列建模預(yù)測(cè)分析
R語(yǔ)言用主成分PCA、?邏輯回歸、決策樹(shù)、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
R語(yǔ)言基于樹(shù)的方法:決策樹(shù),隨機(jī)森林,Bagging,增強(qiáng)樹(shù)
R語(yǔ)言用邏輯回歸、決策樹(shù)和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)
spss modeler用決策樹(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)ST的股票
R語(yǔ)言中使用線性模型、回歸決策樹(shù)自動(dòng)組合特征因子水平
R語(yǔ)言中自編基尼系數(shù)的CART回歸決策樹(shù)的實(shí)現(xiàn)
R語(yǔ)言用rle,svm和rpart決策樹(shù)進(jìn)行時(shí)間序列預(yù)測(cè)
python在Scikit-learn中用決策樹(shù)和隨機(jī)森林預(yù)測(cè)NBA獲勝者
python中使用scikit-learn和pandas決策樹(shù)進(jìn)行iris鳶尾花數(shù)據(jù)分類建模和交叉驗(yàn)證
R語(yǔ)言里的非線性模型:多項(xiàng)式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語(yǔ)言用標(biāo)準(zhǔn)最小二乘OLS,廣義相加模型GAM?,樣條函數(shù)進(jìn)行邏輯回歸LOGISTIC分類
R語(yǔ)言ISLR工資數(shù)據(jù)進(jìn)行多項(xiàng)式回歸和樣條回歸分析
R語(yǔ)言中的多項(xiàng)式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語(yǔ)言用泊松Poisson回歸、GAM樣條曲線模型預(yù)測(cè)騎自行車者的數(shù)量
R語(yǔ)言分位數(shù)回歸、GAM樣條曲線、指數(shù)平滑和SARIMA對(duì)電力負(fù)荷時(shí)間序列預(yù)測(cè)R語(yǔ)言樣條曲線、決策樹(shù)、Adaboost、梯度提升(GBM)算法進(jìn)行回歸、分類和動(dòng)態(tài)可視化
如何用R語(yǔ)言在機(jī)器學(xué)習(xí)中建立集成模型?
R語(yǔ)言ARMA-EGARCH模型、集成預(yù)測(cè)算法對(duì)SPX實(shí)際波動(dòng)率進(jìn)行預(yù)測(cè)在python 深度學(xué)習(xí)Keras中計(jì)算神經(jīng)網(wǎng)絡(luò)集成模型R語(yǔ)言ARIMA集成模型預(yù)測(cè)時(shí)間序列分析R語(yǔ)言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹(shù)、森林分析心臟病患者
R語(yǔ)言基于樹(shù)的方法:決策樹(shù),隨機(jī)森林,Bagging,增強(qiáng)樹(shù)
R語(yǔ)言基于Bootstrap的線性回歸預(yù)測(cè)置信區(qū)間估計(jì)方法
R語(yǔ)言使用bootstrap和增量法計(jì)算廣義線性模型(GLM)預(yù)測(cè)置信區(qū)間
R語(yǔ)言樣條曲線、決策樹(shù)、Adaboost、梯度提升(GBM)算法進(jìn)行回歸、分類和動(dòng)態(tài)可視化
Python對(duì)商店數(shù)據(jù)進(jìn)行l(wèi)stm和xgboost銷售量時(shí)間序列建模預(yù)測(cè)分析
R語(yǔ)言隨機(jī)森林RandomForest、邏輯回歸Logisitc預(yù)測(cè)心臟病數(shù)據(jù)和可視化分析
R語(yǔ)言用主成分PCA、?邏輯回歸、決策樹(shù)、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
Matlab建立SVM,KNN和樸素貝葉斯模型分類繪制ROC曲線
matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹(shù)檢測(cè)異常值


R語(yǔ)言非參數(shù)PDF和CDF估計(jì)、非參數(shù)分位數(shù)回歸分析間歇泉、GDP增長(zhǎng)數(shù)據(jù)|附代碼數(shù)據(jù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
子长县| 新晃| 兰西县| 富源县| 永嘉县| 龙里县| 洪洞县| 邓州市| 平泉县| 新乡县| 芒康县| 武安市| 武宁县| 遂溪县| 肃北| 黎城县| 崇阳县| 巴中市| 区。| 伊通| 峨边| 西城区| 清苑县| 太谷县| 和林格尔县| 霞浦县| 濉溪县| 绥化市| 北票市| 车致| 闽侯县| 大港区| 温州市| 安庆市| 隆昌县| 天峻县| 井陉县| 临邑县| 民县| 石门县| 札达县|