最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語言使用虛擬變量(Dummy Variables) 回歸分析工資影響因素

2021-08-07 09:50 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=23170?

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

簡(jiǎn)介

本文與以下兩個(gè)問題有關(guān)。你應(yīng)該如何添加虛擬變量?你應(yīng)該如何解釋結(jié)果?

如果使用一個(gè)例子,我們可能會(huì)更容易理解這些問題。

數(shù)據(jù)

假設(shè)我們想研究工資是如何由教育、經(jīng)驗(yàn)和某人是否擔(dān)任管理職務(wù)決定的。假設(shè)

  1. 每個(gè)人都從年薪4萬開始。

  2. 實(shí)踐出真知。每增加一年的經(jīng)驗(yàn),工資就增加5千。

  3. 你學(xué)得越多,你的收入就越多。高中、大學(xué)和博士的年薪增長分別為0、10k和20k。

  4. 海面平靜時(shí),任何人都可以掌舵。對(duì)于擔(dān)任管理職位的人,要多付20k。

  5. 天生就是偉大的領(lǐng)導(dǎo)者。對(duì)于那些只上過高中卻擔(dān)任管理職位的人,多給他們3萬。

  6. 隨機(jī)因素會(huì)影響工資,平均值為0,標(biāo)準(zhǔn)差為5千。

下面是部分?jǐn)?shù)據(jù)和摘要。

繪制數(shù)據(jù)

有和沒有管理職位的人的工資和教育之間的關(guān)系。

  1. jitter(alpha=0.25,color=colpla[4])+

  2. facet_wrap(~管理職位)+

  3. boxplot(color=colpla[2])

有管理職位和沒有管理職位的人的工資和經(jīng)驗(yàn)之間的關(guān)系,以教育為基礎(chǔ)。

  1. stat_smooth(method = "lm")+

  2. facet_wrap(~管理職位)

回歸分析

忽略教育和管理之間的相互作用

我們只將工資與教育、經(jīng)驗(yàn)和管理職位進(jìn)行回歸。其結(jié)果是?

雖然這些參數(shù)在統(tǒng)計(jì)學(xué)上是有意義的,但這并沒有任何意義。與高中相比,大學(xué)學(xué)歷怎么可能使你的工資減少5105?

正確的模型應(yīng)該包括教育和管理職位的交互項(xiàng)。

添加教育和管理之間的交互作用

現(xiàn)在,讓我們添加教育和管理之間的交互項(xiàng),看看會(huì)發(fā)生什么。

對(duì)結(jié)果的解釋

現(xiàn)在的結(jié)果是有意義的。

  • 截距為40137(接近4萬)是基本保障收入。

  • 教育的基數(shù)是高中。與高中相比,大學(xué)教育可以平均增加9833元(接近1萬)的工資。與高中相比,博士教育可以增加19895元(接近2萬)的工資。

  • 多一年的工作經(jīng)驗(yàn)可以使工資增加4983元(接近5千)。

  • 擔(dān)任管理職位的高中畢業(yè)生有49695元的溢價(jià)(接近5萬)。這些人是天生的領(lǐng)導(dǎo)者。

  • 與擔(dān)任管理職位的高中畢業(yè)生相比,擔(dān)任管理職位的大學(xué)畢業(yè)生的溢價(jià)減少了29965.51至29571(49735.74-29965.51,接近2萬)。

  • 與高中畢業(yè)生擔(dān)任管理職位相比,博士畢業(yè)生擔(dān)任管理職位的溢價(jià)減少了29501至19952.87(接近2萬)。另外,你可以說管理職位產(chǎn)生了20K的基本溢價(jià),而不考慮教育水平。除了這2萬外,高中畢業(yè)生還能得到3萬,使總溢價(jià)增加到5萬。

檢驗(yàn)是否違反了模型的假設(shè)

為了使我們的模型有效,我們需要滿足一些假設(shè)。

  • 誤差應(yīng)該遵循正態(tài)分布

正態(tài)Q-Q圖看起來是線性的。所以這個(gè)假設(shè)得到了滿足。

  • 沒有自相關(guān)

D-W檢驗(yàn)值為1.8878,接近2,因此,這個(gè)假設(shè)也滿足。

  • 沒有多重共線性

預(yù)測(cè)變量edu、exp和mngt的VIF值均小于5,因此滿足這一假設(shè)。

用數(shù)據(jù)的子集進(jìn)行回歸

你可以通過用一個(gè)數(shù)據(jù)子集運(yùn)行模型來獲得同樣的結(jié)果。你可以將數(shù)據(jù)按教育程度分成子集,并在每個(gè)子集上運(yùn)行回歸模型,而不是使用一個(gè)教育的虛擬變量。

如果只用高中生的數(shù)據(jù),你會(huì)得到這樣的結(jié)果。

  1. sub<-d %>%

  2. + ? filter(教育=="高中")

僅憑大學(xué)生的數(shù)據(jù),你就能得到這個(gè)結(jié)果。

只用來自博士生的數(shù)據(jù),你會(huì)得到這個(gè)結(jié)果。

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言混合效應(yīng)邏輯回歸Logistic模型分析肺癌

6.r語言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機(jī)森林算法預(yù)測(cè)心臟病

8.python用線性回歸預(yù)測(cè)股票價(jià)格

9.R語言用邏輯回歸、決策樹和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)


拓端tecdat|R語言使用虛擬變量(Dummy Variables) 回歸分析工資影響因素的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
江门市| 北京市| 内乡县| 新平| 黄石市| 新龙县| 神木县| 津南区| 石林| 余江县| 任丘市| 城步| 曲松县| 成都市| 桂林市| 攀枝花市| 南宁市| 肥城市| 集贤县| 铜鼓县| 庆云县| 突泉县| 山阳县| 济宁市| 九江县| 永丰县| 长垣县| 阿荣旗| 定边县| 赞皇县| 大竹县| 吴江市| 临西县| 吴川市| 香港| 廊坊市| 游戏| 上思县| 汉沽区| 汶上县| 洞口县|