最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言信用風(fēng)險(xiǎn)回歸模型中交互作用的分析及可視化

2021-07-19 11:21 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=21892?

原文出處:拓端數(shù)據(jù)部落公眾號

引言

多元統(tǒng)計(jì)分析 中,交互作用是指某因素作用隨其他因素水平的不同而不同,兩因素同時(shí)存在是的作用不等于兩因素單獨(dú)作用之和(相加交互作用)或之積(相乘交互作用)。通俗來講就是,當(dāng)兩個(gè)或多個(gè)因素同時(shí)作用于一個(gè)結(jié)局時(shí),就可能產(chǎn)生交互作用,又稱為效應(yīng)修飾作用(effect modification)。當(dāng)兩個(gè)因素同時(shí)存在時(shí),所導(dǎo)致的效應(yīng)(A)不等于它們單獨(dú)效應(yīng)相加(B+C)時(shí),則稱因素之間存在交互作用。當(dāng)A=B+C時(shí)稱不存在交互效應(yīng);當(dāng)A>B+C時(shí)稱存在正交互作用,又稱協(xié)同作用(Synergy)。
在一個(gè)回歸模型中,我們想寫的是

當(dāng)我們限制為線性模型時(shí),我們寫

或者

但是我們懷疑是否缺少某些因素……比如,我們錯(cuò)過所有可能的交互影響。我們可以交互變量,并假設(shè)

可以進(jìn)一步擴(kuò)展,達(dá)到3階

甚至更多。

假設(shè)我們的變量?

?在這里是定性的,更確切地說是二元的。

信貸數(shù)據(jù)

讓我們舉一個(gè)簡單的例子,使用信貸數(shù)據(jù)集。

Credit數(shù)據(jù)是根據(jù)個(gè)人的銀行貸款信息和申請客戶貸款逾期發(fā)生情況來預(yù)測貸款違約傾向的數(shù)據(jù)集,數(shù)據(jù)集包含24個(gè)維度的,1000條數(shù)據(jù)。

該數(shù)據(jù)集將通過一組屬性描述的人員分類為良好或不良信用風(fēng)險(xiǎn)。
數(shù)據(jù)集將通過一組屬性描述的人員分類為良好或不良信用風(fēng)險(xiǎn)。

建立模型

我們讀取數(shù)據(jù)

db=Credit

我們從三個(gè)解釋變量開始,


  1. reg=glm(Y~X1+X2+X3,data=db,family=binomial)

  2. summary(reg)

沒有交互的回歸長這樣

這里有幾種可能的交互作用(限制為成對的)。進(jìn)行回歸時(shí)觀察到:

交互關(guān)系可視化

我們可以畫一幅圖來可視化交互:我們有三個(gè)頂點(diǎn)(我們的三個(gè)變量),并且可視化了交互關(guān)系


  1. plot(sommetX,sommetY,cex=1,axes=FALSE,xlab="",ylab="",


  2. for(i in 1:nrow(indices)){

  3. segments(sommetX[indices[i,2]],sommetY[indices[i,2]],

  4. text(mean(sommetX[indices[i,2:3]]),mean(sommetY[indices[i,2:3]]),

  5. }


  6. text(sommetX,sommetY,1:k)

這給出了我們的三個(gè)變量

這個(gè)模型似乎是不完整的,因?yàn)槲覀儍H成對地看待變量之間的相互作用。實(shí)際上,這是因?yàn)椋ㄔ谝曈X上)缺少未交互的變量。我們可以根據(jù)需要添加它們


  1. reg=glm(Y~X1+X2+X3+X1:X2+X1:X3+X2:X3,data=db,family=binomial)

  2. k=3

  3. theta=pi/2+2*pi*(0:(k-1))/k

  4. plot(X,Y

  5. for(i in 1:nrow(indices)){

  6. segments(X[indices[i,2]],Y[indices[i,2]],

  7. for(i in 1:k){

  8. cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18),.18)

  9. text(cos(theta)[i]*1.35,sin(theta)[i]*1.35,

  10. points(X,Y,cex=6,pch=1)

這里得到

如果我們更改變量的“含義”(通過重新編碼,通過排列真值和假值),將獲得下圖


  1. glm(Y~X1+X2+X3+X1:X2+X1:X3+X2:X3,data=dbinv,family=binomial)

  2. plot(sommetX,sommetY,cex=1

  3. for(i in 1:nrow(indices)){

  4. segments(sommetX[indices[i,2]]

  5. for(i in 1:k){

  6. cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18)


  7. points(sommetX,sommetY,cex=6,pch=19)

然后可以將其與上一張圖進(jìn)行比較

使用5個(gè)變量,我們增加了可能的交互作用。

然后,我們修改前面的代碼


  1. formule="Y~1"

  2. for(i in 1:k) formule=paste(formule,"+X",i,sep="")

  3. for(i in 1:nrow(indices)) formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")

  4. reg=glm(formule,data=db,family=binomial)

  5. plot(sommetX,sommetY,cex=1

  6. for(i in 1:nrow(indices)){

  7. segments(sommetX[indices[i,2]],sommetY[indices[i,2]],

  8. for(i in 1:k){

  9. cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18)

  10. points(sommetX,sommetY,cex=6

給出了更復(fù)雜的圖,

我們也可以只采用2個(gè)變量,分別取3和4種指標(biāo)。為第一個(gè)提取兩個(gè)指標(biāo)變量(其余形式為參考形式),為第二個(gè)提取三個(gè)指標(biāo)變量,

  1. formule="Y~1"

  2. for(i in 1:k) formule=paste(formule,"+X",i,sep="")

  3. for(i in 1:nrow(indices)formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")

  4. reg=glm(formule,data=db,family=binomial)

  5. for(i in 1:nrow(indices){

  6. if(!is.na(coefficients(reg)[1+k+i])){

  7. segments(X[indices[i,2]],Y[indices[i,2]],

  8. }

  9. for(i in 1:k){

  10. cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18),.18)

  11. text(cos(theta)[i]*1.35,sin(theta)[i]*1.35,

  12. }

我們看到,在左邊的部分(相同變量的三種指標(biāo))和右邊的部分不再有可能發(fā)生交互作用。

我們還可以通過僅可視化顯著交互來簡化圖形。


  1. for(i in 1:nrow(indices)){

  2. if(!is.na(coefficients(reg)[1+k+i])){

  3. if(summary(reg)$coefficients[1+k+i,4]<.1){



在這里,只有一個(gè)交互作用是顯著的,幾乎所有的變量都是顯著的。如果我們用5個(gè)因子重新建立模型,


  1. for(i in 1:nrow(indices))

  2. formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")

  3. reg=glm(formule,data=db,family=binomial)


  4. for(i in 1:nrow(indices){

  5. if(!is.na(coefficients(reg)[1+k+i])){

  6. if(summary(reg)$coefficients[1+k+i,4]<.1){



我們得到

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.在R語言中實(shí)現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測股票價(jià)格

9.R語言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)


拓端tecdat|R語言信用風(fēng)險(xiǎn)回歸模型中交互作用的分析及可視化的評論 (共 條)

分享到微博請遵守國家法律
湟源县| 伊金霍洛旗| 务川| 浙江省| 阿鲁科尔沁旗| 茶陵县| 定结县| 壶关县| 东乡族自治县| 黄陵县| 壶关县| 武城县| 安义县| 砀山县| 吉林省| 嘉峪关市| 牙克石市| 尉氏县| 英超| 古丈县| 汉中市| 南召县| 甘肃省| 新建县| 栾川县| 镶黄旗| 鄄城县| 分宜县| 大洼县| 河曲县| 康平县| 新巴尔虎左旗| 南安市| 江华| 布尔津县| 吉木乃县| 永川市| 丘北县| 炉霍县| 阳谷县| 开原市|