最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

信用評(píng)分卡

2022-03-08 11:40 作者:python風(fēng)控模型  | 我要投稿

?

在公眾號(hào)「python風(fēng)控模型」里回復(fù)關(guān)鍵字:學(xué)習(xí)資料?

QQ學(xué)習(xí)群:1026993837 領(lǐng)學(xué)習(xí)資料? ?

金融行業(yè)中信用評(píng)分卡的應(yīng)用還是比較普遍的,今天這里把信用評(píng)分卡制作的原理整理一下,在制作評(píng)分卡過(guò)程中,主要應(yīng)用到的公式有WOE(Weight Of Evidence),IV(Information Value),score。整理好原理之后,有時(shí)間的話會(huì)將一套數(shù)據(jù)集和用Python處理的代碼放在這里?,F(xiàn)在手里有R的代碼但是是別人的代碼,我就不共享了。還是等我寫(xiě)好Python的代碼后再附上鏈接吧。

信用評(píng)分卡模型,是多個(gè)離散變量每個(gè)變量對(duì)應(yīng)一個(gè)分值,根據(jù)各項(xiàng)綜合也就是總評(píng)分來(lái)評(píng)估個(gè)人情況的一種模式。

上圖是我隨手百度的一個(gè)信用評(píng)分卡,也就是說(shuō)大分類會(huì)有幾個(gè),每個(gè)大分類下面有幾個(gè)小分類,每個(gè)小分類對(duì)應(yīng)著得分。也就是說(shuō)不管原先是連續(xù)變量還是離散變量,最終模式都要通過(guò)分箱或重分箱轉(zhuǎn)化成離散型。說(shuō)到分箱,這里簡(jiǎn)單提一下,可以通過(guò)等寬等比自定義有監(jiān)督等方法分箱,理論來(lái)看的話可能是有監(jiān)督效果更好一點(diǎn),比如利用CART決策樹(shù),各個(gè)類別即兩節(jié)點(diǎn)邊緣。而WOE得概念應(yīng)用在這里可以恰到好處的使用,WOE是一種將分類變量連續(xù)化的一種方法,它通過(guò)某種方式將變量之間定義出一定的“距離”,生成WOE后按照正常方式建模建立logistic回歸等。

對(duì)于分類變量我們通常采取轉(zhuǎn)換成啞變量的方法進(jìn)行數(shù)據(jù)處理,如定類變量和無(wú)法確定距離的定序變量。而對(duì)于有監(jiān)督的二分類我們可以將定序變量通過(guò)WOE轉(zhuǎn)換成連續(xù)型。

如上圖這里舉了個(gè)小例子,

py1為該分類下y=1占全部y=1數(shù)據(jù)的比例。這里同貝葉斯中的前驗(yàn)和決策樹(shù)中求Entropy的占比是一樣的。WOE反映了該變量中y=1對(duì)y=0的貢獻(xiàn)比重(有些WOE會(huì)乘100)。從中既可以看出違約比例情況,也能看到不同分箱的重要性。接下來(lái)說(shuō)一下上圖中的IV,IV是用來(lái)篩變量的, 信息值(information value)來(lái)表現(xiàn)變量的重要性。

,大于0.5概率很小,小于0.02說(shuō)明基本沒(méi)有幫助,0.1~0.3有較大幫助。之后我們利用logit回歸即可。

logistic回歸過(guò)后我們得到的

,回歸得到的


是各個(gè)指標(biāo)的權(quán)重,也就是各個(gè)指標(biāo)得分的前身。我們將總得分score = offset + factor * lnodds.還有一個(gè)指標(biāo)pdo(points double the odds),就是說(shuō)score + pdo = offset + factor* ln(2odds),odds翻二倍則分?jǐn)?shù)增加pdo。注意一下,一般odds代表優(yōu)比差,而我們?cè)谔幚磉`約情況時(shí)往往取的是-lnodds而不是lnodds,由于通常情況下我們將y1設(shè)定為違約,比如我們希望

[公式]

為1:50而不是50:1.在所有公式中我們給定pdo,odds和score.先說(shuō)pdo,上面兩式做差后pdo = factor *ln2,pdo是給定項(xiàng)則可求factor。那么還剩下offset一個(gè)未知項(xiàng),給定score和odds后(score設(shè)定為總分?jǐn)?shù)最高分,odds設(shè)定為理想中設(shè)定的好壞客戶的比例),求出offset。但是給定后不一定恰到好處,給定值需要根據(jù)需求不斷調(diào)整,直到符合需求情況。那么接下來(lái)我們需要將總分?jǐn)?shù)分配,代入lnodds后有score = offset + factor*(

[公式]

),這里的每一個(gè)x實(shí)際上都是我們求出的WOE或者定類變量的某一項(xiàng),所以各自對(duì)應(yīng)的分?jǐn)?shù)

,于是得到了一張完整的信用評(píng)分卡。

自習(xí)想想信用評(píng)分卡模型其實(shí)還有有很多拓展空間的,比如按背景成績(jī)等分班,分級(jí)等等,當(dāng)然WOE是應(yīng)用于二分類的因?yàn)闊o(wú)法用一個(gè)數(shù)來(lái)表現(xiàn)大于兩個(gè)概率值的比重。評(píng)分卡模型相對(duì)不是太難,易于理解。有時(shí)間的話,敲出代碼在放上來(lái)吧。

轉(zhuǎn)載:https://zhuanlan.zhihu.com/p/35606238

歡迎各位同學(xué)了解《python金融風(fēng)控評(píng)分卡模型和數(shù)據(jù)分析(加強(qiáng)版)》學(xué)習(xí)更多相關(guān)知識(shí)

入口1:https://ke.qq.com/course/package/43071

入口2:https://study.163.com/series/1202915601.htm?share=2&shareId=400000000398149?


信用評(píng)分卡的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
聊城市| 南康市| 牟定县| 大兴区| 武清区| 嫩江县| 连州市| 石渠县| 古田县| 云浮市| 大渡口区| 公安县| 通许县| 宁乡县| 潍坊市| 奉节县| 龙口市| 宜宾县| 仙游县| 荔浦县| 保德县| 韩城市| 城口县| 塔城市| 贵阳市| 丰县| 石台县| 南康市| 鹤峰县| 通辽市| 贵州省| 天峻县| 封丘县| 道真| 宣汉县| 全椒县| 丹阳市| 井陉县| 会同县| 裕民县| 西安市|