人行征信2.0介紹與特征開發(fā)-長達(dá)15頁新版?zhèn)€人征信報(bào)告完整版曝光

自從2020年1月20號(hào)征信1.0下線之后,之前的各個(gè)使用客戶征信的機(jī)構(gòu)紛紛將自己的征信特征系統(tǒng)切換到征信2.0。還有很多家是使用的征信指標(biāo)做的模型,因?yàn)檫@次征信版本升級(jí)很多內(nèi)容作了更新和完善,邏輯上也產(chǎn)生了很大的出入,因此導(dǎo)致之前的特征庫無法使用,要對(duì)征信2.0重新開發(fā)指標(biāo)。本人在疫情期間完成了征信2.0特征的開發(fā),最近有時(shí)間整理了一下發(fā)出來大致思路希望可以幫助正在做或者使用征信2.0的各位同行。
本文可分為一下幾個(gè)部分:
征信2.0相對(duì)于征信1.0的內(nèi)容的新增及優(yōu)化
征信2.0結(jié)構(gòu)解讀
征信2.0特征開發(fā)
一,征信2.0相對(duì)于征信1.0的內(nèi)容的新增及優(yōu)化
1.增加反欺詐警示,異議信息提示和其他證件標(biāo)識(shí)信息 。人行匯總主體人的金融行為習(xí)慣(主要是借款,還款,申請(qǐng)的習(xí)慣),得出反欺詐警示,給征信使用方一個(gè)匯總類的提示,主要包括防欺詐警示信息,預(yù)留的防欺詐聯(lián)系電話,和防欺詐信息的有效時(shí)間。異議提示信息用來提示征信報(bào)告使用者或者閱讀者報(bào)告存在異議的條數(shù)。新版支持使用身份證、護(hù)照和軍官證查詢。舊版?zhèn)€人征信報(bào)告支持身份證查詢。
2.征信2.0報(bào)告優(yōu)化了報(bào)告的數(shù)字組織結(jié)構(gòu),2.0版本相對(duì)1.0版本重點(diǎn)聚焦在信息內(nèi)容本身,強(qiáng)調(diào)信用報(bào)告本質(zhì)上是一個(gè)數(shù)據(jù)集,而不是1.0簡單的按照頁面展示形式描述報(bào)告的組成結(jié)構(gòu)。
3.基本信息部分新增【就業(yè)狀況】,【電子郵箱】,【國籍】等數(shù)據(jù)項(xiàng)。將手機(jī)號(hào)由一條加至五條,并且有添加時(shí)間。
4.共同還款人信息也會(huì)在征信報(bào)告上體現(xiàn)出來;在信貸交易明細(xì)中,增加授信協(xié)議信息、擔(dān)保信息、以及其他相關(guān)還款責(zé)任等信息。對(duì)于銷戶/結(jié)清賬戶,增加賬戶關(guān)閉日期。如果主體人最近或者某個(gè)時(shí)期頻繁更換手機(jī)號(hào),也能反映當(dāng)時(shí)的原因。

5.增加征信報(bào)告“數(shù)字解讀模塊”,這個(gè)模塊包含報(bào)告主體人人行征信評(píng)分,也就是人行根據(jù)主體人的行為給出的個(gè)人信用得分;相對(duì)位置是指主體人在人行庫里面的位置情況;說明是人行給的對(duì)于得分和相對(duì)位置的解釋。
6.對(duì)于信用款及其貸款的還款記錄時(shí)間拉長為5年,征信1.0為兩年。征信里面的呆賬與逾期等會(huì)在征信里面呆五年,即使你銷戶這些逾期狀態(tài)也會(huì)在明細(xì)里面體現(xiàn)出來。這樣可以讓黑產(chǎn)或者老賴們沒有辦法在短期內(nèi)‘洗白’自己的征信。在征信1.0版本中有了嚴(yán)重逾期行為,只要能夠湊到錢將賬戶欠款還清再將賬戶注銷掉,就可以得到一份“干凈”的征信報(bào)告。

7.信用卡的大額專項(xiàng)分期也會(huì)體現(xiàn)在征信上,在很多車貸、裝修貸等消費(fèi)類型的貸款都會(huì)以信用卡大額分期的方式貸出,在征信1.0不會(huì)體現(xiàn)分期還款金額,而在征信2.0中會(huì)體現(xiàn)還款時(shí)間和還款金額。也就是說這部分金額會(huì)加入到月待還款金額里面去,主體人再申請(qǐng)貸款就要提供更多的流水來覆蓋負(fù)債。
8.刪除了未銷戶貸記卡信息匯總中的‘發(fā)卡機(jī)構(gòu)數(shù)’、‘未結(jié)清貸款信息匯總中的’貸款機(jī)構(gòu)數(shù)等數(shù)據(jù);刪除了公共信息明細(xì)里面‘車輛交易和抵押記錄’和‘養(yǎng)老保險(xiǎn)繳存/發(fā)放記錄’等信息。
9.除了借貸、電信和自來水繳費(fèi)情況,還記錄欠稅、民事裁決、強(qiáng)制執(zhí)行、行政處罰、低保救助、執(zhí)業(yè)資格和行政獎(jiǎng)勵(lì)等信息。進(jìn)一步完善了主題人金融行為與資產(chǎn)情況。
10.根據(jù)央行要求新版征信,各數(shù)據(jù)采集機(jī)構(gòu)T+1上報(bào)更新征信報(bào)告,這樣可以解決很多借款人和黑產(chǎn)利用上報(bào)時(shí)間差向多家銀行和機(jī)構(gòu)同時(shí)申請(qǐng)貸款的可能性,降低了銀行審批的風(fēng)險(xiǎn),以及主體人負(fù)債太高帶來的逾期風(fēng)險(xiǎn)。
二,征信2.0解讀
征信報(bào)告共有24個(gè)模塊,包括婚姻信息、職業(yè)信息、信貸交易信息概要、公共信息概要、借貸賬戶信息等。為了數(shù)據(jù)管理以及后邊征信特征衍生的方便,把這24個(gè)模塊劃分為8大類。以下是展示分類的細(xì)則,后邊特征衍生的過程中也是按照下表的思路進(jìn)行的。

以上信息中一般對(duì)貸款比較實(shí)用且有區(qū)分度的模塊主要集中在信息概要,信貸交易信息明細(xì),查詢記錄模塊,其中查詢記錄模塊對(duì)于大額貸款作用非常大,因?yàn)橐粋€(gè)人的查詢情況可以代表主體人在時(shí)間跨度內(nèi)的資金需求情況和其他機(jī)構(gòu)審批情況,可以做一個(gè)很好的參考維度。具體的特征衍生見下一部分。
三,征信2.0特征衍生
特征衍生部分主要涉及一些開發(fā)思路,因征信特征作為風(fēng)控部門的核心管控資產(chǎn),所以以下內(nèi)容將會(huì)涉及的開發(fā)僅是思路上的分享。
征信2.0中會(huì)有一個(gè)征信分的字段,這個(gè)字段是根據(jù)征信報(bào)告里面的內(nèi)容得出的一個(gè)分?jǐn)?shù),如果自己的業(yè)務(wù)和這個(gè)分相關(guān)性很高(比如IV值0.5),可以用這個(gè)分?jǐn)?shù)做個(gè)規(guī)則出來。但是我在很多場(chǎng)景中發(fā)現(xiàn)這個(gè)分?jǐn)?shù)的IV值其實(shí)最多不到0.2。
征信2.0特征在我遇到的場(chǎng)景中有用的變量主要是來自于信用卡,貸款,查詢?nèi)愋畔⒅?,其中信用卡和貸款這兩個(gè)大模塊的特征衍生一般分為概要類,明細(xì)類兩種情況,其中概要類產(chǎn)生的變量幾乎不用做其他的處理可以直接使用;明細(xì)類可以按照時(shí)間維度做切片處理;查詢類的變量可以做近期查詢統(tǒng)計(jì)以及基于不同類別的機(jī)構(gòu)的統(tǒng)計(jì),然后再做時(shí)間切片的統(tǒng)計(jì)。以下會(huì)列舉幾個(gè)特征名稱希望可以給你思路。

以上就是對(duì)征信2.0的解讀及其特征開發(fā)上的一些心得,后邊也會(huì)寫一篇基于征信特征的風(fēng)控信用模型開發(fā),目前正在整理稿件,敬請(qǐng)期待~

參考文獻(xiàn)
https://zhuanlan.zhihu.com/p/53208816
https://zhuanlan.zhihu.com/p/361972314