大數(shù)據(jù)風(fēng)控中用戶行為數(shù)據(jù)的采集、分析及應(yīng)用
風(fēng)險控制是數(shù)據(jù)挖掘中最為常見的應(yīng)用,通常通過以往歷史數(shù)據(jù)判斷用戶違約的概率。
?
據(jù)統(tǒng)計,銀行傳統(tǒng)風(fēng)控模型對市場上70%的客戶有效,但另外30%的用戶,其風(fēng)控模型效果大打折扣。
大數(shù)據(jù)風(fēng)控作為補充,利用行為數(shù)據(jù)來實施風(fēng)險控制,可作為另外的30%客戶風(fēng)控的有效補充。
?
那么,大數(shù)據(jù)風(fēng)控中,是如何進行行業(yè)數(shù)據(jù)分析的呢?
?
首先,讓我們了解一下風(fēng)控模型的開發(fā)流程
?
↘???????數(shù)據(jù)抽取
↘???????數(shù)據(jù)探索
↘???????建模數(shù)據(jù)準(zhǔn)備
↘???????變量選擇
↘???????模型開發(fā)與驗證
↘???????模型部署
?
?
接下來,以個人信用評分為例,看看哪些用戶行為數(shù)據(jù)能夠進行進行統(tǒng)計分析
?
在用戶行為數(shù)據(jù)中,風(fēng)控效果最好的是用戶個人金融屬性數(shù)據(jù),例如:
↘???????年齡
↘???????收入
↘???????職業(yè)
↘???????學(xué)歷
↘???????資產(chǎn)
↘???????負(fù)債
這些數(shù)據(jù)信用相關(guān)度高,還可以有效的反映用戶還款能力和還款意愿。
?
除此之外,部分用戶行為數(shù)據(jù)對于信用風(fēng)險評估也具有較大的影響,甚至在某些條件下這些行為數(shù)據(jù)是決定用戶信用風(fēng)險事件的強相關(guān)因素。
?
過去,這類用戶行為數(shù)據(jù)并沒有被信用風(fēng)險評估模型采用,也沒有參與客戶的信用風(fēng)險評估。然而,隨是互聯(lián)網(wǎng)日漸成熟,金融企業(yè)、互聯(lián)網(wǎng)金融企業(yè)在信用風(fēng)險事件事后分析中發(fā)現(xiàn),用戶行為信息在多次風(fēng)險事件中起到關(guān)鍵的作用。
?
用戶行為數(shù)據(jù)產(chǎn)生于互聯(lián)系金融的的各個環(huán)節(jié)。物以類聚、人以群分,一些群體性的行為特征規(guī)律是值得關(guān)注的,因此,通過標(biāo)簽獲取的用戶行為數(shù)據(jù),通常傾向于分析用戶群體的規(guī)律行為的相近性判斷。
? ? ? ? ? ?
行為數(shù)據(jù)在風(fēng)控中的應(yīng)用
?
用戶畫像
用戶畫像即為用戶打標(biāo)簽,區(qū)分不同屬性的用戶。如:
↘???????性別標(biāo)簽
↘???????年齡標(biāo)簽
↘???????消費偏好標(biāo)簽
?
用戶畫像包括人口統(tǒng)計學(xué)特征、消費能力數(shù)據(jù)、興趣數(shù)據(jù)、風(fēng)險偏好;企業(yè)客戶畫像包括企業(yè)的生產(chǎn)、流通、運營、財務(wù)、銷售和客戶數(shù)據(jù)、相關(guān)產(chǎn)業(yè)鏈上下游等數(shù)據(jù)。
用戶畫像在電商行業(yè)被廣泛運用。其原理是通過樣本數(shù)據(jù)分析不同標(biāo)簽用戶的行為特征,再根據(jù)分析獲得到的知識對未知標(biāo)簽的用戶進行分類。
?
用戶畫像在互聯(lián)網(wǎng)金融的風(fēng)險控制上可用于征信評級,反欺詐風(fēng)險控制、動態(tài)調(diào)整級別和監(jiān)控(增收和降低壞賬率)、快速放貸等業(yè)務(wù)中。
金融機構(gòu)擁有的客戶信息并不全面,基于平臺自身擁有的數(shù)據(jù)有時候難以得出理想的結(jié)果,甚至可能得出錯誤結(jié)論。
因此,大部分的金融機構(gòu)不僅僅收集自身業(yè)務(wù)中產(chǎn)生的用戶數(shù)據(jù),己經(jīng)開始整合更多其它渠道的行為數(shù)據(jù),更全面的對客戶進行了解,豐富用戶畫像。
?
例如:
↘???????社交媒體上的行為數(shù)據(jù)(光大銀行就建立了社交網(wǎng)絡(luò)信息數(shù)據(jù)庫)。
↘???????客戶在電商網(wǎng)站的交易數(shù)據(jù),如建設(shè)銀行將自己的電子商務(wù)平臺和信貸業(yè)務(wù)結(jié)合起來
↘???????企業(yè)客戶的產(chǎn)業(yè)鏈上下游數(shù)據(jù)。
可以看到,對于個人,銀行打通內(nèi)外部數(shù)據(jù),與社會化數(shù)據(jù)融合,獲得更完整的用戶拼圖,從而為更精準(zhǔn)的用戶營銷服務(wù);
同時,對于企業(yè)客戶,銀行也在收集企業(yè)所在的產(chǎn)業(yè)鏈上下游的數(shù)據(jù),掌握企業(yè)的外部環(huán)境發(fā)展情況,從而預(yù)測企業(yè)未來的狀況;
?
風(fēng)險管理的核心是反欺詐。通過分析用戶社保數(shù)據(jù)、運營商數(shù)據(jù)、網(wǎng)絡(luò)行為數(shù)據(jù)(職業(yè)、收入等預(yù)測)進行規(guī)避己經(jīng)十分普遍。
?
實時監(jiān)控系統(tǒng)內(nèi)的各類數(shù)據(jù),通過實時分析數(shù)據(jù)結(jié)論監(jiān)測潛在風(fēng)險并做好預(yù)警防范。如:
用戶操作
交易流水
訪問記錄
某內(nèi)部工作人員在某段時間內(nèi)操作存貸/匯交易的時間大幅度快于其歷史水平;
?
通過對用戶行為數(shù)據(jù)的采集和分析,找出欺詐者留下的蛛絲馬跡,預(yù)防欺詐行為的發(fā)生。其現(xiàn)實意義在于在欺詐行為發(fā)生之前就將其制止。