智能風(fēng)控系統(tǒng)總覽
導(dǎo)讀本文將介紹智能風(fēng)控體系架構(gòu)及其發(fā)展趨勢。文章主要包括以下幾大部分:
1.智能風(fēng)控總體介紹
2.智能風(fēng)控詳細(xì)體系架構(gòu)
數(shù)據(jù)層
特征畫像層
模型算法層
決策應(yīng)用層
3.智能風(fēng)控平臺
4.發(fā)展趨勢展望
分享嘉賓|蔣宏獅橋集團(tuán) 高級風(fēng)控總監(jiān)
編輯整理|飛飛
出品社區(qū)|DataFun
01
智能風(fēng)控體系介紹

智能風(fēng)控是利用大數(shù)據(jù)、人工智能技術(shù)和科學(xué)決策方法,通過自動化預(yù)測、評級和決策等方式,提高風(fēng)控效果和效率、降低成本的一套綜合體系。
智能風(fēng)控包括智能風(fēng)控的方法論,智能風(fēng)控的算法,工程技術(shù)的實(shí)現(xiàn)以及深入業(yè)務(wù)場景的應(yīng)用。
智能風(fēng)控方法包含模型搭建方法、數(shù)據(jù)挖掘方法、風(fēng)控策略制定方法,通過一系列方法,我們可以構(gòu)建智能風(fēng)控的基本架構(gòu)。
智能風(fēng)控算法包括機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)和關(guān)系網(wǎng)絡(luò)等算法,這些算法是方法體系中的核心部件,也是智能風(fēng)控得以展現(xiàn)智能的關(guān)鍵部分。
工程技術(shù)實(shí)現(xiàn)是運(yùn)用智能風(fēng)控的方法論以及智能算法,結(jié)合工程技術(shù),實(shí)現(xiàn)自動化的風(fēng)控決策和智能交互。
應(yīng)用方面,在業(yè)務(wù)流程的全過程中,只要有風(fēng)險點(diǎn)的環(huán)節(jié)都可以加入智能風(fēng)控進(jìn)行決策。根據(jù)不同的業(yè)務(wù)場景靈活的選取模型規(guī)則的組合進(jìn)行自動決策。自動體系要達(dá)到的最終目的是提高企業(yè)風(fēng)控的精準(zhǔn)度和效率,將風(fēng)險控制在合理的范圍內(nèi),減少風(fēng)險損失提高企業(yè)的盈利能力。
02
智能風(fēng)控詳細(xì)體系架構(gòu)

我們可以將智能風(fēng)控體系拆解為圖示的詳細(xì)架構(gòu)。該架構(gòu)包含四層,分別為數(shù)據(jù)層、特征層、模型層和決策層。
如果將整個智能風(fēng)控體系比作一棟建筑,那么數(shù)據(jù)層是智能防控體系最基礎(chǔ)的原材料。我們通過大量的歷史數(shù)據(jù)來訓(xùn)練模型,通過數(shù)據(jù)構(gòu)建特征,通過數(shù)據(jù)作為新決策的判斷輸入。
特征層是智能風(fēng)控的磚瓦,基于數(shù)據(jù)構(gòu)建特征,通過提取數(shù)據(jù)中的關(guān)鍵信息,形成可以用于模型和決策的特征。
模型層是智能風(fēng)控的主體結(jié)構(gòu),通過歷史樣本數(shù)據(jù)和目標(biāo)數(shù)據(jù),利用各類機(jī)器學(xué)習(xí)算法基于豐富的特征,訓(xùn)練出滿足各類業(yè)務(wù)場景的模型。
策略層是智能風(fēng)控的門面,特征和模型最終將服務(wù)于業(yè)務(wù)的特定場景。在不同的業(yè)務(wù)場景參與決策,策略層通過模型和規(guī)則的各種組合完成決策過程。
智能風(fēng)控的每一層,再進(jìn)行橫向劃分,包括關(guān)鍵內(nèi)容、流程步驟、算法方法、工具平臺。
關(guān)鍵內(nèi)容列包含每一層的主體內(nèi)容和重要結(jié)果。
流程步驟列是每一層構(gòu)建關(guān)鍵的內(nèi)容的流程和主要步驟。
算法方法列是構(gòu)建每一層結(jié)果采用的主要智能算法方法。
工具平臺列是包含構(gòu)建流程管理關(guān)鍵結(jié)果的工具,是自動化管理的技術(shù)落地。
以上是整體的智能風(fēng)控的體系架構(gòu)。接下來展開每一層進(jìn)行詳細(xì)介紹。
1. 數(shù)據(jù)層詳解

首先是數(shù)據(jù)層。數(shù)據(jù)是所有智能風(fēng)控的基礎(chǔ),數(shù)據(jù)中包含識別風(fēng)險的信息,智能風(fēng)控數(shù)據(jù)層包含不同類型的數(shù)據(jù)。根據(jù)來源我們可以將數(shù)據(jù)分為其內(nèi)部數(shù)據(jù)和第三方數(shù)據(jù)。以金融風(fēng)控場景中常見的數(shù)據(jù)為例,企業(yè)內(nèi)部數(shù)據(jù)包含基礎(chǔ)信息,比如身份信息、學(xué)歷信息、設(shè)備相關(guān)的信息包含 app 行為數(shù)據(jù)、設(shè)備指紋數(shù)據(jù)等。交易數(shù)據(jù)包含授信記錄數(shù)據(jù)、還款記錄數(shù)據(jù)等。第三方數(shù)據(jù)就更加廣泛,包括多頭借貸數(shù)據(jù)、征信相關(guān)數(shù)據(jù)等。
數(shù)據(jù)處理上,按照處理的實(shí)效性劃分,可以分為實(shí)時計算和離線計算。實(shí)時計算通常是用于實(shí)時決策場景。比如線上金融業(yè)務(wù)的授信審批,需要實(shí)時獲取各類信貸決策的數(shù)據(jù)。離線計算通常用于定時任務(wù),比如信貸風(fēng)控中的貸中風(fēng)控識別場景。從數(shù)據(jù)處理的方式上劃分,可以分為流式數(shù)據(jù)處理和批量數(shù)據(jù)處理。
數(shù)據(jù)處理的步驟通常分為數(shù)據(jù)采集、數(shù)據(jù)校驗、數(shù)據(jù)清洗、數(shù)據(jù)存儲、標(biāo)準(zhǔn)輸出和數(shù)據(jù)監(jiān)控。數(shù)據(jù)采集步驟對企業(yè)內(nèi)部數(shù)據(jù)通常是從業(yè)務(wù)系統(tǒng)產(chǎn)生的數(shù)據(jù)元素獲取需要的數(shù)據(jù)字段。對外是從第三方接口獲取數(shù)據(jù)。數(shù)據(jù)校驗是對數(shù)據(jù)做基本的驗證判斷,確保指定對象的數(shù)據(jù)有效。數(shù)據(jù)清洗是對數(shù)據(jù)做規(guī)范標(biāo)準(zhǔn)化處理,排除異常和雜亂數(shù)據(jù)。數(shù)據(jù)存儲分為線上實(shí)時數(shù)據(jù)和離線數(shù)據(jù)存儲,以滿足不同使用場景和目的。
標(biāo)準(zhǔn)化輸出是將數(shù)據(jù)處理的結(jié)果對外提供使用接口或者其他的查詢服務(wù)。
最后,數(shù)據(jù)監(jiān)控是對整個數(shù)據(jù)處理結(jié)果的過程進(jìn)行監(jiān)控預(yù)警,及時發(fā)現(xiàn)數(shù)據(jù)層的應(yīng)用異常。
那么最后數(shù)據(jù)平臺是數(shù)據(jù)層的支撐工具,通過數(shù)據(jù)平臺來實(shí)現(xiàn)數(shù)據(jù)層的管理。通常數(shù)據(jù)平臺包含內(nèi)外部數(shù)據(jù)接入整合的功能,數(shù)據(jù)管理和服務(wù)的功能,數(shù)據(jù)校驗和監(jiān)控的功能。
2. 特征畫像層詳解

特征是對數(shù)據(jù)的再次加工,將智能風(fēng)控建筑的原材料變成磚瓦。特征是從數(shù)據(jù)中抽取有效的、針對特定目的的部分信息,從數(shù)據(jù)產(chǎn)生特征的過程就是特征挖掘。數(shù)據(jù)質(zhì)量決定了特征質(zhì)量的上限,但是好的特征挖掘過程是盡量的從數(shù)據(jù)中挖掘出最有價值的信息。有些特征是直接從數(shù)據(jù)中獲取的比如性別、年齡、居住區(qū)域這類身份特征和基礎(chǔ)信息特征。另外一些特征就需要對原始數(shù)據(jù)進(jìn)行匯總加工比如借款次數(shù)、額度使用占比等。還有一些特征需要基于關(guān)系圖譜機(jī)器學(xué)習(xí)的方法進(jìn)行深度加工才能提取,比如二度關(guān)系里人的特征、收入指數(shù)、消費(fèi)能力指數(shù)等。
特征提取的方法包括基于統(tǒng)計聚類的 RFM 方法,基于時序特征的提取方法,基于機(jī)器學(xué)習(xí) NLP 圖特征圖算法等特征提取方法。雖然特征提取的方法不同,但是特征提取的關(guān)鍵步驟基本是一致的。
源數(shù)據(jù)分析和清洗是對原始數(shù)據(jù)的流轉(zhuǎn)、時效、質(zhì)量等進(jìn)行分析并清洗處理成標(biāo)準(zhǔn)格式。中間數(shù)據(jù)構(gòu)造是按照不同特征提取的方法構(gòu)建中間數(shù)據(jù)集,比如二分類特征提取方法要求數(shù)據(jù)集為標(biāo)準(zhǔn)的寬表數(shù)據(jù)格式。
特征設(shè)計和生成是根據(jù)不同特征提取方法設(shè)計并生成特征,比如 RFM 特征方法中需要選取特征匯總的不同維度、匯總的對象以及匯總的計算方式。
特征評估是對特征效果進(jìn)行分析,選擇效果好、穩(wěn)定性高的特征。
特征回溯是對歷史數(shù)據(jù)進(jìn)行回測,通常服務(wù)于特征提取后的建模場景。
特征監(jiān)控是對已經(jīng)進(jìn)入使用階段的特征進(jìn)行持續(xù)監(jiān)控以確保有效性和穩(wěn)定性。
特征平臺是為了支撐特征從開發(fā)到應(yīng)用的工具平臺。通常特征平臺包括特征挖掘模塊、特征計算模塊和特征管理模塊。
3. 模型算法層詳解

模型算法層是智能風(fēng)控的核心,是構(gòu)成智能風(fēng)控建筑的主體結(jié)構(gòu)。通過模型算法層實(shí)現(xiàn)智能化的預(yù)測評估。風(fēng)控中典型的場景就是預(yù)測風(fēng)險,計算發(fā)生風(fēng)險的概率,再復(fù)雜的算法本質(zhì)上還是可以理解為概率問題。風(fēng)控場景中的模型有很多種類,這些都是根據(jù)業(yè)務(wù)場景來決定的。金融風(fēng)控場景中我們構(gòu)建模型計算評分來預(yù)測用戶的欺詐概率、違約概率、貸中風(fēng)險發(fā)生的概率、貸后催收回款的概率。在營銷場景中我們構(gòu)建模型來判斷營銷成交轉(zhuǎn)化的概率、識別作弊的概率。在內(nèi)容風(fēng)控場景中構(gòu)建模型來判定內(nèi)容違規(guī)的概率。
模型是機(jī)器學(xué)習(xí)算法構(gòu)建的結(jié)果。為了構(gòu)建模型我們可以選擇的算法是多種多樣的,新的算法也在不斷產(chǎn)生和更新迭代。風(fēng)控領(lǐng)域常用的算法包括基礎(chǔ)算法如邏輯回歸算法、決策樹算法等。集成學(xué)習(xí)算法包括隨機(jī)森林、xgboost 等。深度學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)等等。
算法和場景雖然不同,但是構(gòu)建模型的流程也是基本相似的??梢詣澐譃槿缦?strong>幾個步驟:
問題定義是對業(yè)務(wù)場景的問題進(jìn)行明確和界定。
樣本定義及劃分是選擇合適的樣本定義標(biāo)簽,選擇可用的特征范圍。
模型架構(gòu)設(shè)計是確定算法,確定模型結(jié)構(gòu)。
數(shù)據(jù)準(zhǔn)備與 EDA 是對樣本數(shù)據(jù)進(jìn)行整理探索性分析。檢查樣本的可靠性。
特征選擇是從大量的被選特征當(dāng)中選擇效果好和覆蓋率高的特征。
模型訓(xùn)練與評估是完成模型訓(xùn)練并評估模型效果,此過程可以循環(huán)迭代多次。
模型監(jiān)控是在模型應(yīng)用之后持續(xù)的監(jiān)控,確保模型的有效性和穩(wěn)定性。
模型平臺是支持模型管理的工具。通常模型平臺包括自動建模功能模塊、模型計算功能模塊、模型管理功能模塊。
4. 決策應(yīng)用層詳解

決策應(yīng)用層是整個智能風(fēng)控體系的最后環(huán)節(jié)。這一層針對業(yè)務(wù)場景,基于特征和模型結(jié)果制定決策方案,對最終的業(yè)務(wù)決策和流程產(chǎn)生影響。
策略環(huán)節(jié)通常需要設(shè)計一套決策流程,在流程中的每一個環(huán)節(jié)設(shè)置決策規(guī)則。這些規(guī)則包括直接使用特征制定的規(guī)則和基于模型制定的規(guī)則。通過規(guī)則實(shí)現(xiàn)業(yè)務(wù)流程的通過或者拒絕、差異化的分流等動作。在金融風(fēng)控貸前場景中,通常的決策包括欺詐識別、信用風(fēng)險識別以及其他一些準(zhǔn)入攔截。對于通過的客戶在進(jìn)行差異化的審核操作、差異化的授信額度決策、差異化的定價政策等等。在策略制定的過程中,可以選擇多種的決策算法進(jìn)行支持的,包括決策樹,異常點(diǎn)檢測等等算法來支持我們制定決策規(guī)則,用最優(yōu)化的算法來支持我們進(jìn)行最優(yōu)化決策點(diǎn)的選擇。
風(fēng)控策略制定中最常見的就是進(jìn)行風(fēng)控規(guī)則策略的制定,通常的流程如下:
識別業(yè)務(wù)場景中常見的風(fēng)險點(diǎn)
選擇合適的分析樣本
基于歷史數(shù)據(jù)選擇算法生成規(guī)則
對規(guī)則的有效性和穩(wěn)定性進(jìn)行評估
設(shè)計規(guī)則測試的方案
通常進(jìn)行 AB 實(shí)驗來驗證規(guī)則的效果
對規(guī)則的有效性和穩(wěn)定性進(jìn)行持續(xù)監(jiān)控
決策引擎是支持策略部署執(zhí)行的一個工具。決策引擎通常包括規(guī)則配置、決策流的配置、審批管理等功能模塊。
03
智能風(fēng)控平臺交互邏輯

企業(yè)在風(fēng)控體系搭建的初期,不一定會有標(biāo)準(zhǔn)化的平臺工具來支持。但是隨著企業(yè)智能風(fēng)控體系的這個發(fā)展和成熟,更加高效的方式還是去建立每個功能模塊的平臺化工具。
智能風(fēng)控體系中幾個關(guān)鍵平臺工具之間的交互關(guān)系如上圖所示:
數(shù)據(jù)平臺主要是為特征平臺提供數(shù)據(jù)的輸入,同時,它也支持各類樣本數(shù)據(jù)、分析數(shù)據(jù)的提取。
特征平臺主要是為模型平臺和決策引擎提供特征計算和輸入。
模型平臺主要是為決策引擎提供模型計算結(jié)果的輸入。
決策引擎主要是基于特征平臺和模型平臺的結(jié)果進(jìn)行決策,幾個工具平臺之間的相互依賴和配合,形成了智能風(fēng)控全流程的一個閉環(huán)。
04
發(fā)展趨勢展望

智能風(fēng)控技術(shù)發(fā)展到今天,各種機(jī)器學(xué)習(xí)算法層出不窮。但是這些技術(shù)發(fā)展和其他新鮮事物是一樣的,會從高速發(fā)展逐步進(jìn)入穩(wěn)定期。這個階段新的技術(shù)不會有明顯的顛覆性,更多的是在原有的基礎(chǔ)上進(jìn)行一定的改良。那么現(xiàn)在智能風(fēng)控技術(shù)目前就處于這樣一個階段,但是在應(yīng)用場景上隨著智能風(fēng)控技術(shù)的持續(xù)發(fā)展和應(yīng)用場景的不斷創(chuàng)新探索,智能風(fēng)控會越來越深入到每一個業(yè)務(wù)場景的每一個環(huán)節(jié)。傳統(tǒng)的通過人工完成的大部分工作都可以被智能風(fēng)控技術(shù)所替代。不論是從風(fēng)控識別的效率還是效果上,這類場景智能技術(shù)都比人工更好。但是另一方面,在一些特殊的復(fù)雜度較高的情況下,還是需要一些進(jìn)行人工補(bǔ)充的,尤其是在數(shù)據(jù)量較少、新的風(fēng)險模式變化不確定性又非常大的領(lǐng)域還是有人工發(fā)揮的余地。智能風(fēng)控會占據(jù)大多數(shù)的通用場景,人工是趨于在一些細(xì)分領(lǐng)域或者小眾的場景繼續(xù)發(fā)揮價值。
轉(zhuǎn)載:https://zhuanlan.zhihu.com/p/606891433
作者:Jacky
