最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

最新風控模型競賽開始了!金融大數據應用-企業(yè)信貸風險防控-中國建設銀行數據集

2023-03-13 15:32 作者:python風控模型  | 我要投稿

各位朋友,最新金融風控模型競賽開始了!競賽名稱為金融大數據應用:企業(yè)信貸風險防控;組織單位:數字中國建設峰會組委會;中國建設銀行提供模型競賽數據集。


這次模型競賽獎金很高,總獎金160萬元,一等獎八萬元。

賽題背景:
??金融機構的數字化轉型正在如火如荼地進行,人工智能作為數字化轉型的重要手段之一,全方位融合賦能金融行業(yè)的業(yè)務領域和場景應用。目前人工智能技術在金融產品設計、市場營銷、風險控制、客戶服務和其他支持性活動等金融行業(yè)五大業(yè)務鏈環(huán)節(jié)均有滲透,特別是以生物特征識別、機器學習、計算機視覺、知識圖譜等技術賦能下的金融行業(yè),已經衍生出智能營銷、智能身份識別、智能客服等多個金融人工智能典型場景。

?賽題任務
??1.將金融數據與政務數據相結合,可自備行業(yè)數據豐富模型維度。從需求分析、場景設計、解決方案、落地驗證、產品價值多個方面開展創(chuàng)意設計,提交創(chuàng)意解決方案。
??2.企業(yè)信貸風險防控方案。結合企業(yè)數據與公共數據,建立企業(yè)信貸風險分析模型。場景方向可從準入管理、預警監(jiān)控、信貸調整、貸后管理等方面,對企業(yè)各方面的風險進行評估,結合模型及業(yè)務場景設計完整的風險防控方案,提升銀行信貸風險防控能力。

參賽規(guī)則

???參賽人群:大賽面向社會各界開放,不限年齡國籍、高校、科研院所、企業(yè)從業(yè)人員均可登錄官網報名參賽。參與大賽組織工作有關單位員工可參賽但不可獲獎;
???報名要求:每道賽題每人僅能參加一支團隊(1-5人),可同時選擇多道賽題進行參賽,不同賽題可以擁有不同的團隊,報名時所有成員需提供個人基本信息,并通過實名認證;需在組隊截止日期前完成組隊,一旦組隊不可退出隊伍。組隊條件:各成員提交總次數≤開賽天數*3,且一個團隊至少有一名中國籍選手;更多參賽規(guī)則可訪問官網主頁。


數據說明

這次Toby老師也下載了模型競賽數據,觀察這次數據集的變量是公開透明的。這意味著此次模型競賽非常有意義,我們能通過數據挖掘和建模方法找出有價值變量和業(yè)務意義。

下圖是中國建設銀行提供數據集,共47個變量,12萬客戶數據,數據量還算比較大。

??企業(yè)信貸風險防控數據主要包括企業(yè)工商信息、法人基本信息、公積金繳交等金融數據與政務數據(均為模擬數據),數據字典已包含。其中訓練集與測試集可由選手根據方案實際情況自行劃分,選手也可自備數據豐富方案維度。

提交要求

??參賽者須在初賽階段提供解決方案設計說明書(PPT、WORD或PDF格式)和成果模型。內容需包括但不限于:
??背景分析 —— 具有現實意義、面向金融業(yè)實際面對的問題,結合具體情況,分析業(yè)務現狀、當前痛點、難點;
??實施方案 —— 基于背景分析,設計數字化場景,提出可解決問題、降低金融風險、提升客戶體驗的創(chuàng)新思路實施方案;
??數據分析 —— 對數據的選取、使用過程進行分析,包括數據清洗過程、字段篩選、重要性分析等;
??算法分析 —— 對建模使用的具體算法進行分析介紹,包括算法選擇原因、調參過程等進行分析說明;
??作品價值 —— 體現作品的實際落地價值,通過可度量的指標進行體現。

提交示例

??解決方案設計說明書可以是PPT、WORD或PDF格式,文件名以“賽題名稱+團隊名稱+方案名稱”為準。
??如有影音、數據、模型等文件,請打包在同一個文件夾壓縮后進行提交。

評測標準

??大賽主辦方組建大賽專家評審團負責比賽評審工作。
??大賽專家評審團根據各指標比例及對應參考描述,以百分制方式,對參賽者作品進行打分。評審標準暫擬如下,僅供參考,根據大賽實際組織情況調整,以實際評審標準為準。

評分維度作品成熟度技術水準應用潛力答辯表現占比40%30%20%10%

??●?作品成熟度(40%)
??(1)需求分析(10%):具有較強社會意義、金融行業(yè)實際需求的問題,基于對數據的處理分析,結合真實情況,有效把握需求痛點、難點、堵點;
??(2)場景設計(10%):基于需求分析,設計數字化場景,提出可解決問題、減少社會成本、提高效益的創(chuàng)新思路;
??(3)解決方案(10%):基于賽題場景設計,提出符合金融需求的可落地解決方案,形成較完善的分析報告或綜合方案;
??(4)數據使用(10%):對于系統(tǒng)構建所需數據有較清晰的數據清單,其中或包括數據類別、數據格式、數據功能、數據來源等信息,并對數據使用流程做出較清晰規(guī)劃。
??●?技術水準(30%)
??(1)先進性(5%):有效使用云計算、大數據、人工智能等技術,且技術能力領先市場已有應用,具備技術先進性;
??(2)創(chuàng)新性(20%):解決問題的思路、方案具有較強的創(chuàng)新性,與傳統(tǒng)方法有明顯的區(qū)別與升級;
??(3)成熟度(5%):方案深入行業(yè)需求,能夠有效解決行業(yè)痛點問題,并針對未來實施過程中可能遇到的風險問題做出預測,并提出相應預案。
??●?應用潛力(20%)
??(1)實用性(5%):作品方案符合實際使用場景需求,可落地應用,解決真實業(yè)務難題;
??(2)普適性(5%):作品方案具有較強的普適性,可適用于多種場景,解決多類問題;
??(3)社會效益(5%):作品方案實際應用后,可產生較大社會效益,切實助力惠民、興業(yè)、優(yōu)政;
??(4)商業(yè)價值(5%):作品方案可高效率、低費用應用,具有較強的商業(yè)價值、推廣潛力。
??●?答辯表現(10%)
??答辯時儀態(tài)得體,語言表達邏輯清晰,合理解答專家疑問,展現了較為豐富的經驗和專業(yè)的能力。


Toby老師指出這次模型競賽非常open,不是之前以單個指標(accuracy/AUC/F1 score)來排名,而是對參賽者多個方面考察。之前我寫的文章《四川省大學生金融科技建模大賽-模型復現和點評》提出過主辦方改進建議,如下圖。

貌似主辦方看過這篇文章,這次項目的確彌補了之前缺點,堪稱經典。這次比賽非常經典,建議大家都去參與,提高自己建模能力。


開箱測試

Toby老師下載數據后開箱測試,先繪制變量直方圖和相關性熱圖,投石問路。

Toby老師建議大家不要急著建模,先觀察數據分布特征,這類似進攻前的情報收集工作。

Toby老師通過描述性統(tǒng)計,發(fā)現這數據集需要大量預處理工作,對初學者有一定難度。例如時間變量比較多,可以做衍生變量。

此數據集夾雜著錯誤數據,如果參賽者沒有自動化檢測工具,很難發(fā)現里面埋的坑。例如貸款申請時間里有2999年數據,法人出生日期有3019年數據,這是什么東東?

臟數據意味著中國建設銀行復雜數據庫員工工作不仔細,或者故意輸入幾個錯誤數據。臟數據很正常,因為數據量太大了,我們經常遇到。

Toby老師初次建模觀察,模型性能解決完美。如果是經驗不足選手,估計已經高興地暈過去。對于我們來說,模型質量好的可疑,我們要去仔細檢查變量業(yè)務意義。

果不其然,變量存在數據泄露風險。至于什么是數據泄露,請大家閱讀之前我寫的文章《數據泄露-揭秘機器學習模型如何作弊》。

Toby老師通過多輪變量篩選,刪除疑似數據泄露變量后,最后用34個變量建模,模型性能非常棒。通過建模,我發(fā)現數據集存在多個強變量。中國建設銀行擁有這些強變量,風控能力會非常不錯。

Toby老師入模的34個變量中,高相關性變量已經非常少。如果更嚴格一些,這34個變量還可以繼續(xù)篩選。此模型用10-20個變量,足以發(fā)揮優(yōu)秀性能。

如下圖,模型AUC為0.98,當然我可以做的更高,這屬于前幾輪測試數據,模型調參等提高模型性能方法還沒用。

有的變量重要性比較低,但業(yè)務意義比較重要,我還是建議保留,繼續(xù)收集更多數據后觀察實驗。我們建模不能只看統(tǒng)計結果,還要尊重業(yè)務意義。數據建模和業(yè)務意義類似于太極的陰和陽,兩者缺一不可,互相平衡方能發(fā)揮最好效果。


總結

金融大數據應用-企業(yè)信貸風險防控模型競賽是一次非常棒的比賽!鼓勵大家多去參與。如果大家想學習風控建模方法和代碼,可關注Toby老師自研課程《python金融風控評分卡模型和數據分析》。教程包含邏輯回歸,集成樹,神經網絡等常見算法介紹和代碼,有大量實戰(zhàn)案例,模型性能優(yōu)越,適用于論文,作業(yè),專利,模型競賽,企業(yè)模型。歡迎大家收藏,以備工作和學習使用。

如果有更高需求朋友,可給up主留言,例如模型競賽定制需求,我們團隊提供一對一機器學習模型定制服務,提供Python建模代碼,PPT模型文檔,遠程協(xié)助,專業(yè)答疑,正規(guī)發(fā)票和合同。

版權聲明:文章來自公眾號(python風控模型),未經許可,不得抄襲。遵循CC 4.0 BY-SA版權協(xié)議,轉載請附上原文出處鏈接及本聲明。

最新風控模型競賽開始了!金融大數據應用-企業(yè)信貸風險防控-中國建設銀行數據集的評論 (共 條)

分享到微博請遵守國家法律
佳木斯市| 柏乡县| 绥化市| 习水县| 富平县| 潞西市| 渭南市| 剑川县| 乐昌市| 寿宁县| 乐东| 双柏县| 天等县| 太康县| 固镇县| 卢龙县| 德江县| 孟津县| 油尖旺区| 新营市| 自贡市| 白山市| 洛南县| 固始县| 衡阳县| 固安县| 珠海市| 灵山县| 明溪县| 镇巴县| 河西区| 光山县| 舞阳县| 青龙| 枣阳市| 西和县| 奈曼旗| 会同县| 富平县| 东莞市| 楚雄市|