最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

消費(fèi)者人群畫像-信用智能評(píng)分(風(fēng)控建模經(jīng)典案例)

2021-06-14 14:10 作者:python風(fēng)控模型  | 我要投稿

概述

該項(xiàng)目是中國(guó)移動(dòng)公司舉辦模型競(jìng)賽項(xiàng)目,獎(jiǎng)金百萬(wàn)。

賽題信息

隨著社會(huì)信用體系建設(shè)的深入推進(jìn), ? 社會(huì)信用標(biāo)準(zhǔn)建設(shè)飛速發(fā)展,相關(guān)的標(biāo)準(zhǔn)相繼發(fā)布,包括信用服務(wù)標(biāo)準(zhǔn)、信用數(shù)據(jù)釆集和服務(wù)標(biāo)準(zhǔn)、信用修復(fù)標(biāo)準(zhǔn)、城市信用標(biāo)準(zhǔn)、行業(yè)信用標(biāo)準(zhǔn)等在內(nèi)的多層次標(biāo)準(zhǔn)體系亟待出臺(tái),社會(huì)信用標(biāo)準(zhǔn)體系有望快速推進(jìn)。社會(huì)各行業(yè)信用服務(wù)機(jī)構(gòu)深度參與廣告、政務(wù)、涉金融、共享單車、旅游、重大投資項(xiàng)目、教育、環(huán)保以及社會(huì)信用體系建設(shè),社會(huì)信用體系建設(shè)是個(gè)系統(tǒng)工程,通訊運(yùn)營(yíng)商作為社會(huì)企業(yè)中不可缺少的部分同樣需要打造企業(yè)信用評(píng)分體系,助推整個(gè)社會(huì)的信用體系升級(jí)。同時(shí)國(guó)家也鼓勵(lì)推進(jìn)第三方信用服務(wù)機(jī)構(gòu)與政府?dāng)?shù)據(jù)交換,以增強(qiáng)政府公共信用信息中心的核心競(jìng)爭(zhēng)力。

傳統(tǒng)的信用評(píng)分主要以客戶消費(fèi)能力等少數(shù)的維度來(lái)衡量,難以全面、客觀、及時(shí)的反映客戶的信用。中國(guó)移動(dòng)作為通信運(yùn)營(yíng)商擁有海量、廣泛、高質(zhì)量、高時(shí)效的數(shù)據(jù),如何基于豐富的大數(shù)據(jù)對(duì)客戶進(jìn)行智能評(píng)分是中國(guó)移動(dòng)和新大陸科技集團(tuán)目前攻關(guān)的難題。運(yùn)營(yíng)商信用智能評(píng)分體系的建立不僅能完善社會(huì)信用體系,同時(shí)中國(guó)移動(dòng)內(nèi)部也提供了豐富的應(yīng)用價(jià)值,包括全球通客戶服務(wù)品質(zhì)的提升、客戶欠費(fèi)額度的信用控制、根據(jù)信用等級(jí)享受各類業(yè)務(wù)優(yōu)惠等,希望通過(guò)本次建模比賽,征集優(yōu)秀的模型體系,準(zhǔn)確評(píng)估用戶信用分值。

數(shù)據(jù)清單

train_dataset.zip:訓(xùn)練數(shù)據(jù),包含50000行

test_dataset.zip:測(cè)試集數(shù)據(jù),包含50000行

官網(wǎng)鏈接:

datafountain.cn/competi

模型競(jìng)賽獎(jiǎng)勵(lì)包括金錢獎(jiǎng)勵(lì),榮譽(yù)證書和大企業(yè)工作機(jī)會(huì)提供

模型競(jìng)賽評(píng)分方式是MAE,MAE是回歸模型的一個(gè)評(píng)估指標(biāo),因此我們需要建立一個(gè)回歸模型來(lái)解決問(wèn)題。


歡迎各位同學(xué)報(bào)名<python風(fēng)控建模實(shí)戰(zhàn)lendingClub>,學(xué)習(xí)消費(fèi)者人群畫像-信用智能評(píng)分模型競(jìng)賽知識(shí)。

課程對(duì)該項(xiàng)目詳細(xì)講解,包括回歸原理知識(shí),梯度下降,正則化,嶺回歸,Lasso回歸,彈性網(wǎng)絡(luò),支持向量回歸,xgboost回歸,lightgbm回歸,sequencial等多種回歸模型建模和算法比較

課程有調(diào)試好的python腳本,可以直接調(diào)用

課程有完整的訓(xùn)練集,測(cè)試集,和oot數(shù)據(jù),下圖是部分?jǐn)?shù)據(jù)預(yù)覽

數(shù)據(jù)說(shuō)明

本次提供數(shù)據(jù)主要包含用戶幾個(gè)方面信息:身份特征、消費(fèi)能力、人脈關(guān)系、位置軌跡、應(yīng)用行為偏好。字段說(shuō)明如下:
字段列表 ?字段說(shuō)明
用戶編碼 ?數(shù)值 唯一性
用戶實(shí)名制是否通過(guò)核實(shí) ?1為是0為否
用戶年齡 ?數(shù)值
是否大學(xué)生客戶 ?1為是0為否
是否黑名單客戶 ?1為是0為否
是否4G不健康客戶 ?1為是0為否
用戶網(wǎng)齡(月) ?數(shù)值
用戶最近一次繳費(fèi)距今時(shí)長(zhǎng)(月) ?數(shù)值
繳費(fèi)用戶最近一次繳費(fèi)金額(元) ?數(shù)值
用戶近6個(gè)月平均消費(fèi)話費(fèi)(元) ?數(shù)值
用戶賬單當(dāng)月總費(fèi)用(元) ?數(shù)值
用戶當(dāng)月賬戶余額(元) ?數(shù)值
繳費(fèi)用戶當(dāng)前是否欠費(fèi)繳費(fèi) ?1為是0為否
用戶話費(fèi)敏感度 ? 用戶話費(fèi)敏感度一級(jí)表示敏感等級(jí)最大。根據(jù)極值計(jì)算法、葉指標(biāo)權(quán)重后得出的結(jié)果,根據(jù)規(guī)則,生成敏感度用戶的敏感級(jí)別:先將敏感度用戶按中間分值按降序進(jìn)行排序,前5%的用戶對(duì)應(yīng)的敏感級(jí)別為一級(jí):接下來(lái)的15%的用戶對(duì)應(yīng)的敏感級(jí)別為二級(jí);接下來(lái)的15%的用戶對(duì)應(yīng)的敏感級(jí)別為三級(jí);接下來(lái)的25%的用戶對(duì)應(yīng)的敏感級(jí)別為四級(jí);最后40%的用戶對(duì)應(yīng)的敏感度級(jí)別為五級(jí)。
當(dāng)月通話交往圈人數(shù) ?數(shù)值
是否經(jīng)常逛商場(chǎng)的人 ?1為是0為否
近三個(gè)月月均商場(chǎng)出現(xiàn)次數(shù) ?數(shù)值
當(dāng)月是否逛過(guò)福州倉(cāng)山萬(wàn)達(dá) ?1為是0為否
當(dāng)月是否到過(guò)福州山姆會(huì)員店 ?1為是0為否
當(dāng)月是否看電影 ?1為是0為否
當(dāng)月是否景點(diǎn)游覽 ?1為是0為否
當(dāng)月是否體育場(chǎng)館消費(fèi) ?1為是0為否
當(dāng)月網(wǎng)購(gòu)類應(yīng)用使用次數(shù) ?數(shù)值
當(dāng)月物流快遞類應(yīng)用使用次數(shù) ?數(shù)值
當(dāng)月金融理財(cái)類應(yīng)用使用總次數(shù) ?數(shù)值
當(dāng)月視頻播放類應(yīng)用使用次數(shù) ?數(shù)值
當(dāng)月飛機(jī)類應(yīng)用使用次數(shù) ?數(shù)值
當(dāng)月火車類應(yīng)用使用次數(shù) ?數(shù)值
當(dāng)月旅游資訊類應(yīng)用使用次數(shù) ?數(shù)值

深度學(xué)習(xí)sequencial模型建立時(shí),需要安裝Keras包。

下面我們用部分python腳本演示變量的可視化,方便描述性統(tǒng)計(jì)分析

當(dāng)月通話交往圈人數(shù)數(shù)據(jù)可視化


'當(dāng)月旅游資訊類應(yīng)用使用次數(shù)', '當(dāng)月火車類應(yīng)用使用次數(shù)', '當(dāng)月物流快遞類應(yīng)用使用次數(shù)', '當(dāng)月網(wǎng)購(gòu)類應(yīng)用使用次數(shù)', '當(dāng)月視頻播放類應(yīng)用使用次數(shù)', '當(dāng)月金融理財(cái)類應(yīng)用使用總次數(shù)', '當(dāng)月飛機(jī)類應(yīng)用使用次數(shù)', '用戶年齡','用戶當(dāng)月賬戶余額(元)', '用戶賬單當(dāng)月總費(fèi)用(元)', '用戶近6個(gè)月平均消費(fèi)值(元)等多個(gè)變量散點(diǎn)圖繪制。

sns.kdeplot()核密度估計(jì)圖

核密度估計(jì)是概率論上用來(lái)估計(jì)未知的密度函數(shù),屬于非參數(shù)檢驗(yàn),通過(guò)核密度估計(jì)圖可以比較直觀的看出樣本數(shù)據(jù)本身的分布特征

'用戶最近一次繳費(fèi)距今時(shí)長(zhǎng)(月)'和'繳費(fèi)用戶當(dāng)前是否欠費(fèi)繳費(fèi)'變量箱型圖繪制

建立好模型后,得到MAE值為14.88,score為0.629,效果非常好。我們通過(guò)不斷調(diào)參,模型可以得到更好性能。


歡迎各位學(xué)員關(guān)注系列課《python金融風(fēng)控評(píng)分卡模型和數(shù)據(jù)分析》,學(xué)習(xí)更多金融建模知識(shí):


消費(fèi)者人群畫像-信用智能評(píng)分(風(fēng)控建模經(jīng)典案例)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
华池县| 武穴市| 舞钢市| 大名县| 延吉市| 冕宁县| 连州市| 平度市| 保康县| 新郑市| 济宁市| 慈利县| 沙坪坝区| 本溪| 青浦区| 开平市| 汉中市| 江西省| 会泽县| 松滋市| 沙洋县| 色达县| 靖安县| 临海市| 霸州市| 五峰| 普宁市| 阿坝| 邯郸县| 墨竹工卡县| 蕲春县| 晋中市| 绥棱县| 娄底市| 柳林县| 皋兰县| 资源县| 长海县| 武汉市| 麟游县| 五原县|