最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

Python實戰(zhàn)回歸模型-消費者人群畫像-信用智能評分(基于中國移動用戶數(shù)據)

2022-09-05 16:18 作者:python風控模型  | 我要投稿

什么是回歸模型?

回歸模型提供了一個函數(shù),用于描述一個或多個自變量與響應、因變量或目標變量之間的關系。?

例如,身高和體重之間的關系可以通過線性回歸模型來描述。回歸分析是許多類型預測和確定對目標變量的影響的基礎。當您聽到有關燃料效率、污染原因或屏幕時間對學習影響的新聞研究時,通常會使用回歸模型來支持他們的主張。

圖片


線性回歸

線性回歸是一種模型,其中輸入和輸出之間的關系是一條直線。這是最容易概念化甚至在現(xiàn)實世界中觀察到的。即使關系不是很線性,我們的大腦也會嘗試查看模式并將基本的線性模型附加到該關系。

一個例子可能是對營銷活動的響應數(shù)量。如果我們發(fā)送 1,000 封電子郵件,我們可能會收到 5 封回復。如果可以使用線性回歸對這種關系進行建模,那么當我們發(fā)送 2,000 封電子郵件時,我們預計會收到 10 個回復。您的圖表可能會有所不同,但總體思路是我們將預測變量和目標關聯(lián)起來,并假設兩者之間存在關系。

圖片



模型案例概述

復雜回歸模型包含多個變量,今天我舉一個實戰(zhàn)案例。該項目是中國移動公司舉辦模型競賽項目,獎金百萬。


賽題信息

隨著社會信用體系建設的深入推進, ? 社會信用標準建設飛速發(fā)展,相關的標準相繼發(fā)布,包括信用服務標準、信用數(shù)據釆集和服務標準、信用修復標準、城市信用標準、行業(yè)信用標準等在內的多層次標準體系亟待出臺,社會信用標準體系有望快速推進。社會各行業(yè)信用服務機構深度參與廣告、政務、涉金融、共享單車、旅游、重大投資項目、教育、環(huán)保以及社會信用體系建設,社會信用體系建設是個系統(tǒng)工程,通訊運營商作為社會企業(yè)中不可缺少的部分同樣需要打造企業(yè)信用評分體系,助推整個社會的信用體系升級。同時國家也鼓勵推進第三方信用服務機構與政府數(shù)據交換,以增強政府公共信用信息中心的核心競爭力。

傳統(tǒng)的信用評分主要以客戶消費能力等少數(shù)的維度來衡量,難以全面、客觀、及時的反映客戶的信用。中國移動作為通信運營商擁有海量、廣泛、高質量、高時效的數(shù)據,如何基于豐富的大數(shù)據對客戶進行智能評分是中國移動和新大陸科技集團目前攻關的難題。運營商信用智能評分體系的建立不僅能完善社會信用體系,同時中國移動內部也提供了豐富的應用價值,包括全球通客戶服務品質的提升、客戶欠費額度的信用控制、根據信用等級享受各類業(yè)務優(yōu)惠等,希望通過本次建模比賽,征集優(yōu)秀的模型體系,準確評估用戶信用分值。


數(shù)據清單

train_dataset.zip:訓練數(shù)據,包含50000行

test_dataset.zip:測試集數(shù)據,包含50000行

官網鏈接:

https://www.datafountain.cn/competitions/337

圖片

模型競賽獎勵包括金錢獎勵,榮譽證書和大企業(yè)工作機會提供

圖片
圖片

模型競賽評分方式是MAE,MAE是回歸模型的一個評估指標,因此我們需要建立一個回歸模型來解決問題。

圖片


歡迎各位同學報名<Python實戰(zhàn)金融風控回歸模型(附代碼)>,學習消費者人群畫像-信用智能評分模型競賽知識。


課程對該項目詳細講解,包括回歸原理知識,梯度下降,正則化,嶺回歸,Lasso回歸,彈性網絡,支持向量回歸,xgboost回歸,lightgbm回歸,Keras sequencial等多種回歸模型建模和算法比較


圖片
圖片


課程有調試好的python腳本,可以直接調用

圖片

課程有完整的訓練集,測試集,和oot數(shù)據,下圖是部分數(shù)據預覽

圖片

數(shù)據說明

本次提供數(shù)據主要包含用戶幾個方面信息:身份特征、消費能力、人脈關系、位置軌跡、應用行為偏好。字段說明如下:
字段列表 ?字段說明
用戶編碼 ?數(shù)值 唯一性
用戶實名制是否通過核實 ?1為是0為否
用戶年齡 ?數(shù)值
是否大學生客戶 ?1為是0為否
是否黑名單客戶 ?1為是0為否
是否4G不健康客戶 ?1為是0為否
用戶網齡(月) ?數(shù)值
用戶最近一次繳費距今時長(月) ?數(shù)值
繳費用戶最近一次繳費金額(元) ?數(shù)值
用戶近6個月平均消費話費(元) ?數(shù)值
用戶賬單當月總費用(元) ?數(shù)值
用戶當月賬戶余額(元) ?數(shù)值
繳費用戶當前是否欠費繳費 ?1為是0為否
用戶話費敏感度 ? 用戶話費敏感度一級表示敏感等級最大。根據極值計算法、葉指標權重后得出的結果,根據規(guī)則,生成敏感度用戶的敏感級別:先將敏感度用戶按中間分值按降序進行排序,前5%的用戶對應的敏感級別為一級:接下來的15%的用戶對應的敏感級別為二級;接下來的15%的用戶對應的敏感級別為三級;接下來的25%的用戶對應的敏感級別為四級;最后40%的用戶對應的敏感度級別為五級。
當月通話交往圈人數(shù) ?數(shù)值
是否經常逛商場的人 ?1為是0為否
近三個月月均商場出現(xiàn)次數(shù) ?數(shù)值
當月是否逛過福州倉山萬達 ?1為是0為否
當月是否到過福州山姆會員店 ?1為是0為否
當月是否看電影 ?1為是0為否
當月是否景點游覽 ?1為是0為否
當月是否體育場館消費 ?1為是0為否
當月網購類應用使用次數(shù) ?數(shù)值
當月物流快遞類應用使用次數(shù) ?數(shù)值
當月金融理財類應用使用總次數(shù) ?數(shù)值
當月視頻播放類應用使用次數(shù) ?數(shù)值
當月飛機類應用使用次數(shù) ?數(shù)值
當月火車類應用使用次數(shù) ?數(shù)值
當月旅游資訊類應用使用次數(shù) ?數(shù)值

深度學習sequencial模型建立時,需要安裝Keras包。

圖片

下面我們用部分python腳本演示變量的可視化,方便描述性統(tǒng)計分析

當月通話交往圈人數(shù)數(shù)據可視化


圖片

'當月旅游資訊類應用使用次數(shù)', '當月火車類應用使用次數(shù)', '當月物流快遞類應用使用次數(shù)', '當月網購類應用使用次數(shù)', '當月視頻播放類應用使用次數(shù)', '當月金融理財類應用使用總次數(shù)', '當月飛機類應用使用次數(shù)', '用戶年齡','用戶當月賬戶余額(元)', '用戶賬單當月總費用(元)', '用戶近6個月平均消費值(元)等多個變量散點圖繪制。


圖片



sns.kdeplot()核密度估計圖

核密度估計是概率論上用來估計未知的密度函數(shù),屬于非參數(shù)檢驗,通過核密度估計圖可以比較直觀的看出樣本數(shù)據本身的分布特征



圖片

'用戶最近一次繳費距今時長(月)'和'繳費用戶當前是否欠費繳費'變量箱型圖繪制

圖片

建立好模型后,得到MAE值為14.88,score為0.629,效果非常好。我們通過不斷調參,模型可以得到更好性能。


圖片


歡迎各位學員關注系列課《python金融風控評分卡模型和數(shù)據分析》,學習更多金融建模知識:

版權聲明:文章來自公眾號(python風控模型),未經許可,不得抄襲。遵循CC 4.0 BY-SA版權協(xié)議,轉載請附上原文出處鏈接及本聲明。

Python實戰(zhàn)回歸模型-消費者人群畫像-信用智能評分(基于中國移動用戶數(shù)據)的評論 (共 條)

分享到微博請遵守國家法律
通辽市| 滕州市| 乌拉特中旗| 西盟| 商城县| 石门县| 威远县| 泰和县| 迁西县| 永康市| 偃师市| 英吉沙县| 合水县| 宁南县| 高雄县| 铜鼓县| 彩票| 兴宁市| 沈丘县| 丽水市| 拜城县| 闽侯县| 叶城县| 绵竹市| 河北省| 隆昌县| 六安市| 稷山县| 宁武县| 额济纳旗| 吕梁市| 三台县| 长泰县| 灵武市| 仲巴县| 伊吾县| 定襄县| 巴中市| 密山市| 淳化县| 曲松县|