home credit default risk(捷信違約風險)機器學習模型復(fù)現(xiàn)(論文_畢業(yè)設(shè)計_作業(yè))


你能預(yù)測每個申請人償還貸款的能力嗎?由于信用記錄不足或不存在,許多人難以獲得貸款。而且,不幸的是,這些人經(jīng)常被不可靠的貸方利用,例如高利貸,校園貸。
捷信努力為沒有銀行賬戶的人群擴大金融包容性。為了確保這些服務(wù)不足的人群獲得積極的貸款體驗,捷信利用各種替代數(shù)據(jù)(包括電信和交易信息)來預(yù)測客戶的還款能力。
Home Credit捷信目前正在使用各種統(tǒng)計和機器學習方法進行這些預(yù)測,以幫助他們釋放數(shù)據(jù)的全部潛力。這樣做將確保有能力還款的客戶不會被拒絕,并且貸款的本金、到期日和還款日歷將使他們的客戶獲得成功。

我們團隊提供此項目數(shù)據(jù)集和機器學習復(fù)現(xiàn)代碼。
數(shù)據(jù)集變量上百,樣本量超過30萬,是各種機器學習實驗理想的數(shù)據(jù)集。

我們訓練的模型性能良好,AUC高于0.76.

我們團隊能打破機器學習不可解釋的黑箱,提供變量可解釋性,下圖是top10重要變量。圖中可見ext_source_3,ext_source_2,ext_source_1是非常重要變量捷信的數(shù)據(jù)集中,對外部數(shù)據(jù)源的依賴是非常高的。

我們團隊能提供變量相關(guān)性矩陣,如下圖,諸多變量呈現(xiàn)高相關(guān)性。模型沒必要采用所有變量,為節(jié)約成本可以刪除部分變量。

我們團隊提供變量描述性統(tǒng)計,下圖是各個變量的分布圖匯總。我們可見有的變量呈現(xiàn)正態(tài)分布,有的是左偏態(tài),有的是右偏態(tài)。有的變量還需要進一步細分。

用戶不需要了解數(shù)學,統(tǒng)計學,機器學習,編程等知識即可獲取想要結(jié)果。

我們團隊根據(jù)十年多建模積累專業(yè)經(jīng)驗自動幫助用戶尋找最優(yōu)算法,自動化數(shù)據(jù)預(yù)處理;自動化調(diào)參;專業(yè)化多角度模型驗證;生成專業(yè)模型報告,圖文并茂;


我方團隊還可提供遠程支持,遠程協(xié)助小白用戶搭建和調(diào)試好編程環(huán)境,用于應(yīng)付老師代碼抽查。這節(jié)省用戶大量調(diào)研時間,省時省事。

版權(quán)聲明:文章來自公眾號(python風控模型),未經(jīng)許可,不得抄襲。遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。