最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

使用SAS Enterprise Miner進(jìn)行數(shù)據(jù)挖掘:信用評分構(gòu)建評分卡模型

2021-02-19 13:44 作者:拓端tecdat  | 我要投稿

原文http://tecdat.cn/?p=3348

?

標(biāo)簽:

  • 數(shù)據(jù)挖掘

  • 風(fēng)險管理

  • 技巧和竅門

信用記分卡一直是信用評分的標(biāo)準(zhǔn)模型,因?yàn)樗鼈円子诶斫?,使您能夠輕松評分新數(shù)據(jù)-即計算新客戶的信用評分。本文將指導(dǎo)您完成使用Credit SCOring for SAS? EnterpriseMiner?開發(fā)的信用記分卡的基本步驟,這是我將在信用評分中發(fā)布的一系列技巧中的第一個。

建立記分卡用于構(gòu)建信用記分卡的基本流程圖中的節(jié)點(diǎn)包括:輸入數(shù)據(jù)源,數(shù)據(jù)分區(qū),交互式分組和記分卡。在本例中,您可以使用SAS Enterprise Miner的“幫助”菜單中提供的德語信用數(shù)據(jù)集。單擊Help-> Generate Sample Data Source - > German Credit。該數(shù)據(jù)集具有二元目標(biāo)good_bad,其指示客戶是否默認(rèn)其每月付款(指定為值'BAD'),以及與作為輸入或特征的人口統(tǒng)計和信用局相關(guān)的若干其他變量。

交互式分組節(jié)點(diǎn)簡而言之,交互式分組節(jié)點(diǎn)是一個非常靈活的工具,用于對變量進(jìn)行分箱或分組。這個節(jié)點(diǎn):

  • 使用您可以輕松調(diào)整的選項(xiàng)來分類輸入變量

  • 計算每個輸入變量的箱的證據(jù)權(quán)重

  • 計算基尼和信息值,并拒絕具有這些統(tǒng)計值的低值的輸入變量

在幕后運(yùn)行的過程可以根據(jù)您可以輕松定制的某些約束找到相對于目標(biāo)的輸入的最佳分級。確保使用節(jié)點(diǎn)的交互式應(yīng)用程序直觀地確認(rèn)事件計數(shù)和證據(jù)權(quán)重趨勢對您的分箱有意義。如有必要,您可以合并箱,創(chuàng)建新組或手動調(diào)整證據(jù)權(quán)重。

手動調(diào)整證據(jù)權(quán)重

對于某些變量輸入,您可能需要手動調(diào)整證據(jù)權(quán)重(WOE)。例如,可變采用總結(jié)了信用申請人在當(dāng)前工作中受雇的年數(shù)。一般而言,當(dāng)前工作的年數(shù)往往與信用違約成反比。對于該數(shù)據(jù)集,證據(jù)權(quán)重不會因第1組至第5組單調(diào)減少這一事實(shí)可能是由于多種原因。例如,這個數(shù)據(jù)集可能是樣本偏向的,因?yàn)樵S多使用<2的應(yīng)用程序是手動選擇或“挑選”,并且它們的良好行為反映在低事件數(shù)和低權(quán)重證據(jù)中。要防止此樣本偏差影響您的記分卡,您可以使用交互式應(yīng)用程序中“分組”選項(xiàng)卡的“粗略詳細(xì)信息”視圖上的“手動WOE”列。對于組1,將WOE從0.1283更改為0.7,對于組2,將WOE從-0.13131更改為-0.5。新的WOE和信息值被重新計算為新信息值。

記分卡節(jié)點(diǎn)對使用“交互式分組”節(jié)點(diǎn)找到的箱或組感到滿意后,運(yùn)行“記分卡”節(jié)點(diǎn)以使用分組輸入對邏輯回歸進(jìn)行建模。然后,它將創(chuàng)建每個輸入組或?qū)傩缘馁r率的預(yù)測日志的線性變換,使其更易于解釋。

默認(rèn)情況下,每增加20個得分點(diǎn),事件的幾率就會翻倍。您正在建模的事件是付款默認(rèn)值,這意味著例如,與得分為150的應(yīng)用程序相比,得分為130分的應(yīng)用程序的違約幾率要高一倍。

在結(jié)果中,有幾個有用的圖表和表格,包括記分卡,分?jǐn)?shù)分布,KS圖,權(quán)衡圖和許多其他。

輸出變量和不利特征請注意,從導(dǎo)出的數(shù)據(jù)集中,記分卡節(jié)點(diǎn)會創(chuàng)建多個變量。帶有前綴SCR_的變量是記分卡中每個變量的記分卡點(diǎn),SCORECARD_POINTS是每個應(yīng)用程序的總點(diǎn)數(shù)。

當(dāng)您指定記分卡屬性生成報告=是以輸出不良特征時,您的結(jié)果還將包括每個觀察結(jié)果降低得分最多的變量。您最多可以選擇5種不利特征。作為如何解釋此列的示例,對于下面數(shù)據(jù)集的第一次觀察,扣除了14個得分點(diǎn),因?yàn)橘J款的目的標(biāo)記為1,3,8,缺失或未知。

?

▍需要幫助?聯(lián)系我們

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.在R語言中實(shí)現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測股票價格

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標(biāo)


使用SAS Enterprise Miner進(jìn)行數(shù)據(jù)挖掘:信用評分構(gòu)建評分卡模型的評論 (共 條)

分享到微博請遵守國家法律
高陵县| 东安县| 夏邑县| 定边县| 汶川县| 惠州市| 都昌县| 阳朔县| 正阳县| 望江县| 潜江市| 宝清县| 靖安县| 清丰县| 东乌珠穆沁旗| 永嘉县| 扶沟县| 萝北县| 桂阳县| 宝清县| 青阳县| 高青县| 万载县| 洞口县| 偏关县| 康定县| 古田县| 葫芦岛市| 长宁县| 永嘉县| 莱芜市| 麻江县| 双城市| 沿河| 沁阳市| 华亭县| 泗洪县| 五家渠市| 连州市| 贵定县| 金昌市|