人工智能AI面試題-8.1為什么我們做評(píng)分卡的時(shí)候要用woe編碼?
2023-10-16 12:42 作者:機(jī)器愛上學(xué)習(xí) | 我要投稿
8.1
為什么我們做評(píng)分卡的時(shí)候要用
woe
編碼
?
理解評(píng)分卡中為什么要使用WOE(Weight of Evidence)編碼就像理解編程中的最優(yōu)數(shù)據(jù)結(jié)構(gòu)一樣,讓我們深入了解它并為你加入一些程序員的精彩元素 ????: **為什么要使用WOE編碼?** 一般情況下,我們在處理數(shù)據(jù)時(shí)會(huì)使用One-Hot編碼將分類變量轉(zhuǎn)化為二進(jìn)制的稀疏矩陣。但是,這會(huì)導(dǎo)致數(shù)據(jù)變得非常高維且稀疏,這對(duì)于模型來說是有挑戰(zhàn)的,就像在編程中使用不合適的數(shù)據(jù)結(jié)構(gòu)一樣,會(huì)導(dǎo)致性能問題。 此時(shí),通常的做法是將這些高維稀疏特征進(jìn)行嵌入(Embedding),但嵌入后的特征在可解釋性方面會(huì)受到一定的影響,就像優(yōu)化性能會(huì)犧牲可讀性一樣。 這就是為什么我們使用WOE編碼的原因。WOE編碼不僅可以將分類特征轉(zhuǎn)化為數(shù)值特征,還能保持可解釋性。它通過計(jì)算不同類別的事件發(fā)生率與非事件發(fā)生率之比,來編碼每個(gè)類別。這樣,WOE編碼提供了一種更具信息量和可解釋性的方式來表示分類特征。 所以,就像在編程中選擇最適合任務(wù)的數(shù)據(jù)結(jié)構(gòu)一樣,WOE編碼在評(píng)分卡建模中提供了更好的特征表示,既考慮了模型性能,又保留了可解釋性。這就是為什么我們在評(píng)分卡建模時(shí)常常使用WOE編碼的原因。
標(biāo)簽: