[5分鐘學(xué)算法] #02 樸素貝葉斯 寫作業(yè)還得看小明

??機器學(xué)習(xí)算法2——樸素貝葉斯
0.案例引入
?
00:09
?小明要如何區(qū)分作業(yè)和情書?
1.核心假設(shè)
?
02:11
?不論某個元素X是否屬于某一類,X是否具有屬性A與X是否具有屬性B相互獨立
因為該假設(shè)過于簡單,所以這種算法被稱為樸素貝葉斯算法
2.步驟和公式
?
03:41
?由貝葉斯定理得計算公式

該公式可以簡化為正比關(guān)系

等式右邊第二項可拆分為各個屬性出現(xiàn)概率的乘積

取可能性最高的那個類別作為預(yù)測結(jié)果

3.注意事項
?
02:37
?避免某屬性只出現(xiàn)在一種類別里,導(dǎo)致某個計算出來的頻率為0——平滑技巧
- 即引入偽計數(shù)k,修正屬性頻率統(tǒng)計公式
標(biāo)簽: