小象學(xué)院特征工程精講與實(shí)踐
特征是數(shù)據(jù)中抽取出來(lái)的對(duì)結(jié)果預(yù)測(cè)有用的信息。特征工程就是使用專(zhuān)業(yè)背景知識(shí)和技巧處理數(shù)據(jù),使得特征能在機(jī)器學(xué)習(xí)算法上發(fā)揮出更好的作用的過(guò)程。
舉個(gè)例子,一個(gè)簡(jiǎn)單的邏輯回歸二分類(lèi)問(wèn)題。設(shè)計(jì)一個(gè)身材分類(lèi)器,輸入數(shù)據(jù)X:身高和體重,標(biāo)簽Y:身材(胖/不胖),顯然不能根據(jù)體重來(lái)判斷一個(gè)人胖不胖,針對(duì)這個(gè)問(wèn)題,一個(gè)經(jīng)典的特征工程是:BMI指數(shù),BMI=體重/

,大部分人都可以使用BMI指數(shù)檢測(cè)身材標(biāo)準(zhǔn),這樣,通過(guò)BMI指數(shù)就能非常顯然地幫助我們刻畫(huà)一個(gè)人的身材如何。
標(biāo)簽: