數(shù)據(jù)預(yù)處理之均值移除
什么是均值移除(標(biāo)準(zhǔn)化):
????由于一個(gè)樣本的不同特征值差異較大,不利于使用現(xiàn)有機(jī)器學(xué)習(xí)算法進(jìn)行樣本處理。均值移除可以讓樣本矩陣中的每一列的平均值為0,標(biāo)準(zhǔn)差為1。 確保每一個(gè)特征列的數(shù)值都在類似的數(shù)據(jù)范圍之間,防止某一個(gè)特征列數(shù)據(jù)天然的數(shù)值太大而一家獨(dú)大影響結(jié)果。
知識(shí)點(diǎn)
均值移除API:
import sklearn.preprocessing as sp
# scale函數(shù)用于對(duì)函數(shù)進(jìn)行預(yù)處理,實(shí)現(xiàn)均值移除。
A = sp.scale(array)
案例如下:

標(biāo)簽:數(shù)據(jù)預(yù)處理均值移除