[數(shù)模必修課]數(shù)據(jù)去量綱
1.?數(shù)據(jù)的量綱
? ? ? ? 假設(shè)有對(duì)象1, 2, 3,?...,?n ;每個(gè)對(duì)象均具有m個(gè)不同的特征. 定義xij?表示第i個(gè)對(duì)象的第j個(gè)特征所指代的數(shù)值.
????????由于不同的特征分布區(qū)間不同, 例如身高的分布區(qū)間為0.5m至3m .體重的分布區(qū)間為3kg 至200kg. 這些特征分布在不同的尺度范圍內(nèi). 這種尺度本身就是對(duì)數(shù)據(jù)的一種加權(quán).而這種加權(quán)只是根據(jù)數(shù)據(jù)的分布范圍決定的,是一種人類主觀定義的度量. 只要這種度量存在, 不同的特征之間無法進(jìn)行相互比較.
????????為了使得數(shù)據(jù)去除人類主觀定義的單位(量綱), 需要將數(shù)據(jù)進(jìn)行一系列變換.
2.?去量綱的常見公式
(1) 0-1變換:
其中為處理后的數(shù)據(jù).
> 處理后的數(shù)據(jù)特點(diǎn):
? ? ? ? [a] 必然會(huì)有0和1.
? ? ? ? [b]? 數(shù)據(jù)的分布在0至1之間.
> 失效情況:
? ? ? ? [a] 后續(xù)對(duì)數(shù)據(jù)的處理需要使用對(duì)數(shù)時(shí),會(huì)失效.
? ? ? ? [b] 最大值等于最小值.
>?失效情況的對(duì)策
其中為處理后的數(shù)據(jù),
為一個(gè)極小的正數(shù).
ps:這里位置太小了,后續(xù)內(nèi)容寫不下,評(píng)論區(qū)回復(fù) 已三連 ,私信領(lǐng)取全部文檔喲.