最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

量綱化處理

2022-10-31 11:41 作者:SPSSAU官方賬號(hào)  | 我要投稿

在實(shí)際研究中,不同的變量單位不同,數(shù)值差異極大。例如100g和1m等。 因此有時(shí)需要對數(shù)據(jù)進(jìn)行去量綱,所謂的去量綱就是‘去掉’單位對數(shù)值的影響。但是量綱化有很多種方式,但具體應(yīng)該使用哪一種方式,并沒有固定的標(biāo)準(zhǔn),而應(yīng)該結(jié)合數(shù)據(jù)情況或者研究算法,選擇最適合的量綱化處理方式,SPSSAU共提供12種量綱化處理方法,下面進(jìn)行說明。

一、利用SPSSAU進(jìn)行量綱化操作

量綱化處理應(yīng)該如何操作?以SPSSAU為例,量綱化處理在SPSSAU的數(shù)據(jù)處理板塊,具體位置在SPSSAU【數(shù)據(jù)處理】→【生成變量】處;

量綱化處理的各種類型解讀:https://www.bilibili.com/video/BV1Ef4y167iD/

二、量綱化處理分類

量綱化有很多種處理方式,其中常見的處理為12種,SPSSAU均有提供,可以將12種方法分為兩大類,一類為‘有實(shí)際意義的量綱處理’另一類為‘?dāng)?shù)理化的量綱處理’。接下來對兩類量綱化處理分別進(jìn)行說明。

2.1有實(shí)際意義的量綱處理

有實(shí)際意義的量綱處理包括均值化、初值化、最小值化、最大值化、求和歸一化和平方和歸一化。接下來一一進(jìn)行描述。

(1)均值化:

均值化在綜合評價(jià)時(shí)有可能使用,比如進(jìn)行灰色關(guān)聯(lián)法研究時(shí)就常用此種處理方式;其計(jì)算公式是以平均值作為單位,全部數(shù)據(jù)均去除以平均值。但是并不是所有數(shù)據(jù)都能進(jìn)行均值化處理,一般需要數(shù)據(jù)均大于0。

那么如何判斷自己的數(shù)據(jù)是否大于0?如果數(shù)據(jù)過少可以直接通過觀察進(jìn)行判斷,但是如果數(shù)據(jù)量很大,不好觀察,可以通用SPSSAU中【通用方法】的【描述】進(jìn)行觀察。

(2)初值化

什么是初值化?使用序列數(shù)據(jù)中的初始值作為除數(shù),消除不同變量之間的量級或單位差異。其計(jì)算公式為X / 該列第1個(gè)不為空的數(shù)據(jù),以第一個(gè)不為空的數(shù)據(jù)作為參考,其余全部除以該值,例如:

一般來說,初值化這種處理方式適用于有著一種趨勢或規(guī)律性的數(shù)據(jù),而且數(shù)據(jù)正常情況下都是全部大于0,因?yàn)槌霈F(xiàn)負(fù)數(shù),通常會(huì)失去其特定意義。

(3)最小值化

最小值化,其目的是讓最小值作為參照標(biāo)準(zhǔn),所有的數(shù)據(jù)全部除以最小值;此種處理方式時(shí)一般都是要求數(shù)據(jù)全部大于0,否則可能就不適合用此種量綱方式。

(4)最大值化

最大值化,其目的是讓最大值作為參照標(biāo)準(zhǔn),所有的數(shù)據(jù)全部除以最大值;此種處理方式時(shí)一般都是要求數(shù)據(jù)全部大于0,否則可能就不適合用此種量綱方式。

(5)求和歸一化

求和歸一化,其目的是讓‘求和值’作為參照標(biāo)準(zhǔn),所有的數(shù)據(jù)全部除以求和值,得到的數(shù)據(jù)相當(dāng)于為求和的占比。

主成分計(jì)算綜合得分以及Topsis法應(yīng)用比較多。一般要求數(shù)據(jù)都大于0。

(6)平方和歸一化

平方和歸一化所有數(shù)據(jù)全部除以平方和值。

Topsis法應(yīng)用比較多。一般要求數(shù)據(jù)都大于0。

補(bǔ)充說明:使用‘有實(shí)際意義的量綱處理’即均值化,初值化,最小值化,最大值化,求和歸一化,平方和歸一化。一般都輸需要數(shù)據(jù)大于0,否則很可能會(huì)失去其意義。

2.2 數(shù)理化的量綱處理

(1)標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化是一種最為常見的量綱化處理方式。其計(jì)算公式為:(X-Mean)/ Std。讓數(shù)據(jù)的平均值變成0,標(biāo)準(zhǔn)差變?yōu)?(標(biāo)準(zhǔn)化后,雖然數(shù)據(jù)滿足了正態(tài)分布的某些特征,比如均值為0,方差為1,但是數(shù)據(jù)分布同原數(shù)據(jù)分布),因?yàn)闃?biāo)準(zhǔn)化處理針對量綱引起的差異去除的更為徹底一般對于距離計(jì)算中,使用此方法效果更好。比如聚類分析時(shí),其內(nèi)部算法原理在于距離大小來衡量數(shù)據(jù)間的聚集關(guān)系,因此進(jìn)行標(biāo)準(zhǔn)化處理。

SPSSAU系統(tǒng)中對于聚類分析、主成分以及因子分析默認(rèn)使用標(biāo)準(zhǔn)化處理。

(2)中心化

針對數(shù)據(jù)進(jìn)行了壓縮大小處理,讓數(shù)據(jù)的平均值為0。其計(jì)算公式為:X - Mean。一般社會(huì)學(xué)等使用的比較多。

(3)歸一化

歸一化的目的是讓數(shù)據(jù)壓縮在【0,1】范圍內(nèi),其中也包括0和1;其計(jì)算公式為(X - Min)/ (Max - Min)。歸一化幾乎適用于所有場景,但是如果最大最小值不穩(wěn)定,其歸一化結(jié)果也不穩(wěn)定,可能會(huì)導(dǎo)致后續(xù)使用歸一化數(shù)據(jù)分析的效果也不穩(wěn)定。

(4)正向化

在實(shí)際研究中有的指標(biāo)是越大越好,此時(shí)為正向指標(biāo),需要正向化,對正向指標(biāo)保持正向且量綱化。并且也將數(shù)據(jù)壓縮在【0,1】。

(5)逆向化

在實(shí)際研究中有的指標(biāo)是越小越好,此時(shí)為逆向指標(biāo),需要對逆向指標(biāo)正向且量綱化。便于進(jìn)行方向的統(tǒng)一,并且也將數(shù)據(jù)壓縮在【0,1】之間。

(6)區(qū)間化

區(qū)間化的目的是讓數(shù)據(jù)壓縮在【a,b】范圍內(nèi),a和b是自己希望的區(qū)間值,如果a=0,b=1,那么其實(shí)就是一種特殊情況即歸一化;其計(jì)算公式為a + (b - a) * (X - Min)/(Max - Min)。

三、 實(shí)際問題處理

上述已經(jīng)了解到12種量綱化處理的方式以及量綱化處理的分類,接下來說明量綱化處理如何和實(shí)際相聯(lián)系,解決實(shí)際問題?(由于處理方法過多,所以這里以正逆向化處理為說明)

比如這樣一些指標(biāo)GDP增長率、就業(yè)率、失業(yè)率共3個(gè)指標(biāo);明顯的,GDP增長率、就業(yè)率是數(shù)字越大越好,而失業(yè)率是數(shù)字越小越好。所以在分析時(shí)可以考慮將GDP增長率、就業(yè)率進(jìn)行正向化處理,將失業(yè)率進(jìn)行逆向化處理。從而便于進(jìn)行方向的統(tǒng)一。當(dāng)然還要結(jié)合分析方法具體分析。

量綱化處理的評論 (共 條)

分享到微博請遵守國家法律
双牌县| 北海市| 正定县| 喜德县| 阜宁县| 象州县| 广河县| 都安| 松阳县| 潼南县| 益阳市| 锡林浩特市| 怀集县| 邵武市| 淅川县| 潮安县| 沁阳市| 安平县| 无为县| 蒙山县| 子长县| 新野县| 伊宁市| 体育| 宜君县| 开原市| 清河县| 丰顺县| 大埔县| 武定县| 南投市| 宁安市| 洛隆县| 龙州县| 灵丘县| 天镇县| 沙田区| 万源市| 清原| 驻马店市| 沂南县|