機(jī)器學(xué)習(xí)基礎(chǔ)之常見距離計(jì)算

個(gè)人學(xué)習(xí)記錄,若有侵權(quán),請聯(lián)系刪除。?

?一、歐氏距離(Euclidean Distance)
歐氏距離是最容易直觀理解的度量方法。即兩點(diǎn)之間的距離
如點(diǎn)

和點(diǎn)

之間的距離為:


二、標(biāo)準(zhǔn)化歐氏距離(Standard Euclidean Distance)
標(biāo)準(zhǔn)化歐氏距離是針對歐氏距離的缺點(diǎn)而作的一種改進(jìn),但要求必須基于一個(gè)數(shù)據(jù)集的分布
思路:既然數(shù)據(jù)各維分量的分布不一樣,那先將各個(gè)分量都“標(biāo)準(zhǔn)化”到均值、方差相等,即使得各個(gè)維度分別滿足標(biāo)準(zhǔn)正態(tài)分布。假設(shè)樣本集X的均值為m,標(biāo)準(zhǔn)差為s,X的標(biāo)準(zhǔn)化變量表示為

如兩個(gè)n維向量

與

間的標(biāo)準(zhǔn)化歐氏距離公式為:

三、曼哈頓距離(Manhattan Distance)
在曼哈頓街區(qū)要從一個(gè)十字路口開車到另一個(gè)十字路口,直觀上看,綠線的距離最短,但在現(xiàn)實(shí)中顯然是不成立的,因?yàn)槲覀儾荒艽┻^房屋。駕駛距離顯然不是兩點(diǎn)間的直線距離,這些實(shí)際駕駛距離就是“曼哈頓距離”,也稱為“街區(qū)距離”
紅藍(lán)黃線均為曼哈頓距離,綠線為歐氏距離


與

間的曼哈頓距離公式為:

四、切比雪夫距離(Chebyshev Distance)


與

間的切比雪夫距離公式為:

五、閔可夫斯基距離(Minkowski Distance)
1、閔可距離的定義
兩個(gè)n維向量

與

間的閔可夫斯基距離公式為:
![d(a,b)=\sqrt[p]{\sum_{k=1}^{n}|x_{1k}-x_{2k}|^p}](https://b1.sanwen.net/b_article/412455053f3258bdfa79bf5df5b6186565bc42be.png)
其中p是一個(gè)變參數(shù)
當(dāng)p=1時(shí),就是曼哈頓距離
當(dāng)p=2時(shí),就是歐氏距離
當(dāng)p=無窮時(shí),就是切比雪夫距離
2、閔可距離的缺點(diǎn)
1)將各個(gè)分量的量綱,也就是“單位”當(dāng)作相同的看待了
2)沒有考慮各個(gè)分量的分布(期望,方差等)可能是不同的