Introduction to the Wasserstein distance

我看完后的理解:

先對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化(y分布的和 == x分布的和),然后相當(dāng)于計(jì)算從藍(lán)色分布,移動(dòng)到紅色分布需要的最小移動(dòng)距離。
圖中,其中一種轉(zhuǎn)化方式就是: y1 移動(dòng)0.3到x1,從y2移動(dòng)0.1到x1,移動(dòng)0.1到x2,移動(dòng)0.2到x3,……每一行加起來(lái)要等于 yi ,每列加起來(lái)要等與 xj ,看起來(lái)就像是 yi與xj的聯(lián)合分布。y → x 的成本是不同的,我們?cè)O(shè)有個(gè)y → x 的成本函數(shù),里面所有的值乘以代價(jià)函數(shù)然后加起來(lái)就是當(dāng)前轉(zhuǎn)化方式需要的距離。
但是我們要求最小的距離,以上只是其中一種轉(zhuǎn)化方式,我們列出所有可能的轉(zhuǎn)化方式,然后計(jì)算他們的距離,然后取其最小值就是我們需要的 Wasserstein距離。
然后再去閱讀以下文章了解原理:https://kexue.fm/archives/6280#%E7%BA%BF%E6%80%A7%E8%A7%84%E5%88%92%E4%B8%8E%E5%AF%B9%E5%81%B6
歡迎指正。
標(biāo)簽: