最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

AIGC: Composable Diffusion Models 筆記

2023-09-14 09:14 作者:剎那-Ksana-  | 我要投稿

Energy Based Models

EBM (Energy Based Models) 本質上是一個有關數(shù)據(jù)的概率分布,其中包括一個能量函數(shù)?E_%5Ctheta(%5Cmathbf%7Bx%7D)%3A%5Cmathbb%7BR%7D%5ED%20%5Cto%20%5Cmathbb%7BR%7D%5E1?. 這個能量函數(shù)我們可以用一個神經網絡去代表它(但不限于神經網絡)。

然后,我們有?p_%5Ctheta(%5Cmathbf%7Bx%7D)%5Cpropto%20e%5E%7B-E_%5Ctheta(%5Cmathbf%7Bx%7D)%7D. 這個"概率分布" e%5E%7B-E_%5Ctheta(x)%7D 是沒有經過標準化(normalization)的(對 x 的積分不為1)。我們可以讓它除以一個 Z_%5Ctheta%3D%5Cint_%5Cmathbf%7Bx%7D%20e%5E%7B-E_%5Ctheta(%5Cmathbf%7Bx%7D)%7Dd%5Cmathbf%7Bx%7D?使其標準化,但是這個積分通常是求不出來的,而且也不在我們這次的考慮范圍內。

從?p_%5Ctheta(%5Cmathbf%7Bx%7D)%5Cpropto%20e%5E%7B-E_%5Ctheta(%5Cmathbf%7Bx%7D)%7D?我們可以看出,如果 x 取自于原數(shù)據(jù)的分布(比如說,原數(shù)據(jù)是一堆蘋果的圖片,x 也是蘋果的圖片),那么?e%5E%7B-E_%5Ctheta(%5Cmathbf%7Bx%7D)%7D?應該是一個比較大的值,換言之,E_%5Ctheta(%5Cmathbf%7Bx%7D) 應該是一個比較小的值。反之亦然。

當我們有了如上的能量函數(shù)以后,我們可以利用朗之萬動力學(Langevin dynamics)對其進行采樣:

%5Ctilde%7Bx%7D%5E%7Bk%7D%3D%5Ctilde%7Bx%7D%5E%7Bk-1%7D-%5Cfrac%7B%5Clambda%7D%7B2%7D%5Cnabla_%5Cmathbf%7Bx%7DE_%5Ctheta%20(%5Ctilde%7Bx%7D%5E%7Bk-1%7D)%2B%5Comega%5Ek%2C%20%5Comega%5Ek%20%5Csim%20%5Cmathcal%7BN%7D(0%2C%5Clambda)

現(xiàn)在,假設我們有一系列的特征?c_1%2Cc_2%2C...%2Cc_n(比如說長相、膚色、發(fā)色等等), 我們針對每一個特征,都訓練了其相應的能量函數(shù)?E_%5Ctheta(%5Cmathbf%7Bx%7D%7Cc_1)%2CE_%5Ctheta(%5Cmathbf%7Bx%7D%7Cc_2)%2C...%2CE_%5Ctheta(%5Cmathbf%7Bx%7D%7Cc_n). 當我們要組合這些特征時(Conjunction),我們可以直接把相應的"概率分布"相乘:

p(%5Cmathbf%7Bx%7D%7Cc_1%20%5Ctext%7B%20and%20%7D%20c_2%20%5Ctext%7B%20and%20%7D%2C...%2C%20%5Ctext%7B%20and%20%7Dc_i)%3D%5Cprod_i%20p(x%7Cc_i)%20%5Cpropto%20e%5E%7B-%5Csum_i%20E(x%7Cc_i)%7D

所以我們對應的采樣公式為:

%5Ctilde%7Bx%7D%5E%7Bk%7D%3D%5Ctilde%7Bx%7D%5E%7Bk-1%7D-%5Cfrac%7B%5Clambda%7D%7B2%7D%5Cnabla_%5Cmathbf%7Bx%7D%20%5Csum_i%20E_%5Ctheta%20(%5Ctilde%7Bx%7D%5E%7Bk-1%7D%7Cc_i)%2B%5Comega%5Ek%2C%20%5Comega%5Ek%20%5Csim%20%5Cmathcal%7BN%7D(0%2C%5Clambda)

除了組合這些特征以外,我們還有“或”運算:

%5Cbegin%7Balign*%7D%0A%26p(x%7Cc_1%20%5Ctext%7B%20or%20%7D%20c_2%20%5Ctext%7B%20or%20%7D%2C...%2C%5Ctext%7B%20or%20%7D%20c_i)%5Cpropto%20%5Csum_i%20p(x%7Cc_i)%2FZ(c_i)%20%5C%5C%0A%26%5Csum_i%20p(x%7Cc_i)%20%5Cpropto%20%5Csum_i%20e%5E%7B-E(x%7Cc_i)%7D%20%3De%5E%7B%5Ctext%7Blogsumexp%7D(-E(x%7Cc_1)%2C-E(x%7Cc_2)%2C...%2C-E(x%7Cc_i))%7D%20%5C%5C%0A%26%20%5Ctilde%7Bx%7D%5E%7Bk%7D%3D%5Ctilde%7Bx%7D%5E%7Bk-1%7D-%5Cfrac%7B%5Clambda%7D%7B2%7D%5Cnabla_%5Cmathbf%7Bx%7D%20%5Ctext%7Blogsumexp%7D(-E(x%7Cc_1)%2C-E(x%7Cc_2)%2C...%2C-E(x%7Cc_i))%2B%5Comega%5Ek%2C%20%5Comega%5Ek%20%5Csim%20%5Cmathcal%7BN%7D(0%2C%5Clambda)%0A%5Cend%7Balign*%7D

和“非”運算:

%5Cbegin%7Balign*%7D%0A%26p(x%7C(%5Ctext%7Bnot%20%7D%20c_1)%2C%20c_2)%5Cpropto%20%5Cfrac%7Bp(x%7Cc_2)%7D%7Bp(x%7Cc_1)%5E%5Calpha%7D%20%5Cpropto%20e%5E%7B%5Calpha%20E(x%7Cc_1)-E(x%7Cc_2)%7D%20%5C%5C%0A%26%20%5Ctilde%7Bx%7D%5E%7Bk%7D%3D%5Ctilde%7Bx%7D%5E%7Bk-1%7D-%5Cfrac%7B%5Clambda%7D%7B2%7D%5Cnabla_%5Cmathbf%7Bx%7D%20%20(%5Calpha%20E(x%7Cc_1)-E(x%7Cc_2))%2B%5Comega%5Ek%2C%20%5Comega%5Ek%20%5Csim%20%5Cmathcal%7BN%7D(0%2C%5Clambda)%0A%5Cend%7Balign*%7D

Composing Diffusion Models

我們發(fā)現(xiàn),擴散模型和 EBM 在采樣上有很多相似之處,那么,我們是不是可以把上面的架構借用到擴散模型上呢。這里論文認為,由于 %5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20?和 %5Cnabla_%7B%5Cmathbf%7Bx%7D%7D%20E_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t) 有著相似的作用,所以去噪過程的公式:

%5Cmathbf%7Bx%7D_%7Bt-1%7D%20%3D%20%7B%5Cmathbf%7Bx%7D%7D_t%20-%20%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20%2B%20%5Cmathcal%7BN%7D(0%2C%20%5Csigma_t%5E2%20I)

和上面的朗之萬公式是等價的。

這里論文中列舉了兩種運算,首先是“與”運算(AND):

p(%7B%5Cmathbf%7Bx%7D%7D%7C%7B%5Cmathbf%7Bc%7D%7D_1%2C%20%5Cldots%2C%20%7B%5Cmathbf%7Bc%7D%7D_n)%20%5Cpropto%20p(%7B%5Cmathbf%7Bx%7D%7D)%20%5Cprod_%7Bi%3D1%7D%5En%20%5Cfrac%7Bp(%7B%5Cmathbf%7Bx%7D%7D%7C%7B%5Cmathbf%7Bc%7D%7D_i)%7D%7Bp(%7B%5Cmathbf%7Bx%7D%7D)%7D

對兩邊取對數(shù)后對 x 計算梯度,根據(jù)?%5Cnabla_%7B%5Cmathbf%7Bx%7D%7D%20%5Clog%20p(%5Cmathbf%7Bx%7D)%20%3D%5Cepsilon_%5Ctheta(x_t%2Ct)?我們有:

%5Chat%7B%5Cepsilon%7D(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20%3D%20%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20%2B%20%5Csum_%7Bi%3D1%7D%5En%20w_i%20%5Cbigl(%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t%20%7C%20%7B%5Cmathbf%7Bc%7D%7D_i)%20-%20%5Cepsilon_%7B%5Ctheta%7D(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%5Cbigl)

然后是“非”運算(NOT):

p(%7B%5Cmathbf%7Bx%7D%7D%7C%5Ctext%7Bnot%20%7D%5Ctilde%7B%7B%5Cmathbf%7Bc%7D%7D%7D_j%2C%20%7B%5Cmathbf%7Bc%7D%7D_i)%20%5Cpropto%20p(%7B%5Cmathbf%7Bx%7D%7D)%5Cfrac%7Bp(%7B%5Cmathbf%7Bx%7D%7D%20%7C%20%7B%5Cmathbf%7Bc%7D%7D_i)%7D%7Bp(%7B%5Cmathbf%7Bx%7D%7D%20%7C%20%5Ctilde%7B%7B%5Cmathbf%7Bc%7D%7D%7D_j)%7D

%5Chat%7B%5Cepsilon%7D(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20%3D%20%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%20%2B%20w%20%5Cbigl(%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t%20%7C%20%7B%5Cmathbf%7Bc%7D%7D_i)%20-%20%5Cepsilon_%5Ctheta(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t%20%7C%20%5Ctilde%7B%7B%5Cmathbf%7Bc%7D%7D%7D_j)%5Cbigl)

最后,迭代的方式即:

p_%7Bcompose%7D(%20%7B%5Cmathbf%7Bx%7D%7D_%7Bt-1%7D%7C%7B%5Cmathbf%7Bx%7D%7D_t)%20%3A%3D%20%7B%5Cmathcal%7BN%7D%7D%20%5Cbigl(%7B%5Cmathbf%7Bx%7D%7D_t%20-%20%5Chat%7B%5Cepsilon%7D(%7B%5Cmathbf%7Bx%7D%7D_t%2C%20t)%2C%20%5Csigma_t%5E2%20I%20%5Cbigl)

完。

B站公式編輯器經常抽風,如果遇到 tex parse error?之類的錯誤時,刷新一下頁面一般就能解決。

AIGC: Composable Diffusion Models 筆記的評論 (共 條)

分享到微博請遵守國家法律
岱山县| 鹤峰县| 海口市| 和林格尔县| 阿拉尔市| 韩城市| 吉林省| 绥江县| 新和县| 屏边| 巴塘县| 台中县| 上犹县| 泾阳县| 北辰区| 小金县| 尖扎县| 白河县| 洱源县| 舞钢市| 沙坪坝区| 惠水县| 界首市| 平乐县| 蓬溪县| 古浪县| 沂源县| 福海县| 武乡县| 达日县| 襄垣县| 德化县| 文山县| 榆树市| 应城市| 汨罗市| 桑日县| 富平县| 鲜城| 女性| 仁布县|