最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

深度學(xué)習(xí)01 多模態(tài)-baseline

2023-03-01 11:30 作者:勾心斗角167 0人讀過 | 我要投稿

模型概況

ALBEF

雙流模型；
在預(yù)訓(xùn)練和下游任務(wù)時(shí)，使用momentum distillation，緩解圖文數(shù)據(jù)集中的噪聲問題；
從Mutual Information的視角看圖文對(duì)信息對(duì)齊。

CLIP

雙流模型，文本和視覺分別進(jìn)入transformer encoder，經(jīng)過線性投影計(jì)算不同圖文對(duì)的相似度；
使用對(duì)比學(xué)習(xí)，將圖片分類轉(zhuǎn)換成圖文匹配任務(wù)。

UniT：文本和視覺分別encoder，concat之后進(jìn)入transformer decoder，根據(jù)head進(jìn)行不同任務(wù)的訓(xùn)練。

Vx2TEXT

基于backbone network提取模態(tài)特征，經(jīng)過分類器，使用Gumbel-softmax 采樣得到k個(gè)類別，和文本一樣，映射到統(tǒng)一的語言空間；
端對(duì)端的文本生成模型。

標(biāo)簽：

深度學(xué)習(xí)01 多模態(tài)-baseline的評(píng)論 (共條)

内乡县| 浠水县| 密云县| 竹溪县| 寿光市| 宣威市| 内乡县| 沙雅县| 班戈县| 金华市| 河东区| 唐山市| 彰武县| 涿鹿县| 沙河市| 娱乐| 新平| 南阳市| 尼勒克县| 仁化县| 静乐县| 宣化县| 玛纳斯县| 长春市| 孟连| 平山县| 晋宁县| 桦甸市| 定边县| 桐乡市| 开江县| 元氏县| 尉犁县| 宜川县| 汉沽区| 西充县| 赫章县| 吉木乃县| 加查县| 湾仔区| 墨江|