深度學(xué)習(xí)三維人體重建科研小班3期
UNIMO
目的:集成單模態(tài)和多模態(tài)結(jié)果的預(yù)訓(xùn)練模型,在多模態(tài)任務(wù)上表現(xiàn)不錯(cuò),在單模態(tài)任務(wù)上,效果也不會(huì)下降太多;
數(shù)據(jù)增強(qiáng):通過text rewriting,text/image retrieval 增強(qiáng)正負(fù)樣本。
UNITER
目的:構(gòu)建一個(gè)統(tǒng)一的圖文學(xué)習(xí)框架,適用于各種圖文任務(wù);
分別對(duì)圖文做embedding,經(jīng)過Layer Normalization進(jìn)入transformer;
標(biāo)簽: