深度學(xué)習(xí)人工智能Paper年度會(huì)員(多模態(tài)方向)
2023-03-01 11:14 作者:代號(hào)7264 | 我要投稿
多模態(tài)數(shù)據(jù)集+ 之眼預(yù)訓(xùn)練任務(wù)匯總
模型數(shù)據(jù)集預(yù)訓(xùn)練任務(wù)ALBEF圖文對(duì):COCO,VG,CC,SBU CaptionITC, MLM,ITMCLIP400million 網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)集對(duì)比學(xué)習(xí)UniT視覺(jué)/文本單模態(tài)和多模態(tài)的8個(gè)數(shù)據(jù)集基于8個(gè)數(shù)據(jù)集的7個(gè)任務(wù),包含目標(biāo)檢測(cè),VQA,NLUVx2TEXT視頻用Kinetics,音頻使用AudioSetTVQA, AVSD,TVCUNIMO文本:BookWiki and OpenWebText;
圖片:OpenImages,unlabeled COCO;
圖文對(duì):COCO,VG,CC,SBU Caption對(duì)比學(xué)習(xí),MLM,MRM
標(biāo)簽: