ALBEF
雙流模型;
在預(yù)訓(xùn)練和下游任務(wù)時(shí),使用momentum distillation,緩解圖文數(shù)據(jù)集中的噪聲問(wèn)題;
從Mutual Information的視角看圖文對(duì)信息對(duì)齊。