最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深度之眼多模態(tài)實戰(zhàn)班

2023-03-14 11:11 作者:清衛(wèi)怡 0人讀過 | 我要投稿

特征提取：

視覺的提取，大多用的是Faster R-CNN：
1.1 直接提取視覺向量；
1.2 進行目標(biāo)檢測，輸出bounding box和對應(yīng)位置；
1.3 進行目標(biāo)檢測，提取類別特征。
潛在問題：提取的信息有冗余和噪音，對下游任務(wù)有益的視覺信息沒有被有效提取，和對應(yīng)的文本信息有語義鴻溝，不好做視覺-文本對齊等。
文本一般會用BERT或者Roberta做初始化，大規(guī)模訓(xùn)練集會從頭開始訓(xùn)練。

Early fusion：特征提取后，一般是直接concat，進入transformer；
Late fusion：特征提取后，模態(tài)內(nèi)部再進行深度學(xué)習(xí)，再做模態(tài)交互。

標(biāo)簽：

深度之眼多模態(tài)實戰(zhàn)班的評論 (共條)

平湖市| 南雄市| 乌海市| 漯河市| 邛崃市| 上虞市| 马关县| 青州市| 时尚| 抚宁县| 屏东市| 安仁县| 日土县| 天祝| 湖北省| 平乡县| 上饶县| 辽宁省| 屏东县| 鞍山市| 陆良县| 周口市| 平山县| 南阳市| 织金县| 宁城县| 柘城县| 桦川县| 曲阳县| 湛江市| 宜春市| 沈阳市| 镇原县| 汝南县| 宿迁市| 拉萨市| 桐城市| 平和县| 仪陇县| 新宾| 清丰县|