【直播預告】SFFAI 109 人物交互專題
人物交互(HOI)是關系理解和動作識別兩個任務中的重要挑戰(zhàn)。人物交互可以看成是動作和物體的結合,HOI不僅要檢測圖像中的人和物體,還需要判斷每個(人,物體)對之間的交互類型。本期論壇我們邀請到來自華南理工大學的鐘旭彬同學,分享他在一階段人物交互檢測模型上的研究工作,用掃視與凝視網(wǎng)絡推斷動作感知點。

講者介紹
鐘旭彬,華南理工大學直博生二年級,主要研究方向是場景理解和關系檢測, 目前已在IJCV,CVPR,ECCV等國際頂級期刊和會議上發(fā)表一作論文3篇。
會議題目
掃視與凝視:一階段人物交互檢測中動作感知點的推斷
會議摘要
現(xiàn)有的人物交互檢測方法可分為一階段和兩階段兩種。一階段模型由于其直接的體系結構更高效,但兩階段模型在準確性上仍然有優(yōu)勢?,F(xiàn)有一階段模型通常首先檢測預定義交互區(qū)域或點,然后只關注這些領域來預測交互類型;因此,他們缺乏動態(tài)搜索辨別線索的推理步驟。本文提出了一種新的一階段方法,即掃視與凝視網(wǎng)絡,它通過掃視與凝視步驟自適應地建模一組動作感知點。掃視步驟快速確定圖片中的每個像素是否一個交互點;凝視步驟利用由掃視步驟生成的特征圖,以漸進的方式自適應地推斷每個像素周圍的動作感知點。將細化后的動作感知點特征進行聚合,用于交互預測。此外,我們設計了一種動作感知的匹配方法,可以有效地將每個檢測到的交互與其關聯(lián)的人-物對進行匹配,以及一種改進優(yōu)化的困難樣本注意損失算法。上述所有操作都是同時有效地針對特征圖中的所有像素進行的。

會議亮點
1、從“如何定義交互區(qū)域”的角度分析了現(xiàn)有一階段檢測網(wǎng)絡的缺陷;
2、第一次在人物體交互檢測方向提出“掃視與凝視“步驟來推理動作感知點;
3、在實驗中充分驗證了掃視與凝視步驟的有效性, 并且在V-COCO和HICO-DET兩個數(shù)據(jù)集上大幅領先目前最好的方法。
直播時間
2021年6月6日(周日)20:00—21:00 線上直播
關注本公眾號,對話框回復“SFFAI109”,獲取入群二維碼
注:直播地址會分享在交流群內

現(xiàn)代科學技術高度社會化,在科學理論與技術方法上更加趨向綜合與統(tǒng)一,為了滿足人工智能不同領域研究者相互交流、彼此啟發(fā)的需求,我們發(fā)起了SFFAI這個公益活動。SFFAI每周舉行一期線下活動,邀請一線科研人員分享、討論人工智能各個領域的前沿思想和最新成果,使專注于各個細分領域的研究者開拓視野、觸類旁通。
SFFAI目前主要關注機器學習、計算機視覺、自然語言處理等各個人工智能垂直領域及交叉領域的前沿進展,將對線下討論的內容進行線上傳播,使后來者少踩坑,也為講者塑造個人影響力。SFFAI還在構建人工智能領域的知識森林—AI Knowledge Forest,通過匯總各位參與者貢獻的領域知識,沉淀線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區(qū)做出貢獻,歡迎大家關注SFFAI論壇:https://bbs.sffai.com。
