CVPR'21 Talk預(yù)告+在線交流 | Oral一作面對面 理論側(cè)專場

?由將門-TechBeat人工智能社區(qū)所主辦的「CVPR 2021 群星閃耀·云際會」現(xiàn)已進(jìn)行過半,上周末來自字節(jié)、清華、港大、港中文等七個Lab專場的在線直播交流已火熱結(jié)束。本周繼續(xù)為你帶來13位Oral一作的分享!
?北京時間6月21日今晚8點,四位Oral一作同學(xué)的Talk合輯(理論側(cè))將準(zhǔn)時在TechBeat人工智能社區(qū)開播!屆時中國科學(xué)技術(shù)大學(xué)博士陳鵬、美國加州大學(xué)洛杉磯分校統(tǒng)計學(xué)博士范麗鳳、美國東北大學(xué)博士生李振綱、美國加州大學(xué)洛杉磯分校博士鄭子隆將一起分享他們的工作內(nèi)容,帶領(lǐng)大家完成一場頭腦、能力和眼界的巔峰碰撞。
6月26日(周六)上午10點,四位嘉賓將與大家相約騰訊會議直播交流,更有莫納什大學(xué)助理教授莊博涵老師作為空降特邀主持人,帶領(lǐng)大家一起與學(xué)術(shù)新星0距離對話!歡迎踴躍報名!
(嘉賓工作介紹及報名方式見下文)
Oral一作面對面·報名通道



特邀主持人
莊博涵
莫納什大學(xué)助理教授,博士生導(dǎo)師
莊博涵,澳大利亞Monash University助理教授,博士生導(dǎo)師。莊博士于2018年在澳大利亞阿德萊德大學(xué)獲得博士學(xué)位,尤其關(guān)注于模型壓縮和加速以及高效計算機視覺算法的研究。莊博士在CVPR, ICCV, ECCV, NeurIPS, TPAMI等頂級國際會議和期刊發(fā)表論文二十余篇,莊博士亦擔(dān)任TPAMI, IJCV, CVPR, NeurIPS, ICML, ICLR等頂級學(xué)術(shù)期刊會議審稿人。
論文信息&嘉賓介紹
①
面向物體檢測的高精度低比特量化網(wǎng)絡(luò)的設(shè)計

模型量化技術(shù)旨在將全精度的深度學(xué)習(xí)模型離散化為對應(yīng)的低比特量化網(wǎng)絡(luò),以獲取運行時執(zhí)行速度的提升,以及內(nèi)存占用和功耗的降低。本文提出了一種面向物體檢測應(yīng)用的高精度低比特量化網(wǎng)絡(luò)設(shè)計流程。該量化流程允許物體檢測網(wǎng)絡(luò)在推理階段的網(wǎng)絡(luò)執(zhí)行部分只使用整型計算,同時能夠做到4bit量化取得接近全精度網(wǎng)絡(luò)的性能。這項工作能夠適用于其他類型的計算機視覺任務(wù),為算法在資源受限平臺上的部署提供了參考。
論文鏈接:
https://arxiv.org/abs/2007.06919
項目鏈接:
https://github.com/aim-uofa/model-quantization
https://github.com/blueardour/AdelaiDet
https://github.com/blueardour/detectron2
陳鵬 | 中國科學(xué)技術(shù)大學(xué)博士
陳鵬,博士畢業(yè)于中國科學(xué)技術(shù)大學(xué),計算機體系結(jié)構(gòu)專業(yè)。畢業(yè)后加入上海華為科技有限公司消費者BG部門,從事NPU架構(gòu)規(guī)劃方面的工作。2019~2020年在澳洲阿德萊德大學(xué)沈春華老師課題組做博后,主要的研究方向是基于深度學(xué)習(xí)模型的計算機視覺算法和模型壓縮技術(shù)。
個人主頁:
https://blueardour.github.io/
②
從視頻中學(xué)習(xí)非口頭交流里的三元信念動態(tài)變化

非口頭交流可以在人與人之間傳達(dá)豐富的社會交互信息。我們結(jié)合不同的非口頭交流信號(例如,眼神,體態(tài)和手勢),從純視覺視頻輸入中對人與人交互過程中的信念動態(tài)變化進(jìn)行建模學(xué)習(xí)和推斷,基于“共同心智”提出“五心”模型。我們的模型在社交互動視頻的總結(jié)摘要問題上具有很好的表現(xiàn)。
論文鏈接:
https://lifengfan.github.io/files/cvpr21/TBD_paper.pdf
項目鏈接:
https://github.com/LifengFan/Triadic-Belief-Dynamics
范麗鳳?|?美國加州大學(xué)洛杉磯分校統(tǒng)計學(xué)博士
范麗鳳,本科畢業(yè)于浙江大學(xué)統(tǒng)計學(xué)專業(yè),現(xiàn)于美國加州大學(xué)洛杉磯分校(UCLA)攻讀統(tǒng)計學(xué)博士學(xué)位,師從朱松純教授,研究計算機視覺和人工智能,主要研究方向為社會交互場景的深度理解,包括非口頭交流中的行為識別和認(rèn)知建模等等。
個人主頁:
https://lifengfan.github.io/
③
一款移動端基于編譯器超實時加速的神經(jīng)網(wǎng)絡(luò)剪枝與搜索統(tǒng)一框架

隨著在移動邊緣設(shè)備上部署DNN的需求不斷增加,減少不必要的神經(jīng)網(wǎng)絡(luò)計算并提高執(zhí)行速度變得越來越重要。為了實現(xiàn)這一點,人們嘗試了不同方法,包括模型壓縮,以及網(wǎng)絡(luò)架構(gòu)搜索(NAS)。但這些工作大多是獨立進(jìn)行的,且沒有充分考慮編譯器級別的優(yōu)化。在這篇論文中,我們完善了細(xì)粒度模型裁剪類別,并提出了相對應(yīng)的可以支持不同DNN結(jié)構(gòu)與裁剪模式的編譯器自動代碼生成框架,基于以上兩點,我們提出了將網(wǎng)絡(luò)剪枝,網(wǎng)絡(luò)結(jié)構(gòu)搜索相結(jié)合的統(tǒng)一搜索框架NPAS。我們的框架在三星S10手機上實現(xiàn)了6.7ms、5.9ms、3.9ms的ImageNet推斷時間,并分別達(dá)到了78.2%、75%(MobileNet-V3級別)和71%(MobileNet-V2級別)的Top-1準(zhǔn)確率,這些結(jié)果穩(wěn)定優(yōu)于之前的工作。
論文鏈接:
https://arxiv.org/pdf/2012.00596.pdf
李振綱 |?美國東北大學(xué)博士生李振綱,本科畢業(yè)于浙江大學(xué)電子信息工程,研究生畢業(yè)于美國Northeastern University,現(xiàn)繼續(xù)在Northeastern University攻讀Computer Engineering博士學(xué)位。主要研究方向包括深度學(xué)習(xí)算法,模型壓縮與加速,機器視覺。
個人主頁:
https://www.linkedin.com/in/zhengang-li-2a7aba156/
④
PatchGenCN:基于單張圖片的能量模型學(xué)習(xí)

研究單張自然圖片的內(nèi)在統(tǒng)計分布在計算機視覺領(lǐng)域有極大的意義和挑戰(zhàn)。本論文提出通過能量模型對單張圖片進(jìn)行顯示表征,并直接基于學(xué)到的模型進(jìn)行由粗到細(xì)的采樣以獲得相似分布的自然圖片。實驗表明,本模型可以簡潔、有效地應(yīng)用在圖片生成、圖片修改、風(fēng)格遷移等任務(wù)中。
論文鏈接:
https://zilongzheng.github.io/assets/projects/PatchGenCN/CVPR21_PatchGenCN.pdf
代碼鏈接:
https://github.com/zilongzheng/PatchGenCN
鄭子隆 |?美國加州大學(xué)洛杉磯分校博士
鄭子隆,2021年畢業(yè)于美國加州大學(xué)洛杉磯分校,主要研究方向包括多模態(tài)建模、能量模型學(xué)習(xí)、對話管理等。博士期間發(fā)表CVPR、AAAI等頂級國際期刊十余篇,并三次以第一作者/并列一作發(fā)表CVPR的Oral論文,多次參加CVPR、ICCV、AAAI、NeurIPS等頂級會議的審稿。
個人主頁:
web.cs.ucla.edu/~zilongzheng
關(guān)于TechBeat人工智能社區(qū)
TechBeat(www.techbeat.net)是一個薈聚全球華人AI精英的成長社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其學(xué)習(xí)成長。期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ