直播 | 商湯科技龔睿昊&李雨杭: 基于塊重建的離線量化算法

本周為商湯?x?TechBeat系列直播課,也是ICLR 2021系列Talk第⑤期。
北京時(shí)間4月14日(周三)19:00,商湯科技高級(jí)研究員—龔睿昊、見習(xí)研究員—李雨杭的直播課將準(zhǔn)時(shí)在將門B站直播間開播!
本次Talk的主題是: “基于塊重建的離線量化算法”,屆時(shí)將分享有關(guān)模型壓縮、離線量化、高效推理等方面的研究與思考。
課程信息
主題:基于塊重建的離線量化算法
嘉賓:商湯科技見習(xí)研究員?李雨杭、商湯科技高級(jí)研究員?龔睿昊
時(shí)間:4月14日(周三) 19:00
地點(diǎn):將門-TechBeat社區(qū)?B站直播間
https://live.bilibili.com/22183939

課程摘要
在深度學(xué)習(xí)的各個(gè)垂直領(lǐng)域中,模型量化被廣泛應(yīng)用以加速推理部署。然而現(xiàn)在的量化感知訓(xùn)練方法需要消耗大量的訓(xùn)練資源,成本極高。如何使用離線量化來(lái)快速生產(chǎn)一個(gè)效果媲美量化感知訓(xùn)練的模型至關(guān)重要,因此基于塊重建的離線量化算法具有極高的工業(yè)落地價(jià)值。本次分享的主要內(nèi)容如下:
1. 模型量化基本概念
2. 量化感知訓(xùn)練和離線量化區(qū)別
3. 離線量化的難點(diǎn)
4. 基于塊重建的離線量化
5. 如何實(shí)現(xiàn)離線混合精度
6. 實(shí)驗(yàn)對(duì)比
7. 討論
參考資料
這是本次分享中將會(huì)提及的資料,建議提前預(yù)習(xí)哦!
1. Up or Down? Adaptive Rounding for Post-Training Quantization?
https://arxiv.org/pdf/2004.10568.pdf
2.?Brecq: Pushing?The?Limit?Of?Post-Training?Quantization?By?Block Reconstruction
https://arxiv.org/pdf/2102.05426.pdf
主講人

商湯科技高級(jí)研究員
龔睿昊,碩士畢業(yè)于北航計(jì)算機(jī)學(xué)院,大三下加入商湯科技實(shí)習(xí),現(xiàn)為商湯科技高級(jí)研究員。期間先后從事視頻結(jié)構(gòu)化解析系統(tǒng)開發(fā),模型量化壓縮框架的設(shè)計(jì)開發(fā)和相關(guān)算法研究,服務(wù)大量業(yè)務(wù)線模型的壓縮落地。曾獲得商湯科技未來(lái)之星、騰訊犀牛鳥人才培養(yǎng)計(jì)劃、CCF優(yōu)秀大學(xué)生、北京市三好學(xué)生、國(guó)家獎(jiǎng)學(xué)金等,在ICCV、CVPR、ICLR、PR等期刊會(huì)議上發(fā)表10篇論文(其中2篇一作,4篇二作)?,F(xiàn)主要研究和工作方向?yàn)? 深度學(xué)習(xí)模型壓縮和部署編譯,致力于打破硬件彩票假設(shè),最大化榨取模型和系統(tǒng)的潛力。

商湯科技見習(xí)研究員
李雨杭,去年開始加入商湯科技實(shí)習(xí),現(xiàn)為耶魯大學(xué)準(zhǔn)博士一年級(jí)新生。期間主要的研究方向?yàn)槟P土炕c部署,包括量化感知訓(xùn)練和后訓(xùn)練量化以及量化框架的開發(fā)設(shè)計(jì),致力于解決神經(jīng)網(wǎng)絡(luò)在部署過(guò)程中低速推理的問(wèn)題。曾在ICLR,AAAI,CVPR,IEEE VR會(huì)議上發(fā)表論文共計(jì)6篇。
關(guān)于TechBeat人工智能社區(qū)
▼
TechBeat(www.techbeat.net)是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長(zhǎng)。期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ