Talk預(yù)告 | 伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室系列③:強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性

本期為TechBeat人工智能社區(qū)第382期線上Talk,也是伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室“可信機(jī)器學(xué)習(xí): 機(jī)器學(xué)習(xí)魯棒性,隱私性,泛化性,及其內(nèi)在關(guān)聯(lián)”的系列Talk第③場(chǎng)。北京時(shí)間2月23日(周三)20:00,伊利諾伊大學(xué)在讀博士生——吳凡的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開(kāi)播!
她與大家分享的主題是: “強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性”,屆時(shí)將分享第一個(gè)對(duì)于強(qiáng)化學(xué)習(xí)魯棒性驗(yàn)證的統(tǒng)一框架,以狀態(tài)層面的行為穩(wěn)定性和軌跡層面的累計(jì)回報(bào)下界作為驗(yàn)證標(biāo)準(zhǔn),為強(qiáng)化學(xué)習(xí)系統(tǒng)提供魯棒性驗(yàn)證。
Talk·信息
主題:強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性
嘉賓:伊利諾伊大學(xué)在讀博士生吳凡
時(shí)間:北京時(shí)間?2月23日?(周三) 20:00
地點(diǎn):TechBeat人工智能社區(qū)
http://www.techbeat.net/

完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/lPQrp7ao至瀏覽器,一鍵完成預(yù)約!上線后會(huì)在第一時(shí)間收到通知哦?
Talk·提綱
當(dāng)下,強(qiáng)化學(xué)習(xí)被大規(guī)模地應(yīng)用于諸如自動(dòng)駕駛之類的安全敏感的應(yīng)用中,然而一系列針對(duì)強(qiáng)化學(xué)習(xí)的攻擊的工作揭露了其脆弱性。盡管目前有一些經(jīng)驗(yàn)化的防御被提出,但它們又會(huì)被更強(qiáng)的適應(yīng)性的攻擊化解。鑒于此,我們認(rèn)為僅僅通過(guò)測(cè)試,或通過(guò)經(jīng)驗(yàn)性地防御去提高系統(tǒng)魯棒性并不足以切實(shí)提供可靠保障——我們需要的是對(duì)強(qiáng)化學(xué)習(xí)系統(tǒng)的魯棒性的嚴(yán)格驗(yàn)證。于是,我們提出了第一個(gè)對(duì)于強(qiáng)化學(xué)習(xí)魯棒性驗(yàn)證的統(tǒng)一框架,以狀態(tài)層面的行為穩(wěn)定性和軌跡層面的累計(jì)回報(bào)下界作為驗(yàn)證標(biāo)準(zhǔn),為強(qiáng)化學(xué)習(xí)系統(tǒng)提供魯棒性驗(yàn)證。
在本次Talk中,講者會(huì)具體介紹針對(duì)該問(wèn)題的兩篇工作,分別著眼于強(qiáng)化學(xué)習(xí)系統(tǒng)在測(cè)試和訓(xùn)練階段的魯棒性,以不同的方式獲得魯棒模型及其驗(yàn)證。
具體分享提綱如下:
· 針對(duì)強(qiáng)化學(xué)習(xí)測(cè)試階段的魯棒性驗(yàn)證
· 針對(duì)離線強(qiáng)化學(xué)習(xí)訓(xùn)練階段的魯棒性驗(yàn)證
Talk·預(yù)習(xí)資料
CROP論文:
https://openreview.net/forum?id=HOjLHrlZhmx
CROP leaderboard:?
https://crop-leaderboard.me/
COPA論文:
https://openreview.net/forum?id=psh0oeMSBiF
Talk·提問(wèn)交流
通過(guò)以下兩種方式提問(wèn)都將獲得微信現(xiàn)金紅包獎(jiǎng)勵(lì)哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動(dòng)!留下你的打call??和問(wèn)題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會(huì)給予你相應(yīng)的i豆積分,還會(huì)有驚喜獎(jiǎng)勵(lì)哦!
方式 ②
在本文留言區(qū)直接提出你的問(wèn)題,或掃描下方二維碼提問(wèn)!

Talk·嘉賓介紹

伊利諾伊大學(xué)在讀博士生
吳凡,現(xiàn)為伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)Secure Learning Lab (SL2) 的二年級(jí)博士生,在李博教授門下接受指導(dǎo)。吳凡當(dāng)前的主要研究方向?yàn)榭尚刨嚈C(jī)器學(xué)習(xí),包括安全性,隱私性,以及可解釋性。她還特別著眼于強(qiáng)化學(xué)習(xí)的場(chǎng)景,通過(guò)為其提供魯棒性驗(yàn)證、或利用數(shù)據(jù)價(jià)值評(píng)估工具或知識(shí)準(zhǔn)則,意圖達(dá)到更安全、高效、可解釋的強(qiáng)化學(xué)習(xí)。吳凡目前已有多篇論文發(fā)表在相關(guān)領(lǐng)域的頂級(jí)會(huì)議,包括機(jī)器學(xué)習(xí)會(huì)議(ICLR、CVPR、NeurIPS)及計(jì)算機(jī)安全會(huì)議(IEEE S&P、ACM CCS)。吳凡于2020年以優(yōu)秀畢業(yè)生榮譽(yù)本科畢業(yè)于南京大學(xué)。
個(gè)人主頁(yè):https://kkkkahlua.github.io/

系列Talk介紹

伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室SL2(Secure Learning Lab)(http://boli.cs.illinois.edu/)由助理教授李博以及10名博士生和1名博士后組成,實(shí)驗(yàn)室隸屬于計(jì)算機(jī)組(https://cs.illinois.edu/)。
我們相信機(jī)器學(xué)習(xí)的安全性,隱私保護(hù),可解釋性等可信賴性質(zhì)是引領(lǐng)未來(lái)機(jī)器學(xué)習(xí)算法和模型大規(guī)模部署和應(yīng)用的重要特質(zhì),尤其是在自動(dòng)駕駛等對(duì)安全性質(zhì)要求頗高的應(yīng)用中。基于此核心理念,SL2實(shí)驗(yàn)室的研究重點(diǎn)是構(gòu)建可驗(yàn)證性的可信機(jī)器學(xué)習(xí)算法,平臺(tái)和系統(tǒng),從而部署于不同的實(shí)際應(yīng)用中。
從2月16日開(kāi)始,每周三、周四晚20點(diǎn),伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室的老師及同學(xué)們將帶來(lái)一系列的Talk分享,議程如下:

關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長(zhǎng)。 期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ?