散文網(wǎng) » 科技 »學(xué)習(xí) » Talk預(yù)告 | 伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室系列③：強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性

Talk預(yù)告 | 伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室系列③：強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性

2022-02-22 11:24 作者:TechBeat人工智能社區(qū) 0人讀過(guò) | 我要投稿

本期為TechBeat人工智能社區(qū)第382期線上Talk，也是伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室“可信機(jī)器學(xué)習(xí): 機(jī)器學(xué)習(xí)魯棒性，隱私性，泛化性，及其內(nèi)在關(guān)聯(lián)”的系列Talk第③場(chǎng)。北京時(shí)間2月23日(周三)20:00，伊利諾伊大學(xué)在讀博士生——吳凡的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開(kāi)播！

她與大家分享的主題是: “強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性”，屆時(shí)將分享第一個(gè)對(duì)于強(qiáng)化學(xué)習(xí)魯棒性驗(yàn)證的統(tǒng)一框架，以狀態(tài)層面的行為穩(wěn)定性和軌跡層面的累計(jì)回報(bào)下界作為驗(yàn)證標(biāo)準(zhǔn)，為強(qiáng)化學(xué)習(xí)系統(tǒng)提供魯棒性驗(yàn)證。

Talk·信息

主題：強(qiáng)化學(xué)習(xí)的可驗(yàn)證魯棒性

嘉賓：伊利諾伊大學(xué)在讀博士生吳凡

時(shí)間：北京時(shí)間?2月23日?(周三) 20:00

地點(diǎn)：TechBeat人工智能社區(qū)

http://www.techbeat.net/

完整版怎么看？

掃描下方二維碼，或復(fù)制鏈接https://datayi.cn/w/lPQrp7ao至瀏覽器，一鍵完成預(yù)約！上線后會(huì)在第一時(shí)間收到通知哦?

Talk·提綱

當(dāng)下，強(qiáng)化學(xué)習(xí)被大規(guī)模地應(yīng)用于諸如自動(dòng)駕駛之類的安全敏感的應(yīng)用中，然而一系列針對(duì)強(qiáng)化學(xué)習(xí)的攻擊的工作揭露了其脆弱性。盡管目前有一些經(jīng)驗(yàn)化的防御被提出，但它們又會(huì)被更強(qiáng)的適應(yīng)性的攻擊化解。鑒于此，我們認(rèn)為僅僅通過(guò)測(cè)試，或通過(guò)經(jīng)驗(yàn)性地防御去提高系統(tǒng)魯棒性并不足以切實(shí)提供可靠保障——我們需要的是對(duì)強(qiáng)化學(xué)習(xí)系統(tǒng)的魯棒性的嚴(yán)格驗(yàn)證。于是，我們提出了第一個(gè)對(duì)于強(qiáng)化學(xué)習(xí)魯棒性驗(yàn)證的統(tǒng)一框架，以狀態(tài)層面的行為穩(wěn)定性和軌跡層面的累計(jì)回報(bào)下界作為驗(yàn)證標(biāo)準(zhǔn)，為強(qiáng)化學(xué)習(xí)系統(tǒng)提供魯棒性驗(yàn)證。

在本次Talk中，講者會(huì)具體介紹針對(duì)該問(wèn)題的兩篇工作，分別著眼于強(qiáng)化學(xué)習(xí)系統(tǒng)在測(cè)試和訓(xùn)練階段的魯棒性，以不同的方式獲得魯棒模型及其驗(yàn)證。

具體分享提綱如下：

· 針對(duì)強(qiáng)化學(xué)習(xí)測(cè)試階段的魯棒性驗(yàn)證

· 針對(duì)離線強(qiáng)化學(xué)習(xí)訓(xùn)練階段的魯棒性驗(yàn)證

Talk·預(yù)習(xí)資料

CROP論文：

https://openreview.net/forum?id=HOjLHrlZhmx

CROP leaderboard:?

https://crop-leaderboard.me/

COPA論文：

https://openreview.net/forum?id=psh0oeMSBiF

Talk·提問(wèn)交流

通過(guò)以下兩種方式提問(wèn)都將獲得微信現(xiàn)金紅包獎(jiǎng)勵(lì)哦！

方式 ①

在Talk界面下的【交流區(qū)】參與互動(dòng)！留下你的打call??和問(wèn)題??，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻(xiàn)，我們都會(huì)給予你相應(yīng)的i豆積分，還會(huì)有驚喜獎(jiǎng)勵(lì)哦！

方式 ②

在本文留言區(qū)直接提出你的問(wèn)題，或掃描下方二維碼提問(wèn)！

Talk·嘉賓介紹

吳凡，現(xiàn)為伊利諾伊大學(xué)厄巴納-香檳分校（UIUC）Secure Learning Lab (SL2) 的二年級(jí)博士生，在李博教授門下接受指導(dǎo)。吳凡當(dāng)前的主要研究方向?yàn)榭尚刨嚈C(jī)器學(xué)習(xí)，包括安全性，隱私性，以及可解釋性。她還特別著眼于強(qiáng)化學(xué)習(xí)的場(chǎng)景，通過(guò)為其提供魯棒性驗(yàn)證、或利用數(shù)據(jù)價(jià)值評(píng)估工具或知識(shí)準(zhǔn)則，意圖達(dá)到更安全、高效、可解釋的強(qiáng)化學(xué)習(xí)。吳凡目前已有多篇論文發(fā)表在相關(guān)領(lǐng)域的頂級(jí)會(huì)議，包括機(jī)器學(xué)習(xí)會(huì)議（ICLR、CVPR、NeurIPS）及計(jì)算機(jī)安全會(huì)議（IEEE S&P、ACM CCS）。吳凡于2020年以優(yōu)秀畢業(yè)生榮譽(yù)本科畢業(yè)于南京大學(xué)。

個(gè)人主頁(yè)：https://kkkkahlua.github.io/

系列Talk介紹

伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室SL2(Secure Learning Lab)（http://boli.cs.illinois.edu/）由助理教授李博以及10名博士生和1名博士后組成，實(shí)驗(yàn)室隸屬于計(jì)算機(jī)組(https://cs.illinois.edu/)。

我們相信機(jī)器學(xué)習(xí)的安全性，隱私保護(hù)，可解釋性等可信賴性質(zhì)是引領(lǐng)未來(lái)機(jī)器學(xué)習(xí)算法和模型大規(guī)模部署和應(yīng)用的重要特質(zhì)，尤其是在自動(dòng)駕駛等對(duì)安全性質(zhì)要求頗高的應(yīng)用中。基于此核心理念，SL2實(shí)驗(yàn)室的研究重點(diǎn)是構(gòu)建可驗(yàn)證性的可信機(jī)器學(xué)習(xí)算法，平臺(tái)和系統(tǒng)，從而部署于不同的實(shí)際應(yīng)用中。

從2月16日開(kāi)始，每周三、周四晚20點(diǎn)，伊利諾伊大學(xué)安全學(xué)習(xí)實(shí)驗(yàn)室的老師及同學(xué)們將帶來(lái)一系列的Talk分享，議程如下：

關(guān)于TechBeat人工智能社區(qū)

TechBeat (www.techbeat.net) 是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn)，加速并陪伴其學(xué)習(xí)成長(zhǎng)。期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地，分享自己最新工作的沃土，在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地！

更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ?

標(biāo)簽：