Talk預(yù)告 | 北京大學(xué)人工智能研究院楊耀東:一個合作博弈的通用求解框架

本期為TechBeat人工智能社區(qū)第441期線上Talk。
北京時間9月21日(周三)20:00,北京大學(xué)人工智能研究院研究員——楊耀東的Talk將準(zhǔn)時在TechBeat人工智能社區(qū)開播!他與大家分享的主題是: “一個合作博弈的通用求解框架”,屆時將介紹一個通用的基于多智能體強(qiáng)化學(xué)習(xí)技術(shù)的合作博弈求解框架:多智能體鏡像學(xué)習(xí)(Heterogeneosu Multi-Agent Mirror Learning)。
Talk·信息
主題:一個合作博弈的通用求解框架
嘉賓:北京大學(xué)人工智能研究院研究員?楊耀東
時間:北京時間?9月21日?(周三) 20:00
地點:TechBeat人工智能社區(qū)
?長按識別二維碼,一鍵預(yù)約TALK!

完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/EoZAvZkP瀏覽器,一鍵完成預(yù)約!上線后會在第一時間收到通知哦
Talk·介紹
通過強(qiáng)化學(xué)習(xí)方法求解多智能體博弈合作問題具有眾多的現(xiàn)實應(yīng)用,例如靈巧雙手操縱、無人機(jī)群編隊等。在本次分享中,我將會介紹一個通用的基于多智能體強(qiáng)化學(xué)習(xí)技術(shù)的合作博弈求解框架:多智能體鏡像學(xué)習(xí)(Heterogeneosu Multi-Agent Mirror Learning)。
HAML提供了一個通用的算法設(shè)計范式,它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等,并且HAML算法框架中的成員都天然具有嚴(yán)格的單調(diào)遞增性的保證。此外,HAML框架還提供了一系列新的多智能體算法,例如HADDPG, HADQN, HAA3C。在一系列合作博弈場景,例如星際爭霸,靈巧雙手操作上,他們都達(dá)到了SOTA水平。
Talk·提問交流
通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動!留下你的打call??和問題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會給予你相應(yīng)的i豆積分,還會有驚喜獎勵哦!
方式 ②
在本文留言區(qū)直接提出你的問題,或掃描下方二維碼提問!

Talk·嘉賓介紹

北京大學(xué)人工智能研究院研究員
楊耀東,北京大學(xué)人工智能研究院研究員、博導(dǎo),倫敦國王大學(xué)客座助理教授??蒲蓄I(lǐng)域包括強(qiáng)化學(xué)習(xí)、博弈論和多智能體系統(tǒng),重點關(guān)注基于強(qiáng)化學(xué)習(xí)技術(shù)的群體智能涌現(xiàn)。在加入北京大學(xué)以前,他曾任倫敦國王大學(xué)助理教授,華為英國研究所主任研究員,美國國際集團(tuán)科學(xué)部高級經(jīng)理。楊耀東本科畢業(yè)于于中國科學(xué)技術(shù)大學(xué),碩士畢業(yè)于英國帝國理工大學(xué),博士畢業(yè)于英國倫敦大學(xué)。
個人主頁:
www.yangyaodong.com

-The End-

關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其學(xué)習(xí)成長。 期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ?