散文網(wǎng) » 科技 »學(xué)習(xí) » Talk預(yù)告 | 北京大學(xué)人工智能研究院楊耀東：一個合作博弈的通用求解框架

Talk預(yù)告 | 北京大學(xué)人工智能研究院楊耀東：一個合作博弈的通用求解框架

2022-09-20 14:47 作者:TechBeat人工智能社區(qū) 0人讀過 | 我要投稿

本期為TechBeat人工智能社區(qū)第441期線上Talk。

北京時間9月21日(周三)20:00，北京大學(xué)人工智能研究院研究員——楊耀東的Talk將準(zhǔn)時在TechBeat人工智能社區(qū)開播！他與大家分享的主題是: “一個合作博弈的通用求解框架”，屆時將介紹一個通用的基于多智能體強(qiáng)化學(xué)習(xí)技術(shù)的合作博弈求解框架：多智能體鏡像學(xué)習(xí)（Heterogeneosu Multi-Agent Mirror Learning）。

Talk·信息

主題：一個合作博弈的通用求解框架

嘉賓：北京大學(xué)人工智能研究院研究員?楊耀東

時間：北京時間?9月21日?(周三) 20:00

地點：TechBeat人工智能社區(qū)

?長按識別二維碼，一鍵預(yù)約TALK！

完整版怎么看？

掃描下方二維碼，或復(fù)制鏈接https://datayi.cn/w/EoZAvZkP瀏覽器，一鍵完成預(yù)約！上線后會在第一時間收到通知哦

Talk·介紹

通過強(qiáng)化學(xué)習(xí)方法求解多智能體博弈合作問題具有眾多的現(xiàn)實應(yīng)用，例如靈巧雙手操縱、無人機(jī)群編隊等。在本次分享中，我將會介紹一個通用的基于多智能體強(qiáng)化學(xué)習(xí)技術(shù)的合作博弈求解框架：多智能體鏡像學(xué)習(xí)（Heterogeneosu Multi-Agent Mirror Learning）。

HAML提供了一個通用的算法設(shè)計范式，它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等，并且HAML算法框架中的成員都天然具有嚴(yán)格的單調(diào)遞增性的保證。此外，HAML框架還提供了一系列新的多智能體算法，例如HADDPG, HADQN, HAA3C。在一系列合作博弈場景，例如星際爭霸，靈巧雙手操作上，他們都達(dá)到了SOTA水平。

Talk·提問交流

通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦！

方式 ①

在Talk界面下的【交流區(qū)】參與互動！留下你的打call??和問題??，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻(xiàn)，我們都會給予你相應(yīng)的i豆積分，還會有驚喜獎勵哦！

方式 ②

在本文留言區(qū)直接提出你的問題，或掃描下方二維碼提問！

Talk·嘉賓介紹

楊耀東，北京大學(xué)人工智能研究院研究員、博導(dǎo)，倫敦國王大學(xué)客座助理教授?？蒲蓄I(lǐng)域包括強(qiáng)化學(xué)習(xí)、博弈論和多智能體系統(tǒng)，重點關(guān)注基于強(qiáng)化學(xué)習(xí)技術(shù)的群體智能涌現(xiàn)。在加入北京大學(xué)以前，他曾任倫敦國王大學(xué)助理教授，華為英國研究所主任研究員，美國國際集團(tuán)科學(xué)部高級經(jīng)理。楊耀東本科畢業(yè)于于中國科學(xué)技術(shù)大學(xué)，碩士畢業(yè)于英國帝國理工大學(xué)，博士畢業(yè)于英國倫敦大學(xué)。

個人主頁：

www.yangyaodong.com

-The End-

關(guān)于TechBeat人工智能社區(qū)

TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗，加速并陪伴其學(xué)習(xí)成長。期待這里可以成為你學(xué)習(xí)AI前沿知識的高地，分享自己最新工作的沃土，在AI進(jìn)階之路上的升級打怪的根據(jù)地！

更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ?

標(biāo)簽：