Talk預(yù)告 | 悉尼科技大學(xué)在讀博士生胡思逸:MARLlib,全新的多智能體強(qiáng)化學(xué)習(xí)框架

本期為TechBeat人工智能社區(qū)第464期線上Talk!
北京時(shí)間12月21日(周三)20:00,悉尼科技大學(xué)澳大利亞人工智能研究所ReLER實(shí)驗(yàn)室在讀博士生——胡思逸的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開(kāi)播!
他與大家分享的主題是:?“MARLlib, 全新的多智能體強(qiáng)化學(xué)習(xí)框架”,屆時(shí)將介紹MARLlib及框架細(xì)節(jié)與設(shè)計(jì)思路。
Talk·信息
主題:MARLlib, 全新的多智能體強(qiáng)化學(xué)習(xí)框架
嘉賓:悉尼科技大學(xué)澳大利亞人工智能研究所ReLER實(shí)驗(yàn)室在讀博士生?胡思逸
合作老師:常曉軍(悉尼科技大學(xué))楊耀東(北京大學(xué))
時(shí)間:北京時(shí)間?12月21日?(周三) 20:00
地點(diǎn):TechBeat人工智能社區(qū)
http://www.techbeat.net/

完整版怎么看
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/nPNJ26lP瀏覽器,一鍵完成預(yù)約!上線后會(huì)在第一時(shí)間收到通知哦?
Talk·介紹
當(dāng)前多智能體強(qiáng)化學(xué)習(xí)的研究由于已有工作的在實(shí)驗(yàn)環(huán)境和算法的復(fù)雜性,多樣性等難點(diǎn)導(dǎo)致開(kāi)展新工作十分困難。已有的多智能體強(qiáng)化學(xué)習(xí)框架存在環(huán)境單一,算法結(jié)構(gòu)混亂,難以進(jìn)行拓展等問(wèn)題。一個(gè)統(tǒng)一任務(wù)和算法的框架急需提出,以推動(dòng)多智能體強(qiáng)化學(xué)習(xí)研究工作進(jìn)展。
Talk大綱內(nèi)容:
1. 多智能體強(qiáng)化學(xué)習(xí)框架搭建的挑戰(zhàn)
2. MARLlib 總體介紹與已有工作的比較
3. MARLlib 框架細(xì)節(jié)與設(shè)計(jì)思路
Talk·預(yù)習(xí)資料
Paper:https://arxiv.org/pdf/2210.13708.pdf
Code:?https://github.com/Replicable-MARL/MARLlib
Docs:https://marllib.readthedocs.io/en/latest/index.html
Results:?https://github.com/Replicable-MARL/MARLlib/tree/main/results
Docker:https://github.com/Replicable-MARL/MARLlib#docker
Talk·提問(wèn)交流
在Talk界面下的【交流區(qū)】參與互動(dòng)!
留下你的打call??和問(wèn)題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會(huì)給予你相應(yīng)的i豆積分,還會(huì)有驚喜獎(jiǎng)勵(lì)哦!
Talk·嘉賓介紹

胡思逸
悉尼科技大學(xué)澳大利亞人工智能研究所ReLER實(shí)驗(yàn)室在讀博士生
悉尼科技大學(xué)澳大利亞人工智能研究所ReLER實(shí)驗(yàn)室在讀博士。主要研究方向?yàn)槎嘀悄荏w強(qiáng)化學(xué)習(xí)和多智能體系統(tǒng)。在ICLR ICML等頂級(jí)會(huì)議上以第一作者發(fā)表文章。

-The End-

關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個(gè)薈聚全球華人AI精英的成長(zhǎng)社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長(zhǎng)。 期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ