7.23 ICML直播 | 浙大DCD實(shí)驗(yàn)室況琨團(tuán)隊(duì):元學(xué)習(xí)去混雜、多智能體強(qiáng)化學(xué)習(xí)、因果推理

正在如火如荼展開的ICML 2022即將進(jìn)入尾聲,但是攤兒還得續(xù)上!北京時(shí)間7月23日(本周六)上午10點(diǎn),將門-TechBeat人工智能社區(qū)很開心邀請(qǐng)到浙江大學(xué)計(jì)算機(jī)學(xué)院數(shù)字媒體計(jì)算與設(shè)計(jì)實(shí)驗(yàn)室的況琨副教授和3位在讀博士生——蔣胤傑、李佳暉、吳安鵬,為大家講解在本次ICML上的三篇工作,并進(jìn)行實(shí)時(shí)Q&A,內(nèi)容涵蓋:
① 元學(xué)習(xí)中的去混雜方法
② 多智能體強(qiáng)化學(xué)習(xí)中的去混淆值分解方法
③ 混淆平衡因果工具變量回歸法
活動(dòng)議程?+ 報(bào)名

活動(dòng)福利
活動(dòng)中將進(jìn)行互動(dòng)Q&A,我們將在視頻號(hào)和B站直播間中抽取3位提問最積極走心的同學(xué)送出“夏日運(yùn)動(dòng)禮包”(內(nèi)含:運(yùn)動(dòng)頭帶、運(yùn)動(dòng)毛巾、超大容量不銹鋼水杯、單肩包)!
團(tuán)隊(duì)介紹

團(tuán)隊(duì)名稱
浙江大學(xué)DCD實(shí)驗(yàn)室
團(tuán)隊(duì)介紹
浙江大學(xué)計(jì)算機(jī)學(xué)院數(shù)字媒體計(jì)算與設(shè)計(jì)實(shí)驗(yàn)室(Digital media Computing & Design Lab,簡稱為 DCD):初建于 1998年。團(tuán)隊(duì)圍繞跨媒體計(jì)算、人工智能、大數(shù)據(jù)理論與應(yīng)用三大方向,以合作承擔(dān)國家重大(重點(diǎn))項(xiàng)目為契機(jī),歷經(jīng)將近 20 年建設(shè),形成了優(yōu)秀研究群體。團(tuán)隊(duì)核心成員以中青年人才為主體,年富力強(qiáng),開拓創(chuàng)新,他們都活躍在教學(xué)科研第一線,擁有深厚理論功底和豐富科研經(jīng)驗(yàn),具有以國際學(xué)科前沿、國家需求和實(shí)際應(yīng)用為導(dǎo)向的社會(huì)責(zé)任感,也具有充沛時(shí)間和精力完成好本團(tuán)隊(duì)科研任務(wù)。團(tuán)隊(duì)研究具有明顯跨學(xué)科和交叉特色,為研究內(nèi)容順利實(shí)施奠定了學(xué)科交叉人才基礎(chǔ)。
團(tuán)隊(duì)老師

況琨,浙江大學(xué)計(jì)算機(jī)學(xué)院副教授,博士生導(dǎo)師,人工智能系副主任。2019年獲得清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)博士學(xué)位,2017-2018年訪問美國斯坦福大學(xué)。獲2021年度中國科協(xié)青年人才托舉工程項(xiàng)目支持,2021年度中國電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)(科技進(jìn)步)一等獎(jiǎng),2020年度中國人工智能學(xué)會(huì)優(yōu)秀博士學(xué)位論文提名獎(jiǎng)。主要研究方向包括因果推理、人工智能、因果可信機(jī)器學(xué)習(xí),關(guān)注機(jī)器學(xué)習(xí)的可解釋性、穩(wěn)定性、公平性和可決策性。在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域已發(fā)表近50余篇頂級(jí)會(huì)議和期刊文章,包括KDD、ICML、MM、AAAI、TKDE、TKDD、Engineering等。
工作及分享嘉賓
①
元學(xué)習(xí)中的去混雜方法
(The role of deconfounding in meta-learning)

工作介紹
元學(xué)習(xí)能夠在元訓(xùn)練任務(wù)中學(xué)到的元知識(shí),已經(jīng)成為快速學(xué)習(xí)少樣本任務(wù)的有效手段。然而,最近的證據(jù)表明,元知識(shí)僅記憶所有元訓(xùn)練任務(wù),這會(huì)阻礙特定任務(wù)的適應(yīng)且不具備泛化能力,即在元學(xué)習(xí)中存在不良的記憶效應(yīng)。目前已經(jīng)有幾種減輕這種影響的解決方案,包括基于正則化和基于數(shù)據(jù)增強(qiáng)的方法,但仍然缺乏對(duì)這些方法的系統(tǒng)理解。在本文中,我們通過因果理論的視角,發(fā)現(xiàn)通用標(biāo)簽空間作為混雜因素是導(dǎo)致記憶效應(yīng)的因素,并總結(jié)出了過去的方法如何對(duì)抗記憶效應(yīng)。此外,我們通過因果理論中的前門調(diào)整策略,提出了兩種簡單但有效的去混雜算法,即通過 Dropout 對(duì)元知識(shí)的多個(gè)版本進(jìn)行采樣,以及將元知識(shí)分組到多個(gè)箱中。我們所提出的因果觀點(diǎn)不僅帶來了兩種去混雜因素的算法,能夠在四個(gè)基準(zhǔn)數(shù)據(jù)集中超越了以前的工作,而且還為元學(xué)習(xí)開辟了一個(gè)全新的方向。
分享嘉賓
蔣胤傑,浙江大學(xué)博士研究生
個(gè)人介紹
蔣胤傑,本科畢業(yè)于浙江大學(xué),現(xiàn)就讀于浙江大學(xué)計(jì)算機(jī)學(xué)院,主要研究大規(guī)模預(yù)訓(xùn)練,AI for Science,Meta-learning。曾在騰訊AI lab、藥明康德實(shí)習(xí),相關(guān)工作發(fā)表于ICML, Engineering等國際頂級(jí)期刊會(huì)議。
個(gè)人主頁:
https://github.com/YinjieJ
②
多智能體強(qiáng)化學(xué)習(xí)中的去混淆值分解方法
(Deconfounded Value Decomposition?
for?Multi-agent Reinforcement Learning)

工作介紹
多智能體強(qiáng)化學(xué)習(xí)中, 受限于部分可觀察性和通信限制,每個(gè)智能體需要根據(jù)本地行動(dòng)觀察歷史做出自己的決定,這需要去中心化策略的學(xué)習(xí)。然而,主流的值分解方法在一些困難場景中表現(xiàn)不佳。為了找出限制模型性能的原因,我們將其歸納為因果圖,并發(fā)現(xiàn)環(huán)境成為了混雜因子,從而影響了模型訓(xùn)練過程中credit assignment步驟的直接因果效應(yīng)。對(duì)此,我們提出了一種新的因果結(jié)構(gòu)以及訓(xùn)練方法,可以有效的去除環(huán)境這一混雜因子帶來的影響,大幅提升模型的性能。
分享嘉賓
李佳暉,浙江大學(xué)在讀博士生
個(gè)人介紹
李佳暉,本科畢業(yè)于華南理工大學(xué),碩士畢業(yè)于浙江大學(xué)軟件學(xué)院,現(xiàn)就讀于浙江大學(xué)計(jì)算機(jī)學(xué)院。主要研究方向?yàn)槎嘀悄荏w強(qiáng)化學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的可解釋性。曾在KDD,ACMMM,ICML等頂級(jí)會(huì)議發(fā)表相關(guān)研究。
③?混淆平衡因果工具變量回歸法(Instrumental Variable Regression with Confounder Balancing )

工作介紹
在因果科學(xué)中,未觀測到的混淆變量將給因果效應(yīng)估計(jì)帶來額外的偏倚,為了糾正模型,研究者們提出使用兩階段最小二乘法進(jìn)行工具變量回歸。最近,當(dāng)研究者開始研究高維和非線性模型時(shí),在結(jié)果變量回歸階段錯(cuò)誤地引入了來自協(xié)變量的不平衡偏倚,為了糾正這種不平衡線性,我們提出了在原始模型兩階段回歸的基礎(chǔ)上加入了表征平衡模塊,使得模型在加性噪聲假設(shè)乃至更普遍的同質(zhì)性假設(shè)下都能夠識(shí)別估計(jì)因果效應(yīng)。
分享嘉賓
吳安鵬,浙江大學(xué)在讀研究生
個(gè)人介紹
吳安鵬,浙江工業(yè)大學(xué)本科畢業(yè),現(xiàn)就讀于浙江大學(xué)計(jì)算機(jī)學(xué)院直博生二年級(jí),師從況琨副教授和吳飛教授,主要研究方向?yàn)橐蚬评怼⒈碚鲗W(xué)習(xí)以及推薦系統(tǒng)。在TKDD、TKDE、ICML等頂級(jí)國際期刊會(huì)議上發(fā)表過3篇文章。
個(gè)人主頁:
https://scholar.google.com/citations?view_op=search_authors&mauthors=anpeng+wu&hl=zh-CN&oi=ao
報(bào)名+入群
掃碼填寫下方報(bào)名表,
工作人員將會(huì)把你拉入【CVPR2022活動(dòng)交流群】

7月23日?周六上午10點(diǎn),直播間見!
-The?End-

關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個(gè)薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長。 期待這里可以成為你學(xué)習(xí)AI前沿知識(shí)的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級(jí)打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ