【直播預(yù)告】SFFAI 120 文本理解專題
大多數(shù)現(xiàn)有的機(jī)器閱讀理解 (MRC) 數(shù)據(jù)集都采用散文段落或歷史題作為輸入,而為了適應(yīng)話語解析和會(huì)議摘要等多方對(duì)話的應(yīng)用,對(duì)話閱讀理解這個(gè)領(lǐng)域開始受到關(guān)注。本期我們邀請(qǐng)到了來自哈爾濱工業(yè)大學(xué)的李家琦同學(xué),分享他提出的面向多人對(duì)話的機(jī)器閱讀理解與語篇結(jié)構(gòu)分析數(shù)據(jù)集Molweni。

講者介紹
李家琦,哈爾濱工業(yè)大學(xué)計(jì)算機(jī)專業(yè)博士生,研究方向?yàn)槎嗳藢?duì)話語篇結(jié)構(gòu)分析和多人對(duì)話機(jī)器閱讀理解,以第一作者發(fā)表CCF推薦國際會(huì)議和ESI期刊論文3篇。
會(huì)議題目
Molweni:面向多人對(duì)話的機(jī)器閱讀理解與語篇結(jié)構(gòu)分析數(shù)據(jù)集
會(huì)議摘要
在本文中,我們提出了構(gòu)建于多人對(duì)話的英文機(jī)器閱讀理解(MRC)數(shù)據(jù)集——Molweni,并覆蓋了對(duì)話語篇結(jié)構(gòu)。Molweni源自于Ubuntu聊天語料庫,包括10,000個(gè)對(duì)話,共計(jì)88,303條話語(utterance)。我們共標(biāo)注了30,066個(gè)問題,包括可回答和不可回答的問題。Molweni獨(dú)特地為其多人對(duì)話提供了語篇結(jié)構(gòu)信息,共標(biāo)注了78,245個(gè)語篇關(guān)系實(shí)例,為多人對(duì)話語篇結(jié)構(gòu)分析(Discourse ?parsing)貢獻(xiàn)了大規(guī)模數(shù)據(jù)。實(shí)驗(yàn)表明,Molweni對(duì)于現(xiàn)有的MRC模型是一個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集;SQuAD 2.0數(shù)據(jù)集上的強(qiáng)大模型BERT-wwm在Molweni數(shù)據(jù)集上只取得67.7%的F1值,相比于其在SQuAD 2.0上的表現(xiàn)有20+%的顯著下降。

論文標(biāo)題:Molweni: A Challenge Multiparty Dialogue-based Machine Reading Comprehension Dataset with Discourse Structure
在線閱讀:https://bbs.sffai.com/d/274-molweni
會(huì)議亮點(diǎn)
1、我們發(fā)布了首個(gè)包含語篇結(jié)構(gòu)信息的大規(guī)模多人對(duì)話機(jī)器閱讀理解數(shù)據(jù)集Molweni;
2、Molweni數(shù)據(jù)集為多人對(duì)話語篇結(jié)構(gòu)分析任務(wù)提供了大規(guī)模數(shù)據(jù)標(biāo)注。
直播時(shí)間
2021年8月29日(周日)20:00—21:00 線上直播
關(guān)注微信公眾號(hào):人工智能前沿講習(xí),對(duì)話框回復(fù)“SFFAI120”,獲取入群二維碼
注:直播地址會(huì)分享在交流群內(nèi)

現(xiàn)代科學(xué)技術(shù)高度社會(huì)化,在科學(xué)理論與技術(shù)方法上更加趨向綜合與統(tǒng)一,為了滿足人工智能不同領(lǐng)域研究者相互交流、彼此啟發(fā)的需求,我們發(fā)起了SFFAI這個(gè)公益活動(dòng)。SFFAI每周舉行一期線下活動(dòng),邀請(qǐng)一線科研人員分享、討論人工智能各個(gè)領(lǐng)域的前沿思想和最新成果,使專注于各個(gè)細(xì)分領(lǐng)域的研究者開拓視野、觸類旁通。
SFFAI目前主要關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等各個(gè)人工智能垂直領(lǐng)域及交叉領(lǐng)域的前沿進(jìn)展,將對(duì)線下討論的內(nèi)容進(jìn)行線上傳播,使后來者少踩坑,也為講者塑造個(gè)人影響力。SFFAI還在構(gòu)建人工智能領(lǐng)域的知識(shí)森林—AI Knowledge Forest,通過匯總各位參與者貢獻(xiàn)的領(lǐng)域知識(shí),沉淀線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區(qū)做出貢獻(xiàn),歡迎大家關(guān)注SFFAI論壇:https://bbs.sffai.com。?
