【直播預(yù)告】SFFAI 119 事件關(guān)系抽取專題
無(wú)論是認(rèn)知學(xué)還是語(yǔ)言學(xué),目前都還沒有統(tǒng)一的事件關(guān)系定義框架,導(dǎo)致事件關(guān)系抽取的數(shù)據(jù)集規(guī)模普遍較小,為模型的充分訓(xùn)練提出了挑戰(zhàn),這一問題在錯(cuò)綜復(fù)雜的事件因果關(guān)系識(shí)別中尤其嚴(yán)重。本期論壇我們邀請(qǐng)到了來自中國(guó)科學(xué)院自動(dòng)化研究所的左新宇同學(xué),他從數(shù)據(jù)自動(dòng)標(biāo)注和數(shù)據(jù)生成這兩個(gè)常用的數(shù)據(jù)增強(qiáng)方法出發(fā),提出一種知識(shí)融合的事件因果關(guān)系數(shù)據(jù)增強(qiáng)方法。

講者介紹
左新宇,中國(guó)科學(xué)院自動(dòng)化研究所畢業(yè)博士,主要研究方向自然語(yǔ)言處理、信息抽取、事件關(guān)系抽取,現(xiàn)已在ACL、COLING、SCIENCE CHINA、CCL等國(guó)內(nèi)外NLP領(lǐng)域期刊會(huì)議發(fā)表文章6篇。
會(huì)議題目
知識(shí)融合的事件因果關(guān)系數(shù)據(jù)增強(qiáng)方法
會(huì)議摘要
我們提出一個(gè)知識(shí)增強(qiáng)的事件因果關(guān)系數(shù)據(jù)自動(dòng)標(biāo)注框架,該框架利用多個(gè)外部知識(shí)庫(kù),引入大量的高概率因果相關(guān)事件,基于距離監(jiān)督的方式從外部無(wú)標(biāo)注文本中自動(dòng)標(biāo)注含噪的訓(xùn)練數(shù)據(jù),并利用常識(shí)推理資源庫(kù)過濾噪聲數(shù)據(jù),最終使用自訓(xùn)練機(jī)制利用自動(dòng)標(biāo)注的訓(xùn)練數(shù)據(jù)提升事件因果關(guān)系識(shí)別的性能。此外,自動(dòng)標(biāo)注的訓(xùn)練數(shù)據(jù)的質(zhì)量相對(duì)不高,因此,還提出一個(gè)知識(shí)引導(dǎo)的事件因果關(guān)系數(shù)據(jù)生成框架,該框架利用對(duì)偶學(xué)習(xí)機(jī)制,基于引入的因果相關(guān)事件,將事件因果關(guān)系識(shí)別器和數(shù)據(jù)生成器對(duì)偶約束,生成高質(zhì)量的訓(xùn)練數(shù)據(jù),提升事件因果關(guān)系識(shí)別的性能。在國(guó)際公開的數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明新生成的訓(xùn)練數(shù)據(jù)可以有效提升事件因果關(guān)系識(shí)別的性能。
論文題目:KnowDis: Knowledge Enhanced Data Augmentation for Event Causality Detection via Distant Supervision
在線閱讀:https://bbs.sffai.com/d/272
會(huì)議亮點(diǎn)
1、提出知識(shí)融合的事件因果關(guān)系數(shù)據(jù)增強(qiáng)方法,從多個(gè)外部知識(shí)庫(kù)中抽取因果相關(guān)事件,并生成表達(dá)因果相關(guān)事件因果語(yǔ)義的新訓(xùn)練數(shù)據(jù);
2、設(shè)計(jì)了知識(shí)增強(qiáng)的事件因果關(guān)系數(shù)據(jù)自動(dòng)標(biāo)注框架,利用遠(yuǎn)距離監(jiān)督的方式,基于知識(shí)庫(kù)中獲取的因果相關(guān)事件,在外部無(wú)標(biāo)注文本中自動(dòng)回標(biāo)得到新訓(xùn)練數(shù)據(jù);
3、設(shè)計(jì)了知識(shí)引導(dǎo)的事件因果關(guān)系數(shù)據(jù)生成框架,利用對(duì)偶學(xué)習(xí)機(jī)制,將事件因果關(guān)系識(shí)別器和數(shù)據(jù)生成器對(duì)偶約束,從識(shí)別過程中學(xué)習(xí)如何生成任務(wù)相關(guān)的新句子,從生成過程中學(xué)習(xí)如何更準(zhǔn)確地理解因果語(yǔ)義學(xué)習(xí),生成高質(zhì)量表達(dá)事件因果語(yǔ)義的新訓(xùn)練數(shù);
4、基于兩個(gè)常用公開數(shù)據(jù)集,評(píng)估生成的新訓(xùn)練數(shù)據(jù)對(duì)于事件因果關(guān)系識(shí)別任務(wù)的有效性。
直播時(shí)間
2021年8月22日(周日)20:00—21:00 線上直播
關(guān)注微信公眾號(hào):人工智能前沿講習(xí),對(duì)話框回復(fù)“SFFAI119”,獲取入群二維碼
注:直播地址會(huì)分享在交流群內(nèi)

現(xiàn)代科學(xué)技術(shù)高度社會(huì)化,在科學(xué)理論與技術(shù)方法上更加趨向綜合與統(tǒng)一,為了滿足人工智能不同領(lǐng)域研究者相互交流、彼此啟發(fā)的需求,我們發(fā)起了SFFAI這個(gè)公益活動(dòng)。SFFAI每周舉行一期線下活動(dòng),邀請(qǐng)一線科研人員分享、討論人工智能各個(gè)領(lǐng)域的前沿思想和最新成果,使專注于各個(gè)細(xì)分領(lǐng)域的研究者開拓視野、觸類旁通。
SFFAI目前主要關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語(yǔ)言處理等各個(gè)人工智能垂直領(lǐng)域及交叉領(lǐng)域的前沿進(jìn)展,將對(duì)線下討論的內(nèi)容進(jìn)行線上傳播,使后來者少踩坑,也為講者塑造個(gè)人影響力。SFFAI還在構(gòu)建人工智能領(lǐng)域的知識(shí)森林—AI Knowledge Forest,通過匯總各位參與者貢獻(xiàn)的領(lǐng)域知識(shí),沉淀線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區(qū)做出貢獻(xiàn),歡迎大家關(guān)注SFFAI論壇:https://bbs.sffai.com。?
