Benchmarking the Generation of Fact Checking Explanations
論文簡(jiǎn)要 :
本研究旨在基于摘要的方法對(duì)事實(shí)核查解釋進(jìn)行基準(zhǔn)測(cè)試,通過(guò)使用兩個(gè)新穎數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)了claim-driven extractive步驟對(duì)摘要性能的改進(jìn),并展示了在不同數(shù)據(jù)集上訓(xùn)練的模型能夠高效地保留風(fēng)格信息。
背景信息:
論文背景: 隨著現(xiàn)代媒體生態(tài)系統(tǒng)與在線社交媒體的互動(dòng),新聞的快速傳播變得容易,但也增加了對(duì)抗錯(cuò)誤信息傳播的需求。因此,自動(dòng)化事實(shí)核查解釋的生成過(guò)程對(duì)于幫助抑制錯(cuò)誤信息至關(guān)重要。
過(guò)去方案: 過(guò)去的研究主要集中在判斷聲明真實(shí)性的分類上,而本文則關(guān)注生成解釋(為什么將聲明分類為真或假的文本解釋)并通過(guò)新穎數(shù)據(jù)集和先進(jìn)基線進(jìn)行基準(zhǔn)測(cè)試。
論文的Motivation: 本研究的動(dòng)機(jī)在于自動(dòng)化生成解釋可以幫助事實(shí)核查人員提高在線活動(dòng)效果,并使社交媒體用戶的干預(yù)更加有效。然而,目前自動(dòng)生成解釋的方法仍存在問(wèn)題,因此需要對(duì)不同方法進(jìn)行基準(zhǔn)測(cè)試,以找到最適合特定場(chǎng)景的方法。
方法:
a. 理論背景:
本文旨在自動(dòng)化事實(shí)核查過(guò)程,以應(yīng)對(duì)虛假新聞的增加。重點(diǎn)是生成理由,即對(duì)為什么一個(gè)聲明被分類為真或假的文本解釋。作者使用新穎的數(shù)據(jù)集和先進(jìn)的基準(zhǔn)測(cè)試了不同的總結(jié)方法。
b. 技術(shù)路線:
本文提出使用總結(jié)技術(shù)生成簡(jiǎn)單而簡(jiǎn)潔的解釋,以替代社交媒體平臺(tái)上的事實(shí)核查文章。研究人員探索了三種不同的無(wú)監(jiān)督總結(jié)方法:文章截?cái)?、基于LexRank算法的文章相關(guān)性抽取總結(jié)和基于SBERT的基于聲明的抽取總結(jié)。此外,他們還將抽取和抽象總結(jié)相結(jié)合,使用Transformer-based模型進(jìn)行理由生成。他們測(cè)試了四種Transformer-based總結(jié)模型,并使用不同的解碼機(jī)制生成了裁決結(jié)果。
結(jié)果:
a. 詳細(xì)的實(shí)驗(yàn)設(shè)置:
研究人員使用了兩個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn):LIAR++和FullFact。這兩個(gè)數(shù)據(jù)集包含聲明、裁決和文章條目。聲明是待檢查的簡(jiǎn)短陳述,裁決提供了評(píng)估聲明真實(shí)性的論據(jù),文章是討論聲明真實(shí)性并包含構(gòu)建裁決所需事實(shí)的文檔。這些數(shù)據(jù)集具有不同的結(jié)構(gòu)和風(fēng)格特點(diǎn)。
b. 詳細(xì)的實(shí)驗(yàn)結(jié)果:
實(shí)驗(yàn)結(jié)果顯示,使用SBERT的基于聲明的抽取總結(jié)方法在ROUGE分?jǐn)?shù)方面表現(xiàn)最佳。將句子按照排名順序重新排列而不是文章順序會(huì)影響文本的連貫性。將輸入與聲明信息相結(jié)合會(huì)導(dǎo)致比僅在文章上進(jìn)行微調(diào)的ROUGE分?jǐn)?shù)更高。模型的性能因輸入長(zhǎng)度而異,1024輸入長(zhǎng)度的模型在LIAR++上表現(xiàn)更好,而512輸入長(zhǎng)度的模型在FullFact上表現(xiàn)更好。抽取總結(jié)通常優(yōu)于無(wú)監(jiān)督抽象總結(jié)。