再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證

2023-08-06 23:12 作者:三月phanta 0人讀過 | 我要投稿

Title: Read it Twice: Towards Faithfully Interpretable Fact Verification by Revisiting Evidence (再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證)

方法:

a. 理論背景:

本文介紹了一種名為ReRead的新方法，用于事實驗證，該方法檢索支持或反駁主張的證據(jù)?，F(xiàn)有方法依賴啟發(fā)式方法，無法提供既忠實又可信的證據(jù)，從而影響了事實驗證任務的準確性。ReRead通過訓練一個證據(jù)檢索器來獲取基于忠實性和可信度標準的可解釋證據(jù)，并通過一個主張驗證器重新審查證據(jù)以提高準確性來解決這個問題。該模型在真實數(shù)據(jù)集上相對于SOTA基線實現(xiàn)了4.31%的F1性能提升。主要的訓練目標是忠實性、可信度和準確性，模型的架構包括使用標記數(shù)據(jù)對主張驗證器進行微調(diào)，使用黃金證據(jù)提升可信度，并重新審查檢索到的證據(jù)。

b. 技術路線:

本文提出了一個事實驗證系統(tǒng)，旨在提高檢索到的證據(jù)的忠實性和可信度。該系統(tǒng)包括一個句子編碼器，用于獲取主張和源文檔中每個句子的語義嵌入，一個主張驗證器，根據(jù)文檔將主張分類為三個類別，以及一個證據(jù)檢索器，用于選擇關鍵證據(jù)句子。為了確保忠實性，作者使用了完整性和充分性的標準，為了鼓勵可信度，他們引入了一個Top ??算法，選擇具有最高概率得分的句子。該系統(tǒng)使用一個聯(lián)合損失函數(shù)進行訓練，該函數(shù)包括三個損失函數(shù)：完整性、充分性和可信度。該系統(tǒng)有潛力提高事實驗證的準確性和可解釋性。
模型的工作流程如下：

首先，模型會使用證據(jù)檢索器從網(wǎng)上搜索包含埃菲爾鐵塔和其高度信息的相關文檔。證據(jù)檢索器會根據(jù)文檔的可信度、完整性和充分性對文檔進行排序，并返回前k個文檔作為證據(jù)候選。

其次，模型會使用聲明驗證器讀取證據(jù)候選，并與聲明進行比較和推理。聲明驗證器會根據(jù)證據(jù)的支持度、反駁度和中立度對聲明進行分類，并給出一個置信度分數(shù)。

最后，模型會生成一個簡潔和清晰的驗證結(jié)果，包括聲明的真假標簽、置信度分數(shù)和最有力的證據(jù)。

例如，對于“埃菲爾鐵塔是巴黎最高的建筑物”這個陳述，模型可能會生成以下結(jié)果：

標簽：錯誤

置信度：0.95

證據(jù)：埃菲爾鐵塔的高度為324米，而巴黎最高的建筑物是蒙帕納斯大樓，其高度為210米。因此，埃菲爾鐵塔不是巴黎最高的建筑物。

結(jié)果:

a. 詳細的實驗設置:

本文開發(fā)了一個名為ReRead的事實驗證工具，旨在通過重新審查文本提供忠實的證據(jù)解釋。作者希望將這種方法應用于結(jié)構化知識提取和問答。ReRead的有效性在真實數(shù)據(jù)集上得到了證明。該工作得到了中國國家重點研發(fā)計劃和中國國家自然科學基金的多個組織的支持。作者在GitHub上提供了他們的代碼。文章包括一個參考文獻列表，涵蓋了自動事實檢查的各個方面，如基準數(shù)據(jù)集、關系提取和機器學習優(yōu)化技術。

基于證據(jù)的事實驗證的挑戰(zhàn)：事實驗證是一個復雜的任務，需要從大量的文本中檢索相關的證據(jù)，然后根據(jù)證據(jù)對聲明進行推理和判斷。這個過程涉及到多個子任務，如信息檢索、自然語言理解、邏輯推理等，每個子任務都有自己的難點和挑戰(zhàn) 。
基于證據(jù)的事實驗證的研究現(xiàn)狀：目前，基于證據(jù)的事實驗證的研究主要分為兩類：端到端的方法和分步驟的方法。端到端的方法是指直接從原始文本中預測聲明的真假，不需要顯示地提供證據(jù) 。分步驟的方法是指將事實驗證分解為兩個或多個子任務，如證據(jù)檢索、聲明驗證等，然后分別對每個子任務進行建模和優(yōu)化。
基于證據(jù)的事實驗證的評估指標：評估基于證據(jù)的事實驗證的性能，通常需要考慮兩方面的指標：驗證器的準確性和檢索器的質(zhì)量。驗證器的準確性是指驗證器對聲明真假的判斷是否正確，常用的指標有準確率、召回率、F1值等。檢索器的質(zhì)量是指檢索器提供的證據(jù)是否與人類標注的金標準證據(jù)一致，常用的指標有BLEU、ROUGE、METEOR等。
基于證據(jù)的事實驗證的數(shù)據(jù)集：目前，已經(jīng)有一些公開可用的基于證據(jù)的事實驗證數(shù)據(jù)集，如FEVER、LIAR、FakeNewsNet、RumorEval、CHEF等。這些數(shù)據(jù)集涵蓋了不同的領域、語言和媒體類型，為事實驗證提供了豐富而多樣化的資源。然而，這些數(shù)據(jù)集也存在一些局限性，如規(guī)模較小、噪聲較多、缺乏多樣性等。
基于證據(jù)的事實驗證的未來方向：未來，基于證據(jù)的事實驗證還有很多值得探索和改進的方面，如以下幾點：

多源融合：利用來自不同來源和類型的信息，如文本、圖像、視頻、音頻等，提高事實驗證的可信度和魯棒性。
多語言適應：開發(fā)跨語言和多語言的事實驗證模型，適應不同語言環(huán)境和用戶需求。
可解釋性增強：提高事實驗證模型的可解釋性和可理解性，使其能夠生成清晰和合理的推理過程和解釋說明。
社會影響評估：考慮事實驗證對社會和個人產(chǎn)生的影響和后果，如傳播速度、情感態(tài)度、信任程度等。

標簽：

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證

方法:

結(jié)果:

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證

方法:

結(jié)果:

本文作者的其他文章

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證的評論 (共條)