最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證

2023-08-06 23:12 作者:三月phanta  | 我要投稿
  • Title: Read it Twice: Towards Faithfully Interpretable Fact Verification by Revisiting Evidence (再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證)

模型結(jié)構

方法:

  • a. 理論背景:

    • 本文介紹了一種名為ReRead的新方法,用于事實驗證,該方法檢索支持或反駁主張的證據(jù)?,F(xiàn)有方法依賴啟發(fā)式方法,無法提供既忠實又可信的證據(jù),從而影響了事實驗證任務的準確性。ReRead通過訓練一個證據(jù)檢索器來獲取基于忠實性和可信度標準的可解釋證據(jù),并通過一個主張驗證器重新審查證據(jù)以提高準確性來解決這個問題。該模型在真實數(shù)據(jù)集上相對于SOTA基線實現(xiàn)了4.31%的F1性能提升。主要的訓練目標是忠實性、可信度和準確性,模型的架構包括使用標記數(shù)據(jù)對主張驗證器進行微調(diào),使用黃金證據(jù)提升可信度,并重新審查檢索到的證據(jù)。

  • b. 技術路線:

    • 本文提出了一個事實驗證系統(tǒng),旨在提高檢索到的證據(jù)的忠實性和可信度。該系統(tǒng)包括一個句子編碼器,用于獲取主張和源文檔中每個句子的語義嵌入,一個主張驗證器,根據(jù)文檔將主張分類為三個類別,以及一個證據(jù)檢索器,用于選擇關鍵證據(jù)句子。為了確保忠實性,作者使用了完整性和充分性的標準,為了鼓勵可信度,他們引入了一個Top ??算法,選擇具有最高概率得分的句子。該系統(tǒng)使用一個聯(lián)合損失函數(shù)進行訓練,該函數(shù)包括三個損失函數(shù):完整性、充分性和可信度。該系統(tǒng)有潛力提高事實驗證的準確性和可解釋性。

    • 模型的工作流程如下:

      首先,模型會使用證據(jù)檢索器從網(wǎng)上搜索包含埃菲爾鐵塔和其高度信息的相關文檔。證據(jù)檢索器會根據(jù)文檔的可信度、完整性和充分性對文檔進行排序,并返回前k個文檔作為證據(jù)候選。

      其次,模型會使用聲明驗證器讀取證據(jù)候選,并與聲明進行比較和推理。聲明驗證器會根據(jù)證據(jù)的支持度、反駁度和中立度對聲明進行分類,并給出一個置信度分數(shù)。

      最后,模型會生成一個簡潔和清晰的驗證結(jié)果,包括聲明的真假標簽、置信度分數(shù)和最有力的證據(jù)。

      例如,對于“埃菲爾鐵塔是巴黎最高的建筑物”這個陳述,模型可能會生成以下結(jié)果:

      標簽:錯誤

      置信度:0.95

      證據(jù):埃菲爾鐵塔的高度為324米,而巴黎最高的建筑物是蒙帕納斯大樓,其高度為210米。因此,埃菲爾鐵塔不是巴黎最高的建筑物。


結(jié)果:

  • a. 詳細的實驗設置:

    • 本文開發(fā)了一個名為ReRead的事實驗證工具,旨在通過重新審查文本提供忠實的證據(jù)解釋。作者希望將這種方法應用于結(jié)構化知識提取和問答。ReRead的有效性在真實數(shù)據(jù)集上得到了證明。該工作得到了中國國家重點研發(fā)計劃和中國國家自然科學基金的多個組織的支持。作者在GitHub上提供了他們的代碼。文章包括一個參考文獻列表,涵蓋了自動事實檢查的各個方面,如基準數(shù)據(jù)集、關系提取和機器學習優(yōu)化技術。

  • 基于證據(jù)的事實驗證的挑戰(zhàn):事實驗證是一個復雜的任務,需要從大量的文本中檢索相關的證據(jù),然后根據(jù)證據(jù)對聲明進行推理和判斷。這個過程涉及到多個子任務,如信息檢索、自然語言理解、邏輯推理等,每個子任務都有自己的難點和挑戰(zhàn) 。

  • 基于證據(jù)的事實驗證的研究現(xiàn)狀:目前,基于證據(jù)的事實驗證的研究主要分為兩類:端到端的方法和分步驟的方法。端到端的方法是指直接從原始文本中預測聲明的真假,不需要顯示地提供證據(jù) 。分步驟的方法是指將事實驗證分解為兩個或多個子任務,如證據(jù)檢索、聲明驗證等,然后分別對每個子任務進行建模和優(yōu)化 。

  • 基于證據(jù)的事實驗證的評估指標:評估基于證據(jù)的事實驗證的性能,通常需要考慮兩方面的指標:驗證器的準確性和檢索器的質(zhì)量。驗證器的準確性是指驗證器對聲明真假的判斷是否正確,常用的指標有準確率、召回率、F1值等。檢索器的質(zhì)量是指檢索器提供的證據(jù)是否與人類標注的金標準證據(jù)一致,常用的指標有BLEU、ROUGE、METEOR等。

  • 基于證據(jù)的事實驗證的數(shù)據(jù)集:目前,已經(jīng)有一些公開可用的基于證據(jù)的事實驗證數(shù)據(jù)集,如FEVER、LIAR、FakeNewsNet、RumorEval、CHEF等。這些數(shù)據(jù)集涵蓋了不同的領域、語言和媒體類型,為事實驗證提供了豐富而多樣化的資源。然而,這些數(shù)據(jù)集也存在一些局限性,如規(guī)模較小、噪聲較多、缺乏多樣性等。

  • 基于證據(jù)的事實驗證的未來方向:未來,基于證據(jù)的事實驗證還有很多值得探索和改進的方面,如以下幾點:

    • 多源融合:利用來自不同來源和類型的信息,如文本、圖像、視頻、音頻等,提高事實驗證的可信度和魯棒性。

    • 多語言適應:開發(fā)跨語言和多語言的事實驗證模型,適應不同語言環(huán)境和用戶需求。

    • 可解釋性增強:提高事實驗證模型的可解釋性和可理解性,使其能夠生成清晰和合理的推理過程和解釋說明。

    • 社會影響評估:考慮事實驗證對社會和個人產(chǎn)生的影響和后果,如傳播速度、情感態(tài)度、信任程度等 。


再讀一遍: 基于證據(jù)再訪的忠實可解釋事實驗證的評論 (共 條)

分享到微博請遵守國家法律
南木林县| 醴陵市| 富蕴县| 宣恩县| 洞口县| 会理县| 乐陵市| 东丰县| 密云县| 山阴县| 墨玉县| 雅江县| 江山市| 潞城市| 正宁县| 普宁市| 武义县| 甘南县| 阿克苏市| 花垣县| 介休市| 瑞昌市| 太保市| 株洲县| 仪陇县| 朝阳县| 昂仁县| 聊城市| 英吉沙县| 当阳市| 阿克陶县| 张北县| 黎川县| 华阴市| 牙克石市| 武清区| 林州市| 晴隆县| 宽甸| 隆子县| 房产|