傳謠一張嘴,辟謠跑斷腿?首個中文事實核查數(shù)據(jù)集發(fā)布
在媒體生態(tài)系統(tǒng)中傳播的錯誤信息爆炸式增長,促使了自動事實核查的需求。在 NAACL(計算語言學(xué)協(xié)會北美分會年會)2022?上,由清華、劍橋、UIC 聯(lián)合推出了首個中文事實核查數(shù)據(jù)集,包含 10,000?條基于證據(jù)核查的中國真實事件核查記錄。該數(shù)據(jù)集涵蓋從政治到公共衛(wèi)生的多個領(lǐng)域,并提供從互聯(lián)網(wǎng)檢索到的帶注釋的證據(jù)。數(shù)據(jù)集除了通過標簽標識真實核查結(jié)果以外,還提供的豐富的核查證據(jù)與引用鏈接支撐。


發(fā)布文獻及引用信息
@inproceedings{hu2022chef,
?abbr = {NAACL},
?title = {CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking},
?author = {Hu, Xuming and Guo, Zhijiang and Wu, guanyu and Liu, Aiwei and Wen, Lijie and Yu, Philip S.},
?booktitle = {Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics},
?year = {2022},
?code = {https://github.com/THU-BPM/CHEF}
}

數(shù)據(jù)集可通過訪問項目 GitHub?主頁獲取。同時,歡迎通過微信搜索【跨象乘云】公眾號(kxcy_ai)或掃描下方二維碼,關(guān)注后發(fā)送關(guān)鍵字【220707】,免費獲取?基于證據(jù)的中文事實核查數(shù)據(jù)集??缦蟪嗽? 原創(chuàng)實驗演示視頻內(nèi)全部代碼、數(shù)據(jù)集僅授權(quán)予個人用戶學(xué)習(xí)與實驗使用。禁止用于二次銷售、分發(fā)傳播、課堂教學(xué)及培訓(xùn)用途。校企用戶采購請通過公眾號菜單【了解我們】->【商務(wù)咨詢】聯(lián)系。
