最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

尋找經(jīng)過(guò)事實(shí)檢查的信息以減輕假新聞的傳播

2023-08-11 20:42 作者:三月phanta  | 我要投稿

Title: Where Are the Facts? Searching for Fact-checked Information to Alleviate the Spread of Fake News?

MAN模型結(jié)構(gòu)

論文簡(jiǎn)要 :

  • 本研究提出了一種新穎的框架,用于搜索經(jīng)過(guò)事實(shí)檢查的文章,以解決社交媒體上假新聞的傳播問(wèn)題。該框架使用文本和圖像來(lái)搜索事實(shí)檢查文章,并在真實(shí)數(shù)據(jù)集上取得了有希望的結(jié)果。

背景信息:

  • 論文背景: 過(guò)去幾年中,偏見(jiàn)新聞、黨派故事、虛假言論和誤導(dǎo)性信息的傳播引起了社會(huì)的高度關(guān)注。許多報(bào)告指出,虛構(gòu)的故事可能導(dǎo)致公民對(duì)政治候選人的錯(cuò)誤認(rèn)識(shí),操縱股票價(jià)格,并威脅公共健康。

  • 過(guò)去方案: 盡管學(xué)術(shù)界和工業(yè)界已經(jīng)開(kāi)發(fā)了許多事實(shí)檢查系統(tǒng),但假新聞在社交媒體上仍然猖獗。這些系統(tǒng)主要關(guān)注事實(shí)檢查,但通常忽視了在線用戶,而這些用戶是誤導(dǎo)信息傳播的主要推動(dòng)者。

  • 論文的Motivation: 本研究的動(dòng)機(jī)是如何利用經(jīng)過(guò)事實(shí)檢查的信息來(lái)提高用戶對(duì)他們所接觸到的假新聞的意識(shí),并阻止用戶傳播假新聞。為了解決這些問(wèn)題,作者提出了一種新穎的框架,用于搜索與在線用戶發(fā)布的原始推文內(nèi)容相關(guān)的事實(shí)檢查文章。該搜索可以直接警告發(fā)布假新聞的用戶和在線用戶(例如發(fā)布者的關(guān)注者),阻止他們傳播假新聞,并在社交媒體上擴(kuò)大經(jīng)過(guò)驗(yàn)證的內(nèi)容。

方法:

  • a. 理論背景:

    • 本文討論了社交媒體上虛假新聞的泛濫問(wèn)題,以及需要事實(shí)核查系統(tǒng)來(lái)解決這個(gè)問(wèn)題。文章強(qiáng)調(diào)了需要關(guān)注在線用戶,因?yàn)樗麄兪钦`導(dǎo)信息傳播的主要推動(dòng)者。作者提出了一個(gè)新穎的框架,利用文本和圖像來(lái)搜索與包含誤導(dǎo)信息的原始推文相關(guān)的事實(shí)核查文章。該框架旨在警告發(fā)布虛假新聞的人和在線用戶,阻止虛假新聞的傳播,并在社交媒體上推廣經(jīng)過(guò)驗(yàn)證的內(nèi)容。

  • b. 技術(shù)路線:

    • 該框架首先使用文本分析技術(shù)來(lái)識(shí)別包含誤導(dǎo)信息的原始推文。然后,它使用圖像分析技術(shù)來(lái)提取與原始推文相關(guān)的圖像。接下來(lái),框架使用信息檢索技術(shù)來(lái)搜索與原始推文相關(guān)的事實(shí)核查文章。最后,框架根據(jù)事實(shí)核查文章的相關(guān)性和可信度對(duì)原始推文進(jìn)行評(píng)分,并向用戶提供警告或推薦經(jīng)過(guò)驗(yàn)證的內(nèi)容。

    • MAN的工作流程如下:

      首先,對(duì)于每個(gè)原始推文,使用BM25算法快速檢索出50篇候選的事實(shí)核查文章。BM25是一種基于詞頻-逆向文件頻率(TF-IDF)的檢索方法,它可以根據(jù)查詢和文檔之間的詞匯重疊程度來(lái)計(jì)算它們的相關(guān)性得分。為了提高檢索效果,作者還使用了一個(gè)工具從原始推文的圖像中提取出文本,并將其與原始推文的文本拼接起來(lái)作為查詢。

      然后,對(duì)于每個(gè)原始推文和候選文章對(duì),MAN使用四個(gè)組件來(lái)計(jì)算它們之間的匹配得分:

      • Glove嵌入交互:這一方法使用余弦相似度計(jì)算原始推文和候選文章中每對(duì)單詞之間的相似度,并形成一個(gè)相似度矩陣。

      • 注意力交互矩陣:這一方法使用歐氏距離計(jì)算原始推文和候選文章中每對(duì)單詞之間在ELMo嵌入空間中的不相似度,并形成一個(gè)注意力矩陣。然后,將注意力矩陣與相似度矩陣相乘,得到一個(gè)注意力交互矩陣。這一方法可以避免過(guò)分依賴于原始相似度矩陣中的原始相似度值,而是考慮到單詞在不同上下文中可能有不同的含義。

      • ELMo嵌入交互:這一方法使用余弦相似度或雙線性函數(shù)計(jì)算原始推文和候選文章中每對(duì)單詞之間在ELMo嵌入空間中的相似度,并形成一個(gè)ELMo嵌入交互矩陣。這一方法可以捕捉單詞在不同上下文中可能有不同含義或拼寫錯(cuò)誤時(shí)的高級(jí)相似度。

      • 投影層:這一層將原始推文和候選文章中的每個(gè)單詞映射到一個(gè)低維向量空間,分別使用Glove嵌入和ELMo嵌入。Glove嵌入是一種靜態(tài)的詞向量表示方法,它可以捕捉單詞之間的語(yǔ)義相似性。ELMo嵌入是一種動(dòng)態(tài)的詞向量表示方法,它可以捕捉單詞在不同上下文中的語(yǔ)義變化。這一層還將原始推文和候選文章中的每個(gè)圖像映射到一個(gè)低維向量空間,使用預(yù)訓(xùn)練的ResNet50模型。ResNet50是一種深度卷積神經(jīng)網(wǎng)絡(luò),它可以提取圖像中的高層特征。

      • 文本匹配層:這一層使用三種方法來(lái)衡量原始推文和候選文章之間的文本匹配程度:

      • 圖像匹配層:這一層使用余弦相似度計(jì)算原始推文和候選文章中每對(duì)圖像之間的相似度,并形成一個(gè)圖像相似度矩陣。然后,從這個(gè)矩陣中選取最大的相似度值作為圖像匹配特征。這一方法可以捕捉原始推文和候選文章之間的圖像匹配程度。

      • 統(tǒng)一文本和圖像信息:這一層將文本匹配層和圖像匹配層的輸出拼接起來(lái),并通過(guò)幾個(gè)全連接層和激活函數(shù),得到最終的匹配得分。這一層可以將文本和圖像之間的匹配信號(hào)融合起來(lái),得到一個(gè)綜合的匹配度量。

    • 舉個(gè)例子,假設(shè)我們有一個(gè)原始推文,它的文本是“Keep your promise Barack”,它的圖像是一個(gè)顯示“Breaking News: Obama: ‘I won’t leave if Trump is elected’”的電視截圖。我們想要找到一個(gè)與這個(gè)推文相關(guān)的事實(shí)核查文章,來(lái)驗(yàn)證或反駁這個(gè)推文中的信息。我們可以使用BM25-TI方法檢索出50篇候選文章,然后使用MAN模型對(duì)它們進(jìn)行排序。MAN模型會(huì)分別計(jì)算原始推文和每篇候選文章之間的文本和圖像匹配程度,并將它們結(jié)合起來(lái)得到一個(gè)最終的匹配得分。然后,MAN模型會(huì)根據(jù)匹配得分對(duì)候選文章進(jìn)行排序,并返回最相關(guān)的文章作為結(jié)果。例如,MAN模型可能會(huì)返回這篇來(lái)自Snopes.com的事實(shí)核查文章,它明確地否認(rèn)了原始推文中的虛假引用,并提供了證據(jù)和來(lái)源來(lái)支持它的結(jié)論。

結(jié)果:

  • a. 詳細(xì)的實(shí)驗(yàn)設(shè)置:

    • 本文使用了一個(gè)實(shí)驗(yàn)數(shù)據(jù)集,其中包含了大量的原始推文和相關(guān)的事實(shí)核查文章。實(shí)驗(yàn)中,首先對(duì)原始推文進(jìn)行文本分析,使用自然語(yǔ)言處理技術(shù)來(lái)識(shí)別其中的誤導(dǎo)信息。然后,使用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)提取原始推文中的圖像。接下來(lái),使用信息檢索技術(shù)從事實(shí)核查文章數(shù)據(jù)庫(kù)中搜索相關(guān)的文章。最后,根據(jù)事實(shí)核查文章的相關(guān)性和可信度對(duì)原始推文進(jìn)行評(píng)分。

  • b. 詳細(xì)的實(shí)驗(yàn)結(jié)果:

    • 實(shí)驗(yàn)結(jié)果顯示,該框架能夠準(zhǔn)確地識(shí)別包含誤導(dǎo)信息的原始推文,并提取與之相關(guān)的圖像。通過(guò)搜索事實(shí)核查文章,框架能夠找到與原始推文相關(guān)的可靠信息,并對(duì)原始推文進(jìn)行評(píng)分。實(shí)驗(yàn)還表明,該框架能夠有效地警告發(fā)布虛假新聞的人和在線用戶,并推廣經(jīng)過(guò)驗(yàn)證的內(nèi)容,從而減少虛假新聞的傳播。


尋找經(jīng)過(guò)事實(shí)檢查的信息以減輕假新聞的傳播的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
新兴县| 黄平县| 图片| 淳化县| 保亭| 贵溪市| 泗洪县| 开江县| 乌鲁木齐县| 图木舒克市| 弋阳县| 江川县| 高阳县| 建德市| 铜陵市| 荆门市| 乡城县| 云林县| 林口县| 桑植县| 贵港市| 大名县| 香河县| 六枝特区| 六盘水市| 达尔| 镇沅| 满洲里市| 大名县| 水城县| 四川省| 汉阴县| 永登县| 上林县| 石渠县| 平罗县| 白朗县| 河源市| 昌图县| 泾阳县| 沧州市|