ChatGPT等工具或讓“論文工廠”更加泛濫
原文作者:Layal Liverpool
有了新的文本和圖像生成工具,假論文將越來越多,防止它們進入學術文獻庫也越來越難。
人工智能(AI)的進步使出版機構更難應付論文工廠了——論文工廠特指那些根據(jù)要求生成虛假論文的公司。生成式AI工具,包括ChatGPT和圖像生成軟件一類的對話機器人,為論文工廠的內(nèi)容生產(chǎn)提供了新渠道,而這些工具生成的內(nèi)容可能很難被發(fā)現(xiàn)。科研誠信專家們在5月24日舉行的聚焦論文工廠問題的峰會上探討了以上挑戰(zhàn)。
“有了AI之后,論文工廠對原始數(shù)據(jù)的造假能力將再上一個臺階?!卑拇罄麃喰履贤柺拷】挡±韺W和悉尼大學的分子生物學家、出版誠信研究員Jennifer Byrne說。

能生成真實感圖像和文本的人工智能工具正在成為打擊論文造假的絆腳石。來源:Westend61/Alamy
“我見過AI生成的假的顯微鏡圖像,”歐洲生物學會聯(lián)合會出版社的圖像數(shù)據(jù)誠信分析師Jana Christopher說,但要絕對證明圖像是AI生成的并不容易。
ChatGPT這類語言生成式AI工具帶來了類似的問題?!耙坏┠阌修k法證明這是ChatGPT生成的,肯定就會有別的工具來掩蓋它?!?/p>
流水線論文
柏林自由大學社會科學家、獨立的科研誠信分析師Anna Abalkina認為,AI工具進入學術文獻庫可能會有一個滯后效應,因為同行評審流程需要時間。她說,可能在接下來幾個月里,“我們會看到第一批流水線論文。”
Byrne、Christopher和Abalkina都出席了不久前舉辦的UNITED2ACT峰會,該峰會由英國關注學術出版道德的非營利機構國際出版?zhèn)惱砦瘑T會(COPE)與國際科學技術與醫(yī)學出版商協(xié)會(STM)共同舉辦。這次峰會召集了全球科研人員,包括獨立的科研誠信分析師,以及各資助機構和出版社的代表。
COPE受托人、科研誠信咨詢師Deborah Kahn說:“這是大家首次聚在一起,共同為解決這一問題出謀劃策。”這個團隊計劃很快發(fā)布共同行動計劃。
要識別論文工廠的假論文,“還有識別合成圖像、合成文本等等的額外問題,”STM解決方案項目主管Joris van Rossum說,“大家普遍意識到,篩查這些內(nèi)容將變得越來越難。
AI助手
Kahn說,雖然 AI在支持科研人員寫作方面肯定會有幫助,仍有必要區(qū)分AI協(xié)助寫出的合規(guī)論文和完全偽造的論文。她說:“我們必須看看如何才能發(fā)現(xiàn)這些假論文,并確保研究是作者自己做的。這里其實有很多方法?!?/p>
峰會上探討的一個策略是要求作者提供實驗的原始數(shù)據(jù),可以是有數(shù)字水印的數(shù)據(jù),好讓出版機構證實這些數(shù)據(jù)的真實性。
Christopher說,當前,不同出版機構對提交原始數(shù)據(jù)的要求不一樣。她說,各個出版機構可以統(tǒng)一對原始數(shù)據(jù)的提交要求,并考慮到不同研究領域的差異,這么做可能會有幫助。
英國泰勒-弗朗西斯出版社(Taylor & Francis)的出版道德與誠信主管Sabina Alam表示同意,但指出這類標準不可能立即執(zhí)行?!拔覠o法想象一夜之間就轉(zhuǎn)變過來,因為現(xiàn)實是,許多研究機構并沒有能提供數(shù)據(jù)管理基礎工具的資源,”她說,“我們不想讓真正的研究受到不公正的對待。”
信息共享
這次峰會還探討了應對論文工廠的其他一般策略,包括組織面向科研工作者的宣傳日或宣傳周,以及讓出版機構能在不違反數(shù)據(jù)保護條例的前提下,相互之間分享相關訊息或是可疑的論文工廠,比如當不同出版機構同時收到相同的投稿時。
STM仍在開發(fā)識別論文工廠的軟件,同時通過其誠信中心匯總其他地方的類似工具。論文工廠肉眼可見的增加提出了對這類技術的需求——出版機構不僅要在作者投稿時識別虛假論文,還要能發(fā)現(xiàn)那些已經(jīng)出版過的論文。?
泰勒-弗朗西斯出版社和其他出版社已經(jīng)在使用這些工具了,Alam表示,她的團隊看到了越來越多的科研道德案例——需進一步調(diào)查的潛在學術不端行為。Alam說,這些案例中近一半都與論文工廠有關。她的團隊發(fā)現(xiàn),從2019年到2022年,科研道德案例的數(shù)量增加了10倍多,而今年到目前為止,道德案例的數(shù)量已經(jīng)與2022年全年持平。她說:“整體上似乎有商業(yè)化和升級的趨勢?!?/p>
原文以AI intensifies fight against ‘paper mills’ that churn out fake research標題發(fā)表在2023年5月31日《自然》的新聞版塊上