最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

計(jì)算機(jī)領(lǐng)域的論文“花式造假”

2022-03-01 21:29 作者:返樸科普  | 我要投稿

計(jì)算機(jī)領(lǐng)域驚爆論文“花式造假”


撰文 | 小葉


“撤稿觀察”(RetractionWatch.com)網(wǎng)站報(bào)道了一樁手法驚人的疑似學(xué)術(shù)不端事件。2021年7月中旬,國際學(xué)術(shù)出版商愛思唯爾(Elsevier)宣布調(diào)查旗下期刊《微處理器和微系統(tǒng)》(Microprocessors & Microsystems),對其發(fā)表過的400多篇論文進(jìn)行逐一“重新獨(dú)立評估”。而這些需要被調(diào)查的文章主要來自該期刊的6份“特刊”(Special Issues)[1]。


有別于常規(guī)正刊,特刊往往以更加明確細(xì)分的特定研究課題為主,邀請客座編輯監(jiān)督編撰。因此,發(fā)表在特刊上的文章有獨(dú)特優(yōu)勢:在同一領(lǐng)域內(nèi)的可見度更高,出版速度也因文章獨(dú)立正刊發(fā)表而更快。


《微處理器和微系統(tǒng)》是一本什么期刊?數(shù)據(jù)顯示,其刊物影響因子1.525,是中科院工程技術(shù)及計(jì)算機(jī)科學(xué)四區(qū)期刊。該刊論文內(nèi)容涵蓋所有與嵌入式系統(tǒng)硬件相關(guān)的設(shè)計(jì)和架構(gòu),包括計(jì)算機(jī)、人工智能、通信、網(wǎng)絡(luò)技術(shù)等多個(gè)學(xué)科領(lǐng)域。該刊官網(wǎng)介紹稱,近5年來,其刊物文章通訊作者的第一大來源國是中國,緊隨其后的是印度。(如下圖)



來源:https://www.journals.elsevier.com/microprocessors-and-microsystems


愛思唯爾的發(fā)言人接受《自然》(Nature)采訪時(shí)表示,根據(jù)目前已知情況,需要被調(diào)查的400多篇文章的作者很可能使用了反向翻譯軟件來掩飾剽竊行為,但調(diào)查仍在進(jìn)行中。[2]


幾乎同時(shí),法國圖盧茲大學(xué)(University of Toulouse)的計(jì)算機(jī)科學(xué)家Guillaume Cabanac和他的同事們在預(yù)印本網(wǎng)站arXiv.org上發(fā)布了一篇文章[3],揭示了一種偽造學(xué)術(shù)論文的新方式——用扭曲短語(tortured phrase)代替常規(guī)專業(yè)術(shù)語,躲過查重,讓文章順利發(fā)表。而被發(fā)現(xiàn)有此問題的文章多一半來自《微處理器和微系統(tǒng)》。


所謂“扭曲短語”是將約定俗成的英文專業(yè)術(shù)語通過軟件翻譯成某一門外語,再翻譯回英語,最終得到與原術(shù)語意思類似,但看上去非常奇怪的同義詞短語。比如,研究人員親自試驗(yàn),將“artificial intelligence”(人工智能)在相關(guān)軟件內(nèi)多次替換之后,就順利出現(xiàn)了“counterfeit consciousness”(仿造意識),“man-made brainpower”(人造智力)或者“computerized reasoning”(計(jì)算推理)等由“artificial intelligence”扭曲而來的畫風(fēng)奇異的術(shù)語。



論文對比了30個(gè)正確的英文術(shù)語和發(fā)表在論文中的“扭曲短語”[3]


這些隱蔽的問題是怎么發(fā)現(xiàn)的?


原來,今年4月,Cabanac和他的同事們先是在一些計(jì)算機(jī)科學(xué)的論文中發(fā)現(xiàn)了些許長相怪異的短語,于是搜集了30個(gè)奇怪短語(如上圖所示)放入引文數(shù)據(jù)庫中搜索,結(jié)果一下子搜出860多篇文章!而其中500多篇來自同一本期刊:《微處理器和微系統(tǒng)》。


隨后,他們選取了《微處理器和微系統(tǒng)》以及其他期刊上已經(jīng)發(fā)表的一些論文摘要,使用自然語言處理模型GTP(生成預(yù)訓(xùn)練,Generative Pre-Training)檢測器對其進(jìn)行分析,篩查出可能是人工智能轉(zhuǎn)寫出來的合成文本,并肉眼閱讀了其中幾篇,果然發(fā)現(xiàn)了不少公開發(fā)表的論文中不該出現(xiàn)的問題,包括:


- 重復(fù)使用文本/圖片,但未加標(biāo)注;- 引用根本不存在的文獻(xiàn);- 引用論文中并不存在的公式或變量;

- 文中摻雜著無法解釋、沒有意義的語句;


這種新的造假手段十分驚人。著名學(xué)術(shù)打假人Elisabeth Bik稱其“非常新穎”而又“令人不安”。


除了這些“不可接受”的錯(cuò)誤之外,論文評審過程也疑點(diǎn)重重。研究人員下載了2018-2021年間發(fā)表于《微處理器和微系統(tǒng)》上的所有論文,發(fā)現(xiàn)從2021年2月起,論文平均接收時(shí)間比原來縮短了5倍,但發(fā)表數(shù)量卻比此前三年(2018年-2020年)發(fā)表的總數(shù)還多。此間,有404篇論文從提交到接收的整個(gè)過程不到30天,其中394篇(97.5%)的作者來自中國大陸。而在同行評審時(shí)間超過40天的615篇論文中,只有58篇(9.5%)的作者來自中國大陸。


另外一個(gè)可疑之處是,有些論文的提交日期、修改日期和接受日期均為同一天,其中大部分發(fā)表在特刊上。對此,Cabanac表示,如果評審、編輯過程符合規(guī)范操作,那便無法合理解釋這一現(xiàn)象。


而且,Cabanac和同事所調(diào)查的扭曲短語問題論文,尤其是《微處理器和微系統(tǒng)》第80-83卷涉及的不少超速評審論文,行文結(jié)構(gòu)相當(dāng)統(tǒng)一、小標(biāo)題相似、圖表用色相同。因此,研究人員推測,這些論文可能出自論文作坊,并且還使用了論文降重改寫軟件,類似于spinbot.com這樣的免費(fèi)或者付費(fèi)軟件/網(wǎng)站。Spinbot類的軟件工作原理很簡單,就是同義詞替換。既可以替換單詞,也可以替換整段文本。這樣,作假者就很容易隨意截取他人論文素材,用軟件反復(fù)替換為自己所用,并躲過論文查重。


所有案例和數(shù)據(jù)都是觸目驚心的!在論文的最后,研究人員寫道:使用人工智能合成文本的欺騙行為嚴(yán)重危害了科研誠信,所有問題仍然脫離不了學(xué)術(shù)界長久以來“不發(fā)表,就爛掉”(publish or perish)的不良風(fēng)氣。因此,他們呼吁各領(lǐng)域的同行共同深入調(diào)查這一偽造論文的新手段,監(jiān)督論文發(fā)表的生態(tài)環(huán)境。目前,他們的研究范圍僅限于計(jì)算機(jī)科學(xué),還沒有人檢查其他領(lǐng)域內(nèi)是否存在“扭曲短語”現(xiàn)象。


雖然此次大規(guī)模論文重新調(diào)查事件尚未定論,但據(jù)目前情況來看,學(xué)術(shù)不端行為的泛濫面臨兩個(gè)嚴(yán)重新問題,值得警示:


首先,近年來,人工智能技術(shù)逐步應(yīng)用在學(xué)術(shù)不端控制與預(yù)防方面,包括大數(shù)據(jù)智能檢索防止文字、數(shù)據(jù)和圖像FFP[指偽造(Fabrication)、篡改(Falsification)和抄襲(Plagiarism)],AI輔助同行評審,智能身份識別等等,為提高科研誠信做出了貢獻(xiàn)。然而,帶來利的人工智能技術(shù)也可為有心學(xué)術(shù)不端的人所利用。除了已揭發(fā)的“扭曲短語”造假手段之外,未來是否會繼續(xù)出現(xiàn)更加便捷的智能造假技術(shù),應(yīng)用在更多學(xué)科領(lǐng)域的研究中呢?果真如此,又該采取怎樣的措施來預(yù)防并打擊各種新花招呢?


其次,這次事件還暴露了正刊之外特刊出版中的潛在缺陷,讓學(xué)術(shù)不端趁虛而入。愛思唯爾為特刊推出了一種新的出版流程:特刊文章可獨(dú)立發(fā)表,這樣可避免文章出版的延遲,克服了傳統(tǒng)流程的缺點(diǎn),即必須等所有稿件都完成之后才能出版。所以,特刊文章發(fā)表速度更快些,不過即使再快,正如Cabanac研究所發(fā)現(xiàn)的,400多篇論文在30天內(nèi)即完成從投稿到接收的過程,其中有些文章同一天投稿、修改、接收,這一明顯“超載行為”讓人無法不去懷疑其流程中有什么“貓膩”。


從原則上說,無論正刊還是特刊,編輯們都遵循相同的編輯和同行評審政策。對此,愛思唯爾發(fā)言人向《自然》解釋:“編輯系統(tǒng)中出現(xiàn)了配置錯(cuò)誤(configuration error)”,也就是說,主編或者指定負(fù)責(zé)處理特刊論文的客座編輯在投稿沒有通過應(yīng)有審批的情況下直接收到了這些文章,不過這只是“系統(tǒng)遷移時(shí)的臨時(shí)問題,一經(jīng)發(fā)現(xiàn)很快就會修正?!盵2]


盡管如此,愛思唯爾發(fā)言人曾回復(fù)《撤稿觀察》:“愛思唯爾對其所有主題特刊的整體流程進(jìn)行總體審查,除了現(xiàn)有的驗(yàn)證特刊提案和客座編輯身份和資格的流程外,我們會進(jìn)一步審查,以確保所有稿件接收的決定都得到主編或編輯委員會成員的一致確認(rèn),同時(shí)也會提醒員工注意特刊中的違規(guī)行為?!盵4]如此看來,關(guān)于特刊和客座編輯,不可避免需要一些改革,堵上其中漏洞,防止學(xué)術(shù)不端“鉆空子”。


參考文獻(xiàn)

[1] https://retractionwatch.com/2021/07/19/tortured-phrases-lost-in-translation-sleuths-find-even-more-problems-at-journal-that-just-flagged-400-papers/#more-122688

[2] https://www.nature.com/articles/d41586-021-02134-0

[3] https://arxiv.org/abs/2107.0 6751

[4] https://retractionwatch.com/2021/07/12/elsevier-says-integrity-and-rigor-of-peer-review-for-400-papers-fell-beneath-the-high-standards-expected/


計(jì)算機(jī)領(lǐng)域的論文“花式造假”的評論 (共 條)

分享到微博請遵守國家法律
蓝田县| 钟祥市| 任丘市| 陈巴尔虎旗| 阿拉善盟| 德兴市| 柳河县| 丰原市| 郓城县| 睢宁县| 怀来县| 巧家县| 许昌市| 密云县| 民丰县| 开化县| 石门县| 金坛市| 精河县| 科技| 衡阳市| 疏勒县| 葵青区| 屏南县| 仁布县| 灌云县| 昌乐县| 乐山市| 台中县| 马关县| 苏尼特右旗| 惠安县| 恭城| 高青县| 黔西县| 尉犁县| 阳谷县| 耒阳市| 将乐县| 依兰县| 松江区|