劃重點!15種英文論文查重軟件親測推薦
重復率高被SCI拒稿了?文稿涉嫌抄襲了?論文抄襲是一種嚴重的學術不端行為,各大期刊出版社為了杜絕學術剽竊、保護知識版權(quán),通常會在采用查重軟件對收到的論文手稿進行重復率檢測,一旦發(fā)現(xiàn)抄襲,就會直接拒稿,甚至有可能引起更嚴重的結(jié)果。
因此在投稿之前,作者首先對文稿進行查重是十分有必要的,可以有針對性的修改與已發(fā)表的論文類似的部分,將會避免很多誤會,也能更加節(jié)省時間,從而使研究成果早日發(fā)表。
網(wǎng)絡上各種論文查重工具廣告宣傳讓人眼花繚亂,不知道該如何選擇。為了幫助大家避免犯錯,小編通過多方調(diào)研檢索到一篇《Testing of support tools for plagiarism detection》論文,希望能給予大家啟示,幫助到有需要的人。

這是德國柏林應用科技大學(HTW)工程學院計算機系教授Debora Weber-Wulff的文章。她從2002年開始發(fā)表有關剽竊的文章,從2004年開始測試檢測論文剽竊的工具,2020年這篇最新研究中,作者對比了下列15種論文檢測工具。

一、方法
假 設
該軟件測試的基本前提是模擬文本匹配軟件在教育環(huán)境中的實際使用情況。測試組部分成員在準備測試之前的學術經(jīng)驗做出了十條假設:
1.學生傾向于抄襲使用在互聯(lián)網(wǎng)上找到的文件,尤其是維基百科。
2.一些學生會試圖掩飾他們的剽竊行為。
3.很少有學生使用先進的技術來掩飾剽竊(例如,同形文字)。
4.大多數(shù)抄襲的學生不會抄襲單個來源,而是使用多個來源。
5.教師通常要一次性測試許多文檔。
6.教師提交學生作業(yè)有法律限制。
7.在某些情況下,教師只審核報告,提交由學生自己或助教完成。
8.教師沒有太多時間花在審閱報告上。
9.如果受到制裁,報告必須以印刷形式存儲在學生的永久記錄中。
10.大學希望知道每年使用一個系統(tǒng)的成本是多少。
測 試 文 檔
為了測試系統(tǒng),作者準備了八種不同語言的包含大量故意剽竊的文檔:捷克語、英語、德語、意大利語、拉脫維亞語、斯洛伐克語、西班牙語和土耳其語。這些文件使用了各種來源(維基百科、在線文章、開放獲取論文、在線學生論文)和各種剽竊技術(復制和粘貼、同義詞替換、釋義、翻譯)。

評 估
作者從軟件的覆蓋范圍和可用性方面對上述的15個軟件進行了評估。
覆蓋度:發(fā)現(xiàn)了多少已知的抄襲?系統(tǒng)是如何處理原文的?
可用性:測試過程本身是否順利?報告的是否易于理解?系統(tǒng)有多貴?其他可用性方面。
二、覆蓋度結(jié)果
語 言 類 型
大多數(shù)系統(tǒng)對英語、意大利語、西班牙語和德語的表現(xiàn)更好,而拉脫維亞語、斯洛伐克語、捷克語和土耳其語的結(jié)果總體上較差。
PlagScan 在英語表現(xiàn)最好,Urkund 在西班牙語、斯洛伐克語和土耳其語,PlagAware 在德語和http://StrikePlagiarism.com?在捷克語表現(xiàn)最佳。
三個系統(tǒng)(http://PlagiarismCheck.org、PlagScan 和?http://StrikePlagiarism.com)在意大利語集合中獲得了相同的最高分。

抄 襲 來 源
這些系統(tǒng)通常對維基百科的抄襲來源具有最好的檢測結(jié)果。Urkund 在 Wikipedia 上得分最高,Turnitin 找到了最多的開放獲取論文,http://StrikePlagiarism.com?在學生論文檢測方面得分最高,
http://PlagiarismCheck.org?在在線文章方面得分最高。

由于假設維基百科是學生論文的重要來源,因此作者對維基百科的結(jié)果進行了更詳細的檢查。大多數(shù)系統(tǒng)都能夠找到與從維基百科復制粘貼的文本的相似之處。系統(tǒng)對通過同義詞替換的維基百科剽竊方式的檢測表現(xiàn)通常較差,幾乎沒有系統(tǒng)能夠令人滿意地識別手動釋義的剽竊方式。

抄 襲 方 法
對所有 16 個單源文檔和 8 個多源文檔也進行了與上述Wikipedia所做的相同聚合。不僅檢查了復制粘貼、同義詞替換和手動釋義,還檢查了翻譯抄襲。

翻譯從英語到所有語言,以及從斯洛伐克到捷克,從捷克到斯洛伐克,從俄語到拉脫維亞。結(jié)果如下圖所示,軟件在同義詞替換和手動釋義剽竊方面的表現(xiàn)較差。
單源與多源文檔
測試中考慮的一種情況是,從多個來源的短文中編譯文本。這似乎更接近于現(xiàn)實世界的環(huán)境,其中抄襲整個文檔的可能性較小,而“補丁編寫”或“編譯”是學生,尤其是第二語言學生的常見策略。令人驚訝的是,一些系統(tǒng)在這兩種情況下的表現(xiàn)不同。

三、可用性結(jié)果
使用 23 個客觀標準評估系統(tǒng)的可用性,這些標準分為與系統(tǒng)工作流程過程、結(jié)果呈現(xiàn)和其他方面相關的三組標準。
工作流程過程
使用以下6個問題對軟件工作流程過程進行評估:
1.是否可以同時上傳和測試多個文檔?
2.系統(tǒng)是否要求填寫文檔的元數(shù)據(jù)?
3.系統(tǒng)是否為報告使用原始文件名?
4.文件測試有字數(shù)限制嗎?
5.系統(tǒng)是否僅以所選語言顯示文本?
6.系統(tǒng)能否處理大型文檔(例如,學士論文)?
在工作流程方面,五個系統(tǒng)在該類別中得分最高。只有五個系統(tǒng)的分數(shù)等于或小于 3。此外,最受支持的功能是處理大型文檔(13 個系統(tǒng)),以及以所選語言顯示文本且沒有字數(shù)限制(12 個系統(tǒng))。上傳多個文檔是一個不太受支持的功能。

結(jié) 果 呈 現(xiàn)
使用9個標準評估軟件檢測結(jié)果呈現(xiàn),如下所列:
1.報告可下載。
2.結(jié)果保存在用戶的帳戶中,以后可以查看。
3.匹配的段落在在線報告中突出顯示。
4.下載的報告(離線)中突出顯示匹配的段落。
5.相似性證據(jù)與在線報告中的來源并排顯示。
6.相似性證據(jù)與下載報告中的來源并排顯示。
7.報告中的文檔格式未更改。
8.文檔頁碼顯示在報告中。
9.該報告不會被誤報破壞。
沒有一個系統(tǒng)能夠在與測試結(jié)果相關的可用性組中獲得最高分。兩個系統(tǒng)(PlagScan 和 Urkund)支持幾乎所有功能,但六個系統(tǒng)支持一半或更少的功能。最受支持的功能是可以下載結(jié)果報告并在在線報告中突出顯示匹配的段落。較少支持的功能是在下載的報告和在線報告中并排展示證據(jù),以及保持文檔格式。

其 他 可 用 性
除了工作流程和結(jié)果呈現(xiàn)之外,還有其他值得評估的系統(tǒng)可用性方面,具體來說:
1.系統(tǒng)成本在系統(tǒng)主頁中明確說明。
2.有關免費系統(tǒng)試用版的信息在網(wǎng)頁上公布。
3.該系統(tǒng)可以作為 API 集成到學習管理系統(tǒng)中。
4.該系統(tǒng)可以與 Moodle 平臺集成。
5.系統(tǒng)提供呼叫支持。
6.電話支持以英語提供。
7.英文在網(wǎng)站和報告中使用得當。
8.沒有外部廣告。
只有?http://PlagiarismCheck.org?和 Unicheck 滿足所有標準。五個系統(tǒng)只能支持不到一半的標準。最受支持的功能是沒有出現(xiàn)語法錯誤,也沒有外部廣告。有問題的地方是沒有清楚地說明系統(tǒng)成本。

四、結(jié)論
基于總的覆蓋性能,計算為每個測試文檔的平均分數(shù),我們可以根據(jù)系統(tǒng)在0(最差)到5(最好)的范圍內(nèi)的總體位置,將系統(tǒng)劃分為四個類別(在每個類別中按字母順序排序)。
1.有用的系統(tǒng)——總分在[3.75-5.0]:
There were no systems in this category
2.部分有用的系統(tǒng)——總分在 [2.5–3.75):
PlagAware,PlagScan,StrikePlagiarism.com, Turnitin, Urkund
3.略微有用的系統(tǒng)——總分在[1.25-2.5]:
Akademia,Copyscape,Docol?c,PlagiarismCheck.org, Plagiarism Software, Unicheck, Viper
4.不適合學術機構(gòu)——總分在[0-1.25]:
Dupli Checker, DPV,?http://intihal.net
基于可用性標準對系統(tǒng)的分類
5.有用的系統(tǒng):Docol?c,PlagScan、Turnitin,Unicheck、Urkund;
6.部分有用的系統(tǒng):DPV,PlagAware,http://PlagiarismCheck.org,http://StrikePlagiarism.com,Viper;
7.勉強有用的系統(tǒng):Akademia,Dupli Checker,Copyscape,http://intihal.net,Plagiarism Software。
不適合學術機構(gòu):-
