500篇文獻(xiàn)大批量下載,全網(wǎng)評測,唯一可行方案!
開始之前,先給大家道個歉,上次給大家分享的通過下載器批量抓取scihub資源的方式,雖然使用方法簡單,但是經(jīng)過多位粉絲朋友反饋,再加上我自己增大文獻(xiàn)數(shù)量去測試,發(fā)現(xiàn)確實(shí)存在一定問題。
后臺接到粉絲朋友們的反饋后,我開始以500篇/次的數(shù)量去測試網(wǎng)上所有的批量下載方案,最后發(fā)現(xiàn)有且僅有一種方案可以穩(wěn)定實(shí)現(xiàn),真正的批量下載scihub。
1、DOI+下載器【我打我自己】:
當(dāng)報(bào)錯窗口數(shù)達(dá)到一定數(shù)量,下載就會自動停止,無法繼續(xù)下載,只能手動不停的關(guān)閉彈窗,因?yàn)槲易约旱氖褂昧?xí)慣一般不會同時下載超過50篇文獻(xiàn),所以在初次寫分享文章時,并沒有發(fā)現(xiàn)這個使用問題。
2、Scihub桌面客戶端【全廢】:
scihub-Eva、Y學(xué)術(shù)、Spider、Desktop,恕我直言,一個能用的都沒有。下載幾篇之后,就會陷入無盡的失敗之中。
3、Zotero+scihub批量【慢的驚人,誰用誰知道】:
平均三分鐘一篇,正確率可人,但是速度不敢恭維,要下載500篇文獻(xiàn),估計(jì)需要后臺等待一個下午。
4、Python腳本:
使用方法最復(fù)雜,但也是唯一可以實(shí)現(xiàn)穩(wěn)定下載500篇文獻(xiàn)的神器。親測,500篇下載結(jié)束,用時30分鐘左右。網(wǎng)速快的時候,十五六分鐘。

如果你只需要批量幾十篇文獻(xiàn),那么小編還是很推薦你們使用前三種方案的,畢竟不用配置,即開即用,非常方便,純純的小白快樂屋。
但是!如果你要批量下載一百篇,甚至五百一千篇文獻(xiàn),那么除了使用Python腳本,別無他法,親身實(shí)踐,歡迎反駁。

聽到腳本先別跑,本文并不是教你如何寫python代碼的技術(shù)性文章(小編也不會Python?。且黄兗兊墓ぞ叻窒砦恼?/strong>,教你如何使用大佬已經(jīng)寫好的代碼,穩(wěn)定的實(shí)現(xiàn)python批量下載,全程小白視角,百分之百可復(fù)現(xiàn)。
本文所用Python代碼并非原創(chuàng),來源于CSDN上Trxye大佬,此處感恩大佬的無私分享。
強(qiáng)烈建議轉(zhuǎn)發(fā)收藏本文,這就是唯一有效的大批量下載解決方案。要不是網(wǎng)上沒有真正教小白怎么用這個代碼的教程,小編怎么會拖更兩個星期嘛,哭哭,自學(xué)真的超難的!


一、導(dǎo)出endnote中的DOI 信息
Python的下載依舊是要基于DOI的。所以在開始之前,將所有需要下載的文獻(xiàn)DOI全部整理到一個txt文檔中,一行一個DOI,最后一行以空行結(jié)尾。劃重點(diǎn),最后一個DOI也必須換行!

在WOS、Pubmed拿到批量DOI的流程相信不用我多說,直接選擇批量導(dǎo)出,就可以拿到批量的DOI。
這里我重點(diǎn)分享一下,如何把endnote里的所有文獻(xiàn)的DOI給導(dǎo)出來。因?yàn)楹芏鄬W(xué)員都是基于endnote進(jìn)行文獻(xiàn)篩選的,初篩完成之后要批量下載文獻(xiàn)了,不知道如何把這些文獻(xiàn)的DOI信息導(dǎo)出來,進(jìn)行批量下載。
1.1 新建輸出樣式
=>編輯Edit
=>輸出樣式Output Style
=>新建輸出樣式New Style
=>參考文獻(xiàn)Bibliography
=>模板Templates
=>插入DOI
=>保存樣式


1.2 批量導(dǎo)出文獻(xiàn)DOI
=>參考信息輸出樣式
=>更改為我們新建的樣式
=>全選需要下載的文獻(xiàn)
=>選擇輸出




1.3 新建一個txt文檔存放
雖然endnote輸出的文件就是txt文件格式,但是如果用這個文件去下載會運(yùn)行失敗,原因未知,小編真不會Python,別問為什么了。
解決方案:
手動新建一個txt文件,命名為doi.txt,將導(dǎo)出的DOI信息轉(zhuǎn)移到這個txt文件里來,就可以了。
二、環(huán)境配置:下載Python及編輯器
安裝其實(shí)沒什么難度,我這里主要展示幾個必須要注意的坑,其余均默認(rèn)即可。
雖然簡單,但是標(biāo)注出來的都是必須注意哦,否則大概率報(bào)錯。
2.1 安裝Python
官網(wǎng):https://www.python.org/





2.2 安裝Pycharm
這是個編輯器,為了讓后續(xù)用起來更順手一點(diǎn)。
官網(wǎng):https://www.jetbrains.com/pycharm
除展示外,其余全部默認(rèn)安裝。安裝完成后,進(jìn)入第三步。




三、安裝代碼依賴包
安裝完成后,將代碼用pycharm軟件打開。初次使用,會彈窗信任文件,信任然后打開。


代碼文件
點(diǎn)擊鏈接后臺回復(fù)【代碼批量】獲取。
點(diǎn)擊鏈接后臺回復(fù)【代碼批量】獲取。
點(diǎn)擊鏈接后臺回復(fù)【代碼批量】獲取。
???
https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw
進(jìn)入軟件后,會有一個提示窗口,不管他,直接關(guān)閉即可。

此代碼的運(yùn)行必須基于兩個庫requests和bs4,所以最后只需要安裝好這兩個庫,然后后續(xù)直接運(yùn)行大佬的代碼即可。
安裝也很簡單
3.1 在pycharm中找到:
File->settings ->Project:Desktop:


3.2 安裝bs4庫

3.3 安裝requests庫

四、修改代碼為自己所用
前述所有準(zhǔn)備工作完成后,就可以進(jìn)入使用階段了。
4.1 設(shè)置PDF存放的文件夾
將存放的文件夾路徑復(fù)制到雙引號中間部分
?直接復(fù)制的路徑每一層均缺少一個反斜杠,需補(bǔ)上;
?文件夾最后需補(bǔ)上兩根反斜杠;
按示例格式來就可以

4.2 設(shè)置DOI文檔的位置
右鍵DOI文檔,查看屬性,將位置復(fù)制到雙引號中間替換。只能替換雙引號中間部分,不能刪掉雙引號哦!
?補(bǔ)上反斜杠
?直接復(fù)制缺少【文件名.txt】這一部分,補(bǔ)上

4.3 還可以更改scihub地址
眾所周知,scihub經(jīng)常訪問不了,所以下面這里是可以換scihub地址的。哪個能用,用哪個。

好家伙,終于到運(yùn)行這一步了!點(diǎn)擊運(yùn)行!




本文代碼文件、軟件安裝包
均提供打包下載地址
點(diǎn)擊鏈接:
https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw
回復(fù)【代碼批量】
回復(fù)【代碼批量】
回復(fù)【代碼批量】
系統(tǒng)自動發(fā)送,免費(fèi)領(lǐng)取

Toedit,專業(yè)論文潤色、文稿翻譯、投稿指導(dǎo)、SCI服務(wù)機(jī)構(gòu)。我們的潤色和翻譯人員都是相關(guān)行業(yè)的碩博士,若因語言問題拒稿,或返修意見中有提到語言問題,可無限次免費(fèi)返修,直到您100%滿意。
Toedit潤色最快僅需8小時,承諾按時交稿,若遲交付全額退款。所有編輯均已簽署嚴(yán)格的保密協(xié)議,我們的資料安全流程已獲ISO質(zhì)量體系認(rèn)證,確保您的研究成果不外泄。歡迎咨詢~