文獻研究提效:Zotero的使用教程 01

前言

無論是在學界還是在業(yè)界,文獻(期刊、學位論文等)都是重要的研究資料。文獻可以幫助我們了解某領(lǐng)域的知識,也能作為我們論證和下結(jié)論的依據(jù),但這都建立在“大量”的基礎(chǔ)上。文獻管理,尤其在較短周期的項目中,顯得非常重要。好的文獻管理可以減少手動工作量,提升整個研究過程的效率。本系列文章的目的旨在介紹基于Zotero軟件的文獻管理辦法,特別是在短期研究項目的應(yīng)用,希望帶給有文獻研究需求的讀者一些參考。

Zotero是一款免費、開源的文獻管理軟件,具有操作簡單、功能豐富可擴展的優(yōu)點。短期的文獻研究通常來業(yè)界,需要在短時間解決一個具體的研究問題,例如HR想知道影響求職意向的因素有哪些。根據(jù)研究問題我們需要制定研究計劃、收集和篩選文獻、抽取和整合文獻信息、撰寫研究報告。
Zotero在制定計劃以外的其他階段都能幫助你提升研究效率。本文會主要集中在文獻的收集和篩選環(huán)節(jié),并且進一步拆分為了1、文獻的收集;2、文獻的整理;3、文獻的存儲。圍繞文獻研究中的需求場景,介紹一些軟件技巧和插件。受限于筆者精力,僅做簡單介紹,更多資料會以鏈接形式放在文中。
閱讀本文可能幫你解決以下問題:
我如何自動抓取文獻元數(shù)據(jù)?
我如何批量獲取文獻全文?
我如何快速給文獻做記號?
我如何備份和同步我的文獻?
1 文獻的收集

文獻收集目的是獲取能回答研究問題的資料,是一個不斷查找、篩選和下載的過程。在此,我們不討論文獻的檢索相關(guān)問題,假定我們已經(jīng)獲得了結(jié)果列表,下一步,我們要做的是獲取文獻的元數(shù)據(jù)(描述文獻的信息,包括標題、摘要、關(guān)鍵詞、出版日期等)和全文(通常是pdf格式)。使用傳統(tǒng)的本文件夾管理時,在獲取文獻元數(shù)據(jù)會面臨元數(shù)據(jù)難存儲和難獲取的問題;在下載文獻全文時也存在頻繁操作的問題。而使用Zotero可以在很大的程度上解決這些問題。
1.1 使用條目存儲文獻
你需要了解“條目”這個概念,條目是Zotero的管理單位,條目會存儲元數(shù)據(jù),也可以攜帶附件(通常是文獻的全文或筆記)。形式上,條目好像是文件夾,里面收納了附件。實際上,如果你去探索Zotero的全文文件存儲位置,你會發(fā)現(xiàn)它在一個由英文和數(shù)字命名的文件夾里,這個文件夾還存了元數(shù)據(jù)的文件。原來,在Zotero每個條目都對應(yīng)一個文件夾,但不會有更高層級的文件夾,這樣“單一保存、平鋪”的好處你會在2.2部分找到。

1.2 自動抓取元數(shù)據(jù)
本節(jié)僅介紹文獻元數(shù)據(jù)的抓?。ㄔ獢?shù)據(jù)的導(dǎo)出也十分有用,但筆者會在后文介紹)。元數(shù)據(jù)的抓取有兩種方式:
1)從網(wǎng)絡(luò)上抓取
Zotero提供了瀏覽器插件Connector,它能夠自動瀏覽當前網(wǎng)頁的類型(博客、期刊、會議等),然后一鍵抓取元數(shù)據(jù),自動在Zotero里生成一個條目。默認設(shè)置的Connector插件對中文網(wǎng)站的識別有欠缺,你可以更新它的Translator文件,詳見Zotero Translators中文維護小組主頁:https://github.com/l0o0/translators_CN
你也可在數(shù)據(jù)庫選中多篇文獻,導(dǎo)出他們的元數(shù)據(jù)。通常選擇BibTeX、RIS、Text等格式,而后批量導(dǎo)入到Zotero中。配合下文1.3自動獲取全文使用,這無疑會節(jié)省你很多時間,但這對中文文獻有局限,所以更加適合學界的研究場景。
2)從全文pdf里抓取
當你把一篇全文pdf放到Zotero時,通常它會自己嘗試提取元數(shù)據(jù)生成條目,這對大部分英文論文有效。但中文全文就需要插件“茉莉花”的幫助,確保你獲取的文獻標題正確,這個插件會去CNKI里按標題找到對應(yīng)的元數(shù)據(jù)并獲取它們。

茉莉花插件還提供一些對中文文獻管理友好的功能,例如提取碩博士論文的目錄、合并拆分作者名、獲取知網(wǎng)引用量等。?https://github.com/l0o0/jasminum
1.3 自動獲取全文
當你用Connector自動生成一個條目時,通常Zotero會自動幫你提取全文pdf。如果你擁有數(shù)據(jù)庫的權(quán)限,通常它會自動幫你下載,然后放到條目下,不需要你點擊。如果你沒有數(shù)據(jù)庫的權(quán)限,它會啟動“查找可用的pdf”功能,如果那篇論文是Open Source類型,它會找到并下載,放到條目下。自動下載全文在你批量導(dǎo)入文獻元數(shù)據(jù)后很有用,你可以批量選中沒有全文的條目,右鍵點擊“查找可用的pdf”,Zotero會自動幫你找文獻,下文獻,放到指定的條目下。但Open Source的范圍實在是太少了,你可以通過如下辦法利用Sci-Hub來調(diào)取大部分的英文論文,但對在學界做研究非常有用。https://zhuanlan.zhihu.com/p/112141757
2 文獻的整理

對文獻的整理就是一個分類和貼標簽以及排序的過程,終極目的是為什么更快地找到想要的文獻。實際上,你如果只想要一篇文獻,你使用搜索就夠了。但對一個研究項目來說,更具體的需求應(yīng)該是,你需要把一個項目的文獻放在一塊兒,然后邊閱讀,邊標記文獻的閱讀的狀態(tài)、重要性、關(guān)鍵主題。使用Zotero可以很好滿足這些需求。
2.1 使用Zotero搜索
Zotero上方有個搜索框,你可以輸入標題、作者等一些字段來檢索文獻;同時你可以使用高級搜索,來更精準找到文獻。但你可能會用搜索找到了一篇論文,想要反推它歸類在哪里(當你分類數(shù)量和層級很多時)并不是很容易。這時你可以按住Ctrl鍵,然后鼠標左鍵點擊條目,這樣該條目屬于的分類將會閃爍一下,提醒你該條目歸屬于那里。
2.2 使用Zotero分類
Zotero最主要的整理方式就是分類,新建一個分類,就可以直接開始放入你收集的文獻。它在很多地方與文件夾相似,這并沒有什么值得說的,但是也有兩點很明顯的差異。
① 文獻條目A可以同時存在于多個分類,但是A只會保存1份,無論在哪個分類修改了A,其他分類中看到的也是修改后的A,試想在傳統(tǒng)的文件夾中,其實是保存了多個A副本,修改某個文件夾內(nèi)的A,不會影響其他文件夾中的A副本。
② 當你刪除某個分類時,你可以選擇僅刪除分類但保留條目(沒有分類的條目會自動歸入“未分類的條目”),試想,在傳統(tǒng)的文件夾中,這是無法做到的。擁有這些特性,讓一篇交叉領(lǐng)域的研究不需要在因為分到哪兒而苦惱。
2.3 使用Zotero的標簽
這比分類更值得說,使用標簽通??梢詭湍氵M一步篩選文獻,標記你需要重點關(guān)注的文獻,Zotero也有自定義標簽和自動標簽兩種,你至少需要知道下面這些技巧:
① 添加自定義標簽/使用快捷方式/批量添加標簽/標簽美化
添加自定義標簽:選中條目,在右側(cè)的屬性面板區(qū)域找到標簽,點擊“add”。添加好的標簽會出現(xiàn)在左下方的標簽區(qū)域。
當你添加好了標簽,你可以右鍵單擊標簽,給指派顏色和快捷鍵(通常是數(shù)字1、2、3、4)給標簽,尤其是常用的,例如“已讀”、“未讀”、“重要”、“排除”等,這樣你可以更快的給文獻打上標記。

實際上,Zotero同樣也支持批量添加標簽,但這很隱蔽。你可以多選條目,然后拖動它們,一直拖到想要添加的標簽上面松開,這些被選中的條目就會都打上標簽。
如果你想要美化Zotero的標簽樣式(顯示閱讀進度),你可以使用“Zotero Style”這個插件:https://github.com/MuiseDestiny/zotero-style
② 隱藏和刪除自動標簽
往往導(dǎo)入文獻時,文獻附帶的一些標簽,大多是一些關(guān)鍵詞。自動標簽很容易變得很多,也許會使得你很煩惱,你可以選擇隱藏它們或者直接統(tǒng)一刪除它們。
2.4 使用Zotero的排序
排序在以下兩種情況很有用,① 你在按照年代階段梳理文獻內(nèi)容;② 你在核對文獻的筆記(通常是一張表格,每一行對應(yīng)了一篇文獻)是否缺漏。你可以右鍵單擊條目區(qū)上方的類似“表頭”的區(qū)域,就可以切換正序和倒序,你還可以右鍵選擇需要展示的元數(shù)據(jù),并且用它們來排序。
3 文獻的存儲

對于研究者來說,文獻資料應(yīng)該有個好的存儲備份方式,以免丟失。你可以選擇Zotero的原生云或者WebDAV。
3.1 使用原生云
原生一般意味著簡單,你可以組測一個賬號,然后選擇用Zotero云備份,此外不用做什么額外的配置。但缺點是免費的額度只有300M,長期使用的話是不夠的,但購買更多的容量價格并不友好,所以使用WebDAV可能是更合適的方式。另外,你需要知道的是Zotero的群組功能只有原生云能夠同步附件,如果你需要團隊在線協(xié)作,那只能選擇原生云。
3.2 WebDAV
WebDAV可以片面理解為一項云盤服務(wù),它允許你不用下載云盤軟件,僅通過網(wǎng)站、賬號、密碼就可以在本地和云端之間同步文件,這樣就可以幫助你備份Zotero中的文獻資料。提供這種能力的云盤很少,你可以嘗試堅果云,或者TeraCloud。

實際上TeraCloud更有優(yōu)勢,因為堅果云會限制每個月上傳和下載的流量,雖然對于文獻的同步需求來說,免費版本也是足夠用的。但TeraCloud沒有流量的限制,免費的容量可以通過邀請任務(wù)升級到15g,備份文獻完全足夠。
具體的教程參考如下:https://www.bilibili.com/read/cv18956813?from=articleDetail
總結(jié)

本文主要聚焦在Zotero在文獻收集和篩選環(huán)節(jié)上的應(yīng)用,提到一些技巧,比如標簽的運用、使用Sci查找pdf、teracloud云同步等,也提到了一些插件,比如connector、茉莉花、Zotero style等。后續(xù)文章筆者將繼續(xù)介紹Zotero在文獻閱讀、信息抽取與整合、報告輸出等方面的應(yīng)用場景和技巧。希望能夠?qū)氖挛墨I研究的你有所有幫助,同時如發(fā)現(xiàn)文章有需要改進之處,請留下你寶貴的意見。