科研人員需要了解的DataCite
隨著數(shù)字出版和在線期刊的發(fā)展,為了擺脫URL(Uniform Resource Locator,統(tǒng)一資源定位符,又稱網(wǎng)頁網(wǎng)址)頻繁出現(xiàn)的失效死鏈缺點,出版業(yè)推出了DOI(digital object identifier,數(shù)字對象標(biāo)識符)集中注冊管理技術(shù)。全球有兩家最大的DOI代理注冊機(jī)構(gòu),即Crossref(過去記為CrossRef)和DataCite。它們的共同功能是在不同的出版商網(wǎng)站之間實現(xiàn)參考文獻(xiàn)引文鏈接,以及數(shù)據(jù)的跨數(shù)據(jù)庫共享。關(guān)于DOI和Crossref,過去有專文介紹。
本文簡介DataCite的起源和功能,以及它與Crossref在科學(xué)數(shù)據(jù)管理等方面的不同之處。
DataCite的起源
DataCite是一家于2009年在英國成立的國際非盈利組織,由多家機(jī)構(gòu)聯(lián)合發(fā)起,包括英國大英圖書館、丹麥技術(shù)信息中心、荷蘭代爾夫特理工大學(xué)圖書館、加拿大國家研究委員會科學(xué)技術(shù)信息研究所、美國加利福尼亞數(shù)字圖書館、美國普渡大學(xué)、德國國家科學(xué)技術(shù)圖書館等。DataCite的服務(wù)目的包括:為科學(xué)數(shù)據(jù)創(chuàng)建元數(shù)據(jù)(metadata)集,為用戶分配DOI,增強(qiáng)數(shù)據(jù)搜索能力,與會員共同建立共享數(shù)據(jù)庫和高效引用機(jī)制。
DataCite的會員單位和用戶單位
DataCite不同于Crossref的一個重要方面是加盟成員分為會員(member)和用戶(user)兩個級別。DataCite的會員目前包括來自四十多個國家的250多家單位,包括數(shù)據(jù)中心、圖書館、政府機(jī)構(gòu)、研究型大學(xué)、大型出版商等。DataCite的功能運作是依靠這些會員的管理職能來實現(xiàn)的。DataCite的重要決策由會員共同投票決定。DataCite的會員申請對所有愿意分享數(shù)據(jù)的組織開放。在吸納新的會員機(jī)構(gòu)時,需要通過DataCite會員委員會的投票同意。會員職責(zé)包括為其用戶的數(shù)據(jù)分配DOI、存儲和交換元數(shù)據(jù)、解析DOI返回引文網(wǎng)頁網(wǎng)址等。因此,DataCite的會員實際是它旗下的一個代理管理機(jī)構(gòu)。與之不同的是,Crossref的會員(member)就是用戶(user),不予區(qū)分,例如小型期刊出版商。小型期刊出版商在DataCite里一般是用戶,而不是比用戶高一級的會員。
在DataCite官網(wǎng)公布的會員網(wǎng)頁上能夠看到,Crossref是DataCite的一個會員。還可以看到Clarivate Analytics、F1000 Research Ltd.、Elsevier(Mendeley Data)、SAGE Publishing、IEEE、ORCID、ResearchGate、世界銀行(World Bank)等數(shù)據(jù)庫、出版商和學(xué)術(shù)服務(wù)機(jī)構(gòu)也是DataCite的會員。DataCite目前在中國有四家會員,包括北京大學(xué)、清華大學(xué)、中國國家基因庫(China National GeneBank)、中國散裂中子源(China Spallation Neutron Source, IHEP)。
DataCite的會員所管理的用戶包括出版商、數(shù)據(jù)中心、圖書館、政府機(jī)構(gòu)、檔案館、大學(xué)、研究機(jī)構(gòu)等。這些用戶有注冊DOI和分享數(shù)據(jù)的需求。DOI的號碼前綴由DataCite分配給會員機(jī)構(gòu),然后由會員機(jī)構(gòu)授權(quán)給用戶使用。DOI的號碼后綴由用戶自行制定,或者由會員提供自動分配服務(wù),并保證唯一性。
DataCite的元數(shù)據(jù)搜索功能
DataCite為用戶的數(shù)據(jù)資源(例如期刊論文)分配DOI號碼,存儲管理元數(shù)據(jù)(metadata),解析DOI號碼以提供引文的網(wǎng)頁網(wǎng)址。其中,元數(shù)據(jù)搜索(DataCite Metadata Search)是一個重要的數(shù)據(jù)檢索工具,用戶能夠通過搜索數(shù)據(jù)集在DataCite上注冊的關(guān)鍵詞、日期、位置等元數(shù)據(jù)查找數(shù)據(jù)集。元數(shù)據(jù)搜索提供簡單檢索和高級檢索兩種檢索方式。在簡單檢索方式中,用戶只需輸入DOI或相關(guān)元數(shù)據(jù),如題名或主題作為檢索詞。在高級檢索方式中,用戶可以從DOI、標(biāo)題、創(chuàng)建者、出版者、貢獻(xiàn)者、格式、主題、日期等13個字段中選擇一個或幾個進(jìn)行檢索,同時還能夠根據(jù)數(shù)據(jù)中心、資源類型和語言等進(jìn)行檢索過濾。
DataCite與Crossref的區(qū)別
有些用戶可能會疑惑,在DataCite和Crossref這兩家機(jī)構(gòu)中,應(yīng)該加入哪一家?Crossref的很多成員的重點是出版業(yè)務(wù)。DataCite的很多成員的重點是管理數(shù)據(jù)存儲庫。另外,除了上述在會員和用戶級別方面的區(qū)別,這兩家機(jī)構(gòu)在服務(wù)內(nèi)容方面也存在一些區(qū)別。
Crossref提供以下服務(wù):
DOI注冊。
參考文獻(xiàn)鏈接(Reference Linking):這項服務(wù)能夠使讀者從參考文獻(xiàn)的DOI鏈接點擊跳往引文的全文網(wǎng)頁。
被引統(tǒng)計(Cited-by):這項服務(wù)顯示論文的被引用次數(shù)和引用它的文獻(xiàn)的鏈接網(wǎng)頁。
查重(Similarity Check):這項服務(wù)能夠幫助編輯檢查剽竊問題。
DataCite提供以下服務(wù):
DOI注冊(DOI Fabrica):這個功能與Crossref的類似。
鏈接檢查(Link checker):自動檢查注冊的DOI號碼,確保鏈接正確。
數(shù)據(jù)引用指標(biāo)(Data metrics badge):在成員網(wǎng)站針對每個ROI提供嵌入式引用指標(biāo)。
一般來講,Crossref更偏重出版流程方面的需求,而DataCite更偏重數(shù)據(jù)存儲和分享方面的需求。確實有一些單位同時加入了這兩個機(jī)構(gòu),來滿足它們在出版和數(shù)據(jù)存儲方面的需求。在跨平臺數(shù)據(jù)共享范圍方面,由于這兩個組織所擁有的會員和用戶有所不同,因此會有一些差別,在數(shù)據(jù)范圍方面的對比性研究還未見發(fā)布,具體可以咨詢在DataCite官網(wǎng)的會員網(wǎng)頁上公布的會員機(jī)構(gòu)。