新型冠狀病毒來源于哪里?
本文作者:無奶樹 & 黃宇軒 | 公眾號:biokiwi
本文關(guān)鍵詞?新型冠狀病毒 蝙蝠 中間宿主 傳染時間
作為一個志在生物科普的自媒體,我們既希望能盡快把和新型冠狀病毒相關(guān)的信息盡快告訴大家,但也希望能把一些我們本來就很關(guān)注的,生物科研相關(guān)的內(nèi)容告訴大家。
因此這里整理了病毒爆發(fā)以來的一些報道文獻和報告,來告訴大家:除了醫(yī)療工作者,科研工作者也在努力奮戰(zhàn),并取得了一定的成果。也希望能安撫大家心中對新型冠狀病毒的緊張感。
我們盡可能地跟進相關(guān)的研究,給大家梳理兩個月來的關(guān)于病毒溯源的研究進展。
我們先來看看,新型冠狀病毒傳染的源頭到底是哪里?這個源頭這么難找嗎?
蝙蝠是幕后大boss嗎?
如果問傳染源的動物是什么,好幾個答案可能會在你腦海里冒出來:蝙蝠,尤其是中華菊頭蝠,好像還有說是中華馬蹄蝠?還有說法是蛇吃了蝙蝠,人又吃了蛇等等……
感覺答案非?;靵y呢,不過似乎和蝙蝠脫離不了關(guān)系。
最開始是通過基因測序獲得了病毒的全基因組,之后再和已知的冠狀病毒比對,發(fā)現(xiàn)最相似的冠狀病毒來自于可以寄生于蝙蝠的一種,相似度在88%左右[1]。而SARS的相似度比80%還要低。
這就好像一個找茬游戲,新型冠狀病毒這幅畫,和這個病毒有幾十個不同,和那個有十幾個不同,而和最像的可能只有八九個不同。
那么他們長得既然很像,也就有很相似的表型,因此也可能都是來自蝙蝠的。
但88%的相似其實仍然隔著很遠的距離,舉個例子,人和黑猩猩基因組的相似性是98%-99%,那么新型冠狀病毒和這個病毒還是差得有點遠的。(不過這只是一個非常粗淺的比較,人的基因組相比于病毒非常龐大,所以這個比較其實不太準(zhǔn)確)

而病毒研究所的石正麗老師卻給這個找茬游戲提供了更好的選擇[2]。
他們團隊提供了和新型冠狀病毒只有一兩個不同的找茬結(jié)果,這個結(jié)果指向了一種中華菊頭蝠里的冠狀病毒,相似度高達96%。除了基因組上的找茬,他們還通過血清學(xué)、電子顯微鏡觀察、受體結(jié)合情況等等檢驗,確定了這是目前最接近正確答案的一個結(jié)果。
同時他們還利用了細胞以及轉(zhuǎn)入ACE2蛋白的小鼠作為疾病模型來感染病毒,進一步確認了這種新型病毒的感染方式——極大可能是通過結(jié)合人的ACE2蛋白實現(xiàn)的感染。

而之前在丁香醫(yī)生的疫情公告里出現(xiàn)過的中華馬蹄蝠,則是名字的混淆導(dǎo)致的:中華菊頭蝠的英文名是Chinese horseshoe bat,直譯就成了中華馬蹄蝠[3]。
但是中國分類學(xué)上的命名是中華菊頭蝠,為了避免混淆,現(xiàn)在疫情公告上的名稱也改過來了。

難道是直接吃蝙蝠傳染的嗎?
再說回剛剛討論的傳染源。
蝙蝠本身因為奇特的免疫系統(tǒng),能攜帶多種病毒但仍能正常存活,而蝙蝠攜帶的病毒往往較難直接傳播到人身上,而且之前爆發(fā)的SARS和MERS病毒則是來源于中間宿主,果子貍和駱駝。
所謂中間宿主,可以理解為,蝙蝠身上帶著的病毒先是傳染給了果子貍或駱駝,之后人吃了未煮熟的果子貍駱駝,或者可能飼養(yǎng)過程中接觸、劃傷,亦或者其他比如空氣傳播的方式,導(dǎo)致了最終人的感染。
那新型冠狀病毒的中間宿主是什么呢?

最早的說法是,可能來自蛇[4]。但是這個卻不是相對靠譜的找茬比較的方法,有點像是一種推理:病毒自身不能存活,是要寄生在生物體內(nèi)的。那么什么樣的生物最適合病毒生存呢?研究者運用密碼子偏好性來研究。
為了方便我們還是舉個例子吧。我們知道蛋白的翻譯過程需要“搬運工”(tRNA)識別三個堿基,而我們有ATCG四種堿基,這就有4x4x4總共64種搬運工。
這些搬運工在每個動物里面都差不多,也基本都是64種,這64種搬運工則需要分工搬運20種氨基酸,這時不同動物體內(nèi)就出現(xiàn)不同意見了。
有的動物對于這個氨基酸比較喜歡搬運工小李,但別的動物比較喜歡搬運工小張,這里就有了差異。
而病毒在宿主體內(nèi)翻譯蛋白也需要搬運工,那么就開始找什么動物的搬運工和病毒比較像呢?
最后研究者找到了蛇。

方法乍看起來很靠譜,但很快引起了人們的質(zhì)疑[5]:
一是對于不同動物有的只研究了幾萬個搬運工,有的研究了幾千萬個,這顯然“不公平”,得出來的結(jié)果缺乏準(zhǔn)確。
另一個則是,當(dāng)你用SARS、MERS或者其他蝙蝠宿主的病毒去進行這個推理的話,最后的結(jié)果也是蛇。
顯然我們不能只關(guān)注于“搬運工”,可能還需要考慮很多的因素再來推理。這個方法看樣子不太可靠。

另一個研究方法則把目標(biāo)指向了另一種可能的動物——水貂[6]。
這個則是根據(jù)已有的數(shù)據(jù)庫信息作為訓(xùn)練集,利用深度學(xué)習(xí)的方法,模擬出了病毒可能的感染方式和感染能力,之后再對比發(fā)現(xiàn),水貂可能是中間宿主。
深度學(xué)習(xí)的預(yù)測方法考慮的可能更全面,但是中間的過程都被忽略了,可能只能模擬出感染的可能性。
而這個預(yù)測結(jié)果是否準(zhǔn)確,我認為還需要有實地考察的檢驗才能知道。
雖然曾經(jīng)溯源找到果子貍的管軼老師去了武漢說相關(guān)的檢驗無法展開[7],但是從目前中國疾控中心的消息看,研究者已經(jīng)在華南海鮮城市場檢測到了陽性樣本[8],找到起來應(yīng)該是中間宿主應(yīng)該是指日可待。
直到2月中旬,管軼教授、華南農(nóng)業(yè)大學(xué)先后發(fā)布了文章,通過查捕的非法走私穿山甲,他們檢測到了里面含有冠狀病毒,通過分離病毒和分析病毒序列,發(fā)現(xiàn)病毒整體相似性在90-93%左右,受體結(jié)合的關(guān)鍵區(qū)域相似性在99%。
穿山甲成為了重要的潛在關(guān)鍵宿主。
我們關(guān)于這一研究的專門寫了專欄文章,歡迎查看。

但事情好像沒有那么簡單
1月24日發(fā)布在醫(yī)學(xué)期刊《柳葉刀》上的關(guān)于最早的41個病人的描述[9],出現(xiàn)了一些變化:之前一直說的患病者都來自于華南海鮮城,但是最早有三個病人,都沒有接觸過海鮮城。
而這41個人中,有13個人和海鮮城沒有關(guān)系。

這可能說明,華南海鮮城并不是新型冠狀病毒的真正來源[10]。
而另外有一項時間預(yù)測的分析[11],研究者結(jié)合了目前發(fā)布的27個基因組,運用分子進化軟件BEAST預(yù)測了這些病毒的最初祖先(the most recent common ancestor,簡稱 TMRCA)可能在什么時候出現(xiàn)。
如果還是以找茬游戲作為一個比喻,我們通過找茬可以找到這27個圖里面都各自有些什么不同的地方,那么通過構(gòu)建它們之間的關(guān)系,再結(jié)合上預(yù)測的改變速度,我們可以推測這些不同是經(jīng)過了多長時間變出來的。(實際的算法可以看參考資料[12])
直接看結(jié)果的話,預(yù)測的時間在10.1-12.22范圍內(nèi),參考值是12.2左右。
這也進一步說明了預(yù)測的感染時間可能和第一例病人吻合,也可能還要再往前推前不少。

其實這個結(jié)果也不是很出意料:
2003年的SARS病毒最早是在11月中出現(xiàn),直到12月15日才報告了第一例病例;
而中東呼吸系統(tǒng)綜合征MERS,最早的病例在2012年6月的一位沙特患者出現(xiàn),而追溯分析卻將傳染源追溯到了4月份約旦的一次醫(yī)院肺炎爆發(fā)。
這樣來看,新型冠狀病毒出現(xiàn)的時間可能比現(xiàn)在知道的還要早:要么可能是本身就已經(jīng)在動物中存在了,在轉(zhuǎn)運過程中進入了華南海鮮城;也可能是那位12.1報道的病人那樣,有人感染了再進入到海鮮城進一步地傳染。
這顯然給科學(xué)家提出了更大更復(fù)雜的難題。
另有可能?缺乏依據(jù)!
在2月初中國人們還在為雙黃連的事弄得一頭霧水的時候,另一邊國外的生物預(yù)印本網(wǎng)站bioRxiv也炸開了鍋:印度學(xué)者指出新型冠狀病毒的插入片段和HIV相似。
但是當(dāng)我打開文獻看的時候,卻看到的是重重疑點。
先講講研究的思路,我們舉過找茬的例子:研究者先是利用新病毒的基因組和SARS比對找茬,發(fā)現(xiàn)和人結(jié)合的S蛋白這個區(qū),新病毒有四個多出來的東西,之后把這四個不同和其他病毒比較找茬,發(fā)現(xiàn)這四個不同和HIV的一模一樣!
但是,文章并沒有告訴我們他比對的其他結(jié)果,這四個不同的地方也很小(6-12個氨基酸)。文章后面的評論也指出,他們用同樣的方法,但是卻能找到和蝙蝠的冠狀病毒相似;

再者,和冠狀病毒有20%的差別呢,那其他地方比了也是HIV嘛?
另外我自己也試著找了一下茬,比較了一下其他動物的,發(fā)現(xiàn)第一個不同至少有三十多個長得完全一樣的,說不定這個片段是從中間宿主那插進去的呢?
順帶一提,bioRxiv雖然有很多論文,但都是未經(jīng)過同行評議的,換句話說就是不一定靠譜,你只要留個聯(lián)系方式寫篇英文文章你可能也能發(fā)。所以這上面的文章不少結(jié)論不一定對的。
另外,這篇文章的印度作者已經(jīng)撤回文章修改。

病毒的溯源分析也有新進展
近期又有一些新的利用生物信息學(xué)與群體遺傳學(xué),從群體進化的角度分析了新冠病毒的起源的文章。這里做個簡單概述也算是一個補充。
2月16日,有一篇發(fā)表在中國科學(xué)院科技論文預(yù)發(fā)布平臺(http://www.chinaxiv.org)的一篇還沒有經(jīng)過專家審核(peer review) 的文章,來自中國科學(xué)院西雙版納熱帶植物園。ChinaXiv也明確注明了:不應(yīng)被視為結(jié)論性的、指導(dǎo)臨床實踐/健康相關(guān)行為的信息,也不應(yīng)作為既定事實在新聞媒體報道。

文章主要通過單倍型進行溯祖的研究。所謂單倍型,舉個例子就很好理解,我們高中生物學(xué)過的豌豆有AABBCC這樣的基因型,那么單倍型就是指ABC這樣的連鎖的基因;那么其實就類似與我們和歐洲人、非洲人可能有不一樣的地方,其實我們和歐洲人、非洲人都可以理解為獨立的單倍型,但都屬于人類。首先理清這個概念,并不是說病毒變多了,其實都是一種病毒,他們內(nèi)部有一些差異很正常。
之后文章提到選取了網(wǎng)上已遞交的96個數(shù)據(jù),其中美國有13個,中國有54個,湖北有22個。再通過不同的單倍型的比較,推斷哪些類型是比較早的“祖先”,哪些類型是比較晚的“后輩”。發(fā)現(xiàn)的單倍型關(guān)系簡單列一下(從前往后是從早到晚):
mv1→H13→H3→H1
mv1→H38→H3→H1
其中在湖北發(fā)現(xiàn)的都是H3或者H1,而H13在廣東深圳的病例發(fā)現(xiàn),H38在美國的首例患者發(fā)現(xiàn)。這時的媒體報道就炸了:病毒起源于美國的意思嗎!

然而事實并不是那么簡單就能下定論的。
首先這是篇預(yù)印本文章,其結(jié)果、數(shù)據(jù)、結(jié)論都不應(yīng)該被媒體報道,也不能被隨意報道。這種不真實不準(zhǔn)確的報道是對科學(xué)共同體探尋出的合理評判科學(xué)論文這一體系的一種踐踏:科學(xué)論文經(jīng)過的同行評議審核非常嚴(yán)格,你報道說是就是了,那科學(xué)家豈不是隨便都能當(dāng)?
其次文章使用的數(shù)據(jù)樣本比例也不對,湖北感染者占全世界全部的80%,取樣卻只有22個,而美國、廣東的取樣出現(xiàn)H13和H38的都是早期的病人,其中美國的首例患者有明確的武漢旅居史(1月5日回武漢探親,15日回美國,19日入院),在武漢感染到了比較早的H38型病毒,這也不奇怪。
文章作者也提到,下一步就是要找到武漢本地的“祖先型”病毒,這樣對病毒的溯源會有很大的幫助。
簡單來說,目前最可能的結(jié)果是:在湖北產(chǎn)生了H38、H13的“祖先型”病毒,并被傳播到了廣東、美國等等地方,而湖北內(nèi)部的病毒發(fā)生了變化(文章提到了病毒經(jīng)歷過兩次“轉(zhuǎn)型”,加強了傳播能力),更廣泛的H1、H3型病毒出現(xiàn)了,也覆蓋住了武漢原來的“祖先型”病毒。
而從華南海鮮市場檢測到的單倍型,顯示病毒的起始可能并不只是華南海鮮市場,這一點我們回答里面本身也有提及,大家可以看看,這里就不再多言。
現(xiàn)在做個總結(jié)來回答題目的問題:
這個病毒可能從中華菊頭蝠中的某個冠狀病毒開始出現(xiàn),并逐漸開始進化可以跨物種感染;
之后這個病毒被傳播到某類中間宿主,較大可能是哺乳動物,而不是蛇,說不定可能是水貂,目前來看最大的可能是穿山甲,但穿山甲內(nèi)的病毒的基因組和新冠相似性較低,這個過程可能發(fā)生了更復(fù)雜的遺傳重組;
在之后這個動物可能被帶到了華南海鮮城,或者在這之前先感染了某個或幾個人,而這些人又去了華南海鮮城;
最后導(dǎo)致了后面大家看到的逐步爆發(fā),這個爆發(fā)目前來看經(jīng)歷了兩次,并且病毒發(fā)生了一定的變化,可能在1月初提高了自身的傳播能力,得已開始大范圍傳播。
這個問題的逐步解答能幫助疫情的進一步控制以及認識到如何才能避免相關(guān)事件再次發(fā)生。
雖然看起來還有些模糊,不過值得高興的是,相較于17年前,科學(xué)家們的速度更快了。
一個月內(nèi),我們已經(jīng)進行了至少35個病例病毒的全基因組測序,并開發(fā)出準(zhǔn)確高效的核酸試劑盒;
同時也觀察并分離出了新型冠狀病毒,進一步確定了病原體,并為后續(xù)的治療方法、疫苗研發(fā)提供了基礎(chǔ)。
而這些在17年前,從02年12月發(fā)現(xiàn)到03年4月發(fā)現(xiàn),這經(jīng)歷將近5個月的時間。
相信科學(xué)家們,會努力朝著問題的真相不斷努力!
參考資料:
[1] 2019新型冠狀病毒信息庫, 國家基因組科學(xué)數(shù)據(jù)中心,?https://bigd.big.ac.cn/ncov
[2] Peng Z, Xing-Lou Yang, et.al. Discovery of a novel coronavirus associated with the recent pneumonia outbreak in humans and its potential bat origin. bioRxiv 2020.01.22.914952?https://www.biorxiv.org/content/10.1101/2020.01.22.914952v1
[3] 國家動物博物館員工, 微博
[4] Wei Ji, Wei Wang, et al. Homologous recombination within the spike glycoprotein of the newly identified coronavirus may boost cross‐species transmission from snake to human. Journal of medical virology.?https://doi.org/10.1002/jmv.2568
[5] 商周,質(zhì)疑:蛇是武漢新型病毒的中間宿主嗎?| 商周專欄,知識分子,2020.1.23
[6] Qian Guo, Mo Li, et.al. Host and infectivity prediction of Wuhan 2019 novel coronavirus using deep learning algorithm. bioRxiv 2020.01.21.914044?https://www.biorxiv.org/content/10.1101/2020.01.21.914044v2
[7] 財新網(wǎng),媒體采訪SARS專家管軼:這次我害怕了
[8] 新華網(wǎng),中國疾控中心在武漢華南海鮮市場檢出大量新型冠狀病毒
[9] Huang C, Wang Y, Li X, et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. The Lancet, 2020.
[10] Jon Cohen. Wuhan seafood market may not be source of novel virus spreading globally. Science, Jan. 26, 2020 , 11:25 PM.
[11] Kristian Andersen. Clock and TMRCA based on 27 genomes.?http://virological.org/t/clock-and-tmrca-based-on-27-genomes/347
[12] Suchard MA, Lemey P, et.al. (2018) Bayesian phylogenetic and phylodynamic data integration using BEAST 1.10 Virus Evolution 4, vey016. DOI:10.1093/ve/vey016