近千例患者的腸道菌群測序樣本收集不到?莫慌,生信挖掘可以實現(xiàn)!8+的純生信分析等您
? ?

近幾年,單純的測序和數(shù)據(jù)分析發(fā)表高分文章的難度越來越高了。
? ? 腸道菌群絕對是少有的幾個重要方向之一。
? ? 我們在pubmed檢索發(fā)現(xiàn),近3個月中,涉及菌群16s測序的文章已經(jīng)達到了近700篇,相當于每天6-7篇的頻率,這個數(shù)量是很驚人的。

? ? 其中,要想達到高分數(shù),增加樣本數(shù)量是一種途徑。
? ? 比如,下面這篇33分的文章,就檢測了共計3127例患者(測試集2472例和驗證集655例)。

? ? 對我們多數(shù)研究者來說,收集到幾十例患者已經(jīng)花費九牛二虎之力,且不說還有后面巨量的測序費用支撐。所以,有時候卻只能望洋興嘆,敗興而歸。
? ? 該如何解決了?其實粉絲們可能已經(jīng)知道思路了--數(shù)據(jù)挖掘。對的,小云之前未分享這類思路,因為在過去的想法里,影響菌群的因素較多,所以不同項目的患者放到一起分析,是否會引入更多誤差,分析結(jié)果是否有保證等考慮,都是影響這一思路的重要因素。
? ? 今天,這個顧忌可以打消了。我給大家分享一篇8+的文章,作者集合6個不同研究項目,匯總了825例胃活檢樣本,來進行整合分析,證明了這個思路的可行性。(如果沒有分析思路或者文獻復(fù)現(xiàn)有困難,可以找小云,超多創(chuàng)新性高的分析思路和分析服務(wù)供你選擇!)

? ? 而且,我已經(jīng)替大家打探好了,雖然近3個月中的菌群16s測序的文章已經(jīng)達到了近700篇,但是尚未有任何菌群16s挖掘的文章發(fā)表,這個方向仍是一片藍海,大家可以迅速來復(fù)現(xiàn)(搜索顯示出的5篇,經(jīng)確認均不是數(shù)據(jù)挖掘文章)。

l?題目:粘膜微生物群的分析揭示了胃癌發(fā)生過程中的微生物特征
l?雜志:Oncogene
l?影響因子:IF=8.756
l?發(fā)表時間:2022年7月
數(shù)據(jù)信息
數(shù)據(jù)集/隊列? ? ? ? ? ? ???數(shù)據(jù)庫? ? ? ? ? ? ? ??數(shù)據(jù)類型? ? ? ? ? ? ? ? ? ??樣本信息?
Sung_2019? ? ? ? ?作者贈送? ? ? ? ? ? ? 測序數(shù)據(jù)? ? ? ? ? ? ? 311例胃粘膜樣本
Coker_2018? ? ?作者贈送? ? ? ? ? ?測序數(shù)據(jù)? ? ? ? ? ? ? ? ? ?404例胃粘膜樣本
PRJNA413125? ? ? ? ? ??GEO? ? ? ? ? ? ? ? 測序數(shù)據(jù)? ? ? ? ? ? ? ?135例胃粘膜樣本
PRJNA310127? ? ? ??GEO? ? ? ? ? ? ? ?測序數(shù)據(jù)? ? ? ? ? ? ? ? ? 134例胃粘膜樣本
PRJNA239281? ? ? ? ? ? ??GEO? ? ? ? ? ? ? ? ? ?測序數(shù)據(jù)? ? ? ? ? ? ? ? 31例胃粘膜樣本
PRJEB21497? ? ? ? ? ? ?GEO? ? ? ? ? ? ? 測序數(shù)據(jù)? ? ? ? ? ? ? ? ? ? ?12例胃粘膜樣本
研究思路
? ? 基于GEO公共數(shù)據(jù)集和作者贈送,共獲取了6個數(shù)據(jù)集825例胃活檢樣本的16s測序數(shù)據(jù)。作者對患者進行了分組,分為SG淺表性胃炎組、AG萎縮性胃炎組、IM腸化生組和GC胃癌組,共計4個組。比較了4組患者之間的菌群變化,篩選出多種菌群在各組間存在顯著差異,并構(gòu)建了診斷模型。特別是淺表性胃炎組和胃癌組之間,幽門螺桿菌存在顯著變化。
分析結(jié)果
1. 胃癌不同階段的患者,其腸道菌群組成存在顯著差異
作者將825例患者進行了分組,分為SG淺表性胃炎組、AG萎縮性胃炎組、IM腸化生組和GC胃癌組4個組。16s分析發(fā)現(xiàn),腸道菌群在以上四組中存在差異,門水平展示(圖1A)以及屬水平展示(圖1B)。α多樣性比較發(fā)現(xiàn),以上4組患者的菌群香農(nóng)指數(shù)依次降低,且均存在顯著差異(圖1C)。β多樣性分析發(fā)現(xiàn),胃癌組的菌群與其他3組存在顯著差異(圖1D)。


圖1胃癌不同階段的患者腸道菌群的組成差異
2. GC(胃癌)組和SG(淺表性胃炎)組之間的菌群差異分析和診斷模型構(gòu)建
作者重點比較了GC(胃癌)組和SG(淺表性胃炎)組的菌群,共發(fā)現(xiàn)52個門的菌存在變化。其中,35個門菌在GC組升高,而17個門菌在SG組更多(圖2A)。進一步從52個門菌中篩選出來8個門菌進行診斷模型構(gòu)建。在訓(xùn)練集和驗證集中的AUC面積分別達到了0.9109(圖2B)和0.8533(圖2C),表明模型的質(zhì)量較高。


圖2胃癌診斷模型的構(gòu)建
3. 參與胃癌調(diào)節(jié)菌群的相互作用關(guān)系分析
為探討疾病相關(guān)細菌在胃癌進展過程中的相互作用,作者使用SparCC算法估計了它們的相關(guān)性。與胃癌正相關(guān)細菌隨著疾病進展而逐漸增強,特別是梭桿菌與Prevotella、鏈球菌和鏈球菌(圖3)。隨著胃癌的發(fā)展,抑制胃癌的細菌逐漸減少,包括雙歧桿菌、芽孢桿菌和瘤胃球菌(圖3)。

圖3胃癌發(fā)展過程中菌群相關(guān)性分析
4. 幽門螺桿菌對腸道菌群的影響
比較幽門螺桿菌陽性患者和陰性患者的胃黏膜菌群,作者發(fā)現(xiàn)幽門螺桿菌陰性患者的菌群α多樣性明顯升高(圖4A);β多樣性分析也發(fā)現(xiàn),幽門螺桿菌陽性患者和陰性患者的胃黏膜菌群存在顯著的差異性(圖4B);與幽門螺桿菌陽性組相比,幽門螺桿菌陰性組中觀察到更多的細菌之間的強排斥和共發(fā)生等相互作用(|r|>0.5,調(diào)整后的p值<0.05)(圖4D)。


文章小結(jié)
作者利用公共數(shù)據(jù),當然也可能動用了些資源,最終獲得了近千例患者的測序數(shù)據(jù),這樣就具有了根據(jù)臨床表型分類的前提,否則,如果一共也只有幾十例患者,再細分表型,那么數(shù)據(jù)可行度就顯著降低了。
通過這篇文章,我們可以看到腸道菌群在進行數(shù)據(jù)挖掘方面也是可行的,包括疾病不同分型之間的菌群比較、腫瘤疾病的預(yù)后模型構(gòu)建,以及疾病的診斷模型等均可以實現(xiàn)。
小云悄悄話
因為腸道菌群的變化敏感性和特殊性,所以將不同研究項目里的多個數(shù)據(jù)集進行整合,會有一些顧忌。
那么如何提高整合分析的成功率了?計劃合并的各個研究項目,采取了較為一致的納入排除標準,并且有完整的患者臨床信息,這樣為分析和后面的患者分型提供了可能性。
綜合來講,腸道菌群數(shù)據(jù)挖掘是個好思路,并且隨著腸道菌群測序數(shù)據(jù)越來越多,測序類型越來越豐富,數(shù)據(jù)挖掘自然限制越來越少,這是個良性循環(huán),所以腸道菌群數(shù)據(jù)挖掘是一片藍海,廣闊天地大有作為??!有想法的朋友盡快上車,一個方向一旦火爆起來,發(fā)文競爭力可就大多了,時不我待呀!
如果你還苦惱于生信沒有思路,或者嫌分析方法太過簡單、太過老套,想要創(chuàng)新思路的,或者對新的熱點方向感興趣的小伙伴快來聯(lián)系小云吧。
小云可以提供如下服務(wù):免費評估服務(wù)、付費設(shè)計服務(wù)、定制化生信分析等。超多個性化、創(chuàng)新性高的分析思路供你選擇!
