最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

謝天謝地!終于找到生信發(fā)文的套路捷徑了!3+,博士畢業(yè)夠了?。ǜ皆敿?xì)操作教程)

2021-05-19 14:36 作者:酸談講科研  | 我要投稿

不用下載高通量數(shù)據(jù)、不學(xué)R,鼠標(biāo)“點點點“就能復(fù)現(xiàn)3分文章,輕松實現(xiàn)GEO多數(shù)據(jù)集合并分析,還有Cytoscape和CMAP數(shù)據(jù)庫操作教程,椅子已經(jīng)按不住了!

今天為大家?guī)硪黄?2019年12月發(fā)表于Adipocyte(IF:3.146)的純生信文章《Identification of biomarkers, pathways and potential therapeutic agents for white adipocyte insulin resistance using bioinformatics Analysis》,文章工作量不大,復(fù)現(xiàn)難度適中,5分鐘領(lǐng)悟文章思路,半小時完整復(fù)現(xiàn),仔細(xì)看,文末有干貨呦~


?題目?

Identification of biomarkers, pathways and potential therapeutic agents for white adipocyte insulin resistance using bioinformatics Analysis

1.材料與方法

1)疾病:網(wǎng)膜白色脂肪組織胰島素抵抗、糖尿病及相關(guān)疾病

2)物種:人類

3)數(shù)據(jù)來源:GSE15773、GSE20950

4)測序類型:mRNA sequence

5)測序平臺: GPL570 (Affymetrix Human Genome U133 Plus 2.0 Array)

6)分組及樣本數(shù):GSE20950:10 IRO vs 10 ISO;GSE15773:5 IRO vs 5 ISO

2.圖標(biāo)結(jié)果及復(fù)現(xiàn)


1.使用工具

1)仙桃學(xué)術(shù)生信工具(https://www.xiantao.love/products

2)the Attie Lab Diabetes database (http://diabetes.wisc.edu)

3)The Connectivity Map (CMap) (https://portals.broadinstitute.org/cmap)


2.復(fù)現(xiàn)任務(wù)

Table1??IRO v.s ISO DEGs列表


Fig1 ?DEGs熱圖

Fig2??DEGs火山圖.

Fig3??GSEA富集分析IRO患者基因

Fig4?GO富集分析.DEGs

Fig5??KEGG富集分析DEGs

Fig6??顯著改變的DEGs的PPI網(wǎng)絡(luò)

Table2??Cytohubba.鑒定得到10個hub genes

Fig7??10周齡肥胖型糖尿病小鼠脂肪組織中hub基因表達(dá)顯著增加.

Table3??CMap預(yù)測可逆轉(zhuǎn)DEGs表達(dá)變化的top20小分子化合物


3.復(fù)現(xiàn)步驟

1.Table1 IRO v.s ISO DEGs列表
1)打開仙桃學(xué)術(shù)—生信工具(https://www.xiantao.love/),進(jìn)入“數(shù)據(jù)集檢索”模式,分別檢索GSE15773(選擇GSM395783-GSM395792共10例樣本添加至樣本庫)、GSE20950(選擇GSM523656-GSM523675共20例樣本添加至樣本庫)數(shù)據(jù)集


2)左側(cè)功能欄中進(jìn)入“我的樣本庫”,根據(jù)“Title“分組信息選擇15例Insulin resistant obese(IRO)為分組1,15例Insulin sensitive obese(ISO)為分組2,提交進(jìn)行差異分析


3)分析完成后下載結(jié)果報告

差異分析結(jié)果表格如圖,在Excel中按原文標(biāo)準(zhǔn):|logFC|?>1, adj p?<0.05進(jìn)行篩選,保留:“Gene symbol, logFC, P.Value, Adj.P.Val, Discription”5列信息,將表格整理如下,最終得到107個差異基因(原文中得到86個差異基因)

將Excel表格復(fù)制到word中,整理為三線表格式,這樣就得到同款Table1啦~


2.Fig1 DEGs熱圖
1)進(jìn)入結(jié)果報告的網(wǎng)頁版,進(jìn)行“熱圖—細(xì)節(jié)修改”

2)聚類方式中選擇“行聚類”,將根據(jù)我們在樣本庫中設(shè)置的分組信息聚類顯示,確認(rèn)出圖后記得保存結(jié)果~


3.Fig2 DEGs火山圖
1)依然在結(jié)果報告的網(wǎng)頁版中選擇“火山圖—細(xì)節(jié)修改”

2)原文中為橫置火山圖,這里勾選“XY軸顛倒”即可實現(xiàn),配色方案中修改第1、2個色塊,使高表達(dá)基因為為紅色,低表達(dá)基因為藍(lán)色;確認(rèn)出圖后保存結(jié)果


4.Fig3 GSEA富集分析IRO患者所有基因
1)進(jìn)入“數(shù)據(jù)集檢索”,因為只需要對IRO組基因進(jìn)行GSEA富集分析,我們可以在樣本庫中重新選擇分組,將15例IRO樣本中根據(jù)GSE不同分別添加至分組1、分組2,分析2項研究中IRO患者內(nèi)部的差異基因表達(dá)

2)完成后下載結(jié)果報告,打開“差異分析-自選樣本”,進(jìn)入“仙桃學(xué)術(shù)—生信分析工具”,進(jìn)行“GSEA分析”,查看教程文檔,將剛才結(jié)果報告中的表格按要求整理

3)提交進(jìn)行GSEA分析,下載結(jié)果Excel表格,篩選p.adj < 0.05 & q value < 0.25,依次降序、升序排列NES,得到正、負(fù)相關(guān)top3基因集

4)進(jìn)入“GSEA可視化”,原文分別展示了與IRO負(fù)、正相關(guān)性最高的top3基因集,我們這里也可以依次作圖;仙桃學(xué)術(shù)支持一次顯示5條富集通路的噢~

5)進(jìn)入仙桃學(xué)術(shù)—拼圖工具完成拼圖,下載TIFF或PDF文件即可~

5.Fig4 GO富集分析DEGs

1)接下來進(jìn)入“GO/KEGG富集分析”,查看教程文檔

2)打開最開始的IRO v.s ISO差異分析結(jié)果表格,按要求整理數(shù)據(jù)格式

在excel中進(jìn)行篩選根據(jù)原文中的“gene count > 2 & p < 0.05”,得到9564個結(jié)果,最后只保留id列,上傳數(shù)據(jù)進(jìn)行分析

3)可視化作圖中選擇“氣泡圖”,點的大小可以自由調(diào)節(jié),最近新添加了“分面”選項,可以將GO條目中的BP、CC、MF區(qū)分顯示,確認(rèn)出圖后記得保存結(jié)果噢~

4)在“歷史記錄”中即可查找到我們保存的結(jié)果,可直接下載圖片

6.Fig5 KEGG富集分析DEGs
1)KEGG分析操作同GO富集分析,只需要在數(shù)據(jù)分析時左側(cè)的“條目“中選擇“KEGG”即可

2)KEGG可視化作圖同GO分析,一定要記得保存結(jié)果噢~

7.Fig6 顯著上調(diào)DEGs的PPI網(wǎng)絡(luò)

1)接下來依然是DEGs分析,打開最開始的IRO v.s ISO差異分析結(jié)果表格,3.5中的篩選條件得到了9564個基因,數(shù)目較多;此處我們將篩選條件調(diào)整為“gene count > 2 & adj.P < 0.01”,得到3389個結(jié)果,降序排列l(wèi)ogFC,選擇top 100基因;進(jìn)入STRING官網(wǎng)(https://stringdb.org/cgi/network?taskId=bi95eWIlhuXf&sessionId=bJnie7b5bEon

2)“Settings”中的 minimum required interaction score 默認(rèn)為0.4,與原文一致;查看Analysis,顯示得到59 nodes,103 edges,與原文中的47 nodes,102 edges十分接近

3)在Export中選擇圖片保存格式,順便直接將PPI網(wǎng)絡(luò)導(dǎo)入Cytoscape進(jìn)行后續(xù)分析,得到PPI互作網(wǎng)絡(luò)“三維彈球圖”,所有的節(jié)點都可以自由拖動,大家也可像原文中合理安排一下布局~

4)Fig6b中使用Cytoscape的MCODE插件識別了顯著表達(dá)模塊,進(jìn)入Cytoscape,在MCODE插件中選擇識別全部網(wǎng)絡(luò),新建網(wǎng)絡(luò)cluster,導(dǎo)出圖片即可;生信全書上篇中有老談老師對蛋白互作網(wǎng)絡(luò)的炒詳細(xì)介紹~


8.Table2 Cytohubba.鑒定得到10個hub genes
1)Cytoscape中的插件MCODE和Cytohubba都可以識別hub基因,其中Cytohubba中提供了10余種算法,算法之間沒有明顯的優(yōu)劣之分,選擇其中任一種均可,原文沒有詳細(xì)交代所使用的算法;當(dāng)然我們也可以將多種算法識別的hub基因取交集進(jìn)行下游分析。進(jìn)入Cytohubba模塊,使用默認(rèn)算法計算top10 hub基因

2)將識別的hub基因在word中整理為三線表格式就可以啦;當(dāng)然Cytohubba中的圖也可以導(dǎo)出為圖片放在文章中~


9.Fig7 10周肥胖型糖尿病小鼠脂肪中基因的表達(dá)明顯上調(diào)
1)接下來作者使用the Attie Lab Diabetes database 數(shù)據(jù)庫(收錄了可檢索的基因表達(dá)資源,顯示6種組織(胰島、脂肪組織、肝臟、比目魚肌、腓腸肌、下丘腦)中不同實驗組(4周/10周齡小鼠)基因表達(dá)譜,http://diabetes.wisc.edu)可視化了肥胖BTBR小鼠脂肪組織中hub基因的表達(dá)水平。進(jìn)入the Attie Lab Diabetes database數(shù)據(jù)庫,最上方導(dǎo)航欄選擇“Genomic Study of Parental Mice”

2)依次輸入CCL2、IL6、CCL4 3個hub基因查看數(shù)據(jù)庫中收錄的6種組織中目的基因表達(dá)水平。網(wǎng)站對y軸的3種單位做了介紹,Intensity2為探針原始強度,需謹(jǐn)慎用于比較;mlratio官方推薦用于同一細(xì)胞系內(nèi)年齡/肥胖比較,reratio推薦用于不同細(xì)胞系間比較;原文中比較了BTBR小鼠lean/ob,因此這里我們選擇第3幅—reratio組

3)將CCL2、IL6、CCL4三幅圖拼接,仙桃學(xué)術(shù)/PPT/AI均可完成~

10.Table3 CMap鑒定20種最重要的小分子化合物可逆轉(zhuǎn)DEGs在細(xì)胞系中的表達(dá)變化

1)最后作者使用CMAP數(shù)據(jù)庫(Connectivity map,由Todd Golub、Eric Lander等哈佛、劍橋、MIT等研究人員利用不同濃度小分子處理不同細(xì)胞株后得到基因表達(dá)譜,構(gòu)建的小分子藥物、基因表達(dá)與疾病關(guān)聯(lián)的生物應(yīng)用數(shù)據(jù)庫;將小分子與基因表達(dá)情況聯(lián)系起來。舊版網(wǎng)站已經(jīng)停止更新,上、下調(diào)基因之和可達(dá)1000;新版網(wǎng)站持續(xù)更新,上、下調(diào)基因分別不能超過150個)根據(jù)IRO/ISO組基因表達(dá)模式預(yù)測了可能有效干預(yù)IRO的20種小分子化合物;且數(shù)據(jù)庫上傳文件中基因名稱必須是HG-U133A芯片中基因?qū)?yīng)的探針I(yè)D。我們使用仙桃學(xué)術(shù)中的差異基因分析結(jié)果,根據(jù)adj.P、gene count及l(fā)ogFC分別篩選上調(diào)、下調(diào)top150基因,將gene symbol在NetAffx官方網(wǎng)站(https://www.affymetrix.com/Analysis/compare/index.affx)中進(jìn)行批量轉(zhuǎn)換

2)將轉(zhuǎn)換后的探針整理到Excel中,另存為txt格式,再將文件后綴命名為GPL196的.grp文件(GPL96探針格式),進(jìn)入CMAP官網(wǎng)(https://portals.broadinstitute.org/cmap/,舊版網(wǎng)站使用任意郵箱注冊即可使用,雖然網(wǎng)站仍可使用但目前已停止更新;新版網(wǎng)站https://clue.io/需教育郵箱注冊后方可使用,在舊版的基礎(chǔ)上增加了很多其他功能;其中query功能中上、下調(diào)基因數(shù)量限制在150),導(dǎo)航欄處選擇“query“,分別上傳上調(diào)、下調(diào)tag list進(jìn)行分析,命名分析結(jié)果

3)分析完成后導(dǎo)出excel表格,根據(jù)Enrichment降序排列,最后將表格在word中整理為三線表就可以得到原文中的同款表格啦~

現(xiàn)在文章中所有的圖表都復(fù)現(xiàn)完畢啦~ 最后我們來簡單總結(jié)一下這篇純生信文章的思路

4.文章思路總結(jié)

胰島素抵抗/胰島素敏感患者差異表達(dá)基因分析(Table1、Fig1、Fig2)

1)GSEA基因集富集分析正、負(fù)相關(guān)top3 GO通路圖(Fig3)

2)GO/KEGG基因集富集分析DEGs氣泡圖(Fig4、5)

聯(lián)

1)IRO組中顯著改變DEGs的PPI網(wǎng)絡(luò)圖(Fig6)

2)Cytohubba識別top10 hub基因(Table2)

3)10周齡肥胖型糖尿病小鼠脂肪組織中部分hub基因表達(dá)顯著增加(Fig7)

CMAP數(shù)據(jù)庫預(yù)測可能逆轉(zhuǎn)DEGs表達(dá)的top20小分子化合物(Table3)


四字箴言萬能框架,半小時在線網(wǎng)站復(fù)現(xiàn)結(jié)果,距離你學(xué)會這篇3分文章就差上手一試?yán)瞺


值得說明的是,重復(fù)文章并不是我們的目的,掌握生信文章核心思想,R語言或在線網(wǎng)站都是我們實現(xiàn)目標(biāo)的工具/手段,這么好的工具已經(jīng)非常降低生信分析門檻,趁著仙桃學(xué)術(shù)這波技術(shù)紅利快來實現(xiàn)文章自由吧~



謝天謝地!終于找到生信發(fā)文的套路捷徑了!3+,博士畢業(yè)夠了?。ǜ皆敿?xì)操作教程)的評論 (共 條)

分享到微博請遵守國家法律
沾化县| 共和县| 安阳县| 远安县| 普格县| 江川县| 洛川县| 张家口市| 平阳县| 平塘县| 那曲县| 泸西县| 天全县| 荔浦县| 黄石市| 明光市| 宣恩县| 平阳县| 牟定县| 广州市| 庐江县| 永修县| 柘城县| 长宁区| 海林市| 丽水市| 垦利县| 郸城县| 精河县| 威海市| 秀山| 东安县| 二连浩特市| 华亭县| 万年县| 岳西县| 饶阳县| 乌兰浩特市| 赤壁市| 金秀| 霍邱县|