最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

文章復現(xiàn)丨驚!2021年5分生信文章,只用20分鐘復現(xiàn)!怎么做的?答案藏在這里!

2021-05-10 13:56 作者:酸談講科研  | 我要投稿

通過點、點、點出圖的方式,利用仙桃工具復現(xiàn)最新發(fā)表的生信分析套路。今天為大家?guī)硪黄?021年2月份發(fā)表于Aging-UC(IF=4.8)的單基因純生信文章。


通過對全篇文章內(nèi)容的解構(gòu),Jerry將帶領(lǐng)大家逐個步驟的復現(xiàn)全文7張生信圖片,其中涵蓋2張補充圖片。
迫不急待了吧,現(xiàn)在開始吧!

材料與方法部分

數(shù)據(jù)資料來源

本篇文章的一部分數(shù)據(jù)來源于TCGA數(shù)據(jù)庫,作者獲取了437位肺腺癌患者和54位正常肺組織的表達矩陣(未說明數(shù)據(jù)格式)和臨床數(shù)據(jù);
另一部分數(shù)據(jù)則來源于GEO數(shù)據(jù)庫,納入了8個GSE數(shù)據(jù)集,其中GSE72094數(shù)據(jù)集因涵蓋臨床預后信息而作為本篇文章的驗證數(shù)據(jù)集。
注:不同版本的TCGA數(shù)據(jù),有可能獲取的患者的樣本例數(shù)不一致,因為TCGA數(shù)據(jù)庫一直處于更新過程中。所以看到生信文章中TCGA里同一個癌種的患者樣本數(shù)不一致,大家也不要奇怪,有可能就是版本不同導致的。
大家做生信分析的時候,盡量選擇TCGA數(shù)據(jù)庫中的最新版本的數(shù)據(jù)進行下載。

圖表結(jié)果及復現(xiàn)

仙桃學術(shù)工具

Human Protein Atlas database?

LinkedOmics數(shù)據(jù)庫

TIMER數(shù)據(jù)庫

GEO數(shù)據(jù)庫

TISIDB database


復現(xiàn)任務

Figure1 CLEC10A在肺腺癌與正常組織間的差異表達情況;

Figure2 CLEC10A的表達與肺腺癌患者臨床指標的相關(guān)性;

Figure3 CLEC10A在肺腺癌組織中的共表達基因(LinkedOmics數(shù)據(jù)庫)

Figure4根據(jù)Timer和Estimate算法推斷出CLEC10A的表達與肺腺癌組織內(nèi)免疫細胞浸潤的相關(guān)性;

Figure5 根據(jù)TISIDB數(shù)據(jù),推斷出CLEC10A的表達水平與肺腺癌腫瘤標本內(nèi)淋巴細胞浸潤、免疫調(diào)控因子和炎性趨化因子的相關(guān)性;

S.1 根據(jù)HPA數(shù)據(jù)庫,證明CLEC10A在肺腺癌組織與正常組織間的表達差異;

S.2 根據(jù)Timer數(shù)據(jù)庫,展示CLEC10A與多種腫瘤組織內(nèi)免疫細胞浸潤的相關(guān)性;



復現(xiàn)步驟
Fig.1 CLEC10A在肺腺癌與正常組織間的差異表達情況

仙桃學術(shù)復現(xiàn)進入仙桃學術(shù)生信工具主頁,選擇高級版,點擊“立即使用”(注:免費版和基礎(chǔ)版都可以進行統(tǒng)計和可視化,由于高級版功能最全,這里選擇高級版作為范例)。▼


選擇“分析工具”后,在左側(cè)選擇“表達差異”下的“非配對樣本”。

在數(shù)據(jù)中選擇腫瘤類型“TCGA-LUAD”,在參數(shù)中輸入分子“CLEC10A”,并根據(jù)需要調(diào)整圖形樣式,點擊“確認”,即可得到TCGA進行單基因差異分析的圖片(圖A中的非配對比較的TCGA結(jié)果和圖D結(jié)果)。▼
非配對TCGA的差異分析,并點擊“保存結(jié)果”按鍵,稍后可進行拼圖


配對的TCGA差異分析,并點擊“保存結(jié)果”按鍵

利用仙桃工具,展示CLEC10A在GEO數(shù)據(jù)集中的腫瘤與非腫瘤標本之間的差異表達
以下利用GSE75037數(shù)據(jù)集進行單基因差異分析的展示,首先點擊數(shù)據(jù)庫檢索,鍵入GSE數(shù)據(jù)集名稱,搜索到目的數(shù)據(jù)集,點擊數(shù)據(jù)平臺“GPL”信息,下載探針和基因名,再點擊“數(shù)據(jù)下載”選項,選中Series Matrix file文件,其內(nèi)包含了樣本的基因表達矩陣和樣本的分類。


根據(jù)GPL數(shù)據(jù)集的基因名確認相對應的探針名,單個基因有可能對應多個探針,則均需記錄下來;

返回至GSE數(shù)據(jù)集,根據(jù)探針名檢索出所有樣本相對應的基因表達值;


對三個探針的表達值取相應的平均值,然后根據(jù)基礎(chǔ)繪圖的“配對圖”選項下載示例數(shù)據(jù),輔助整理正確格式的上傳文件。

格式如下


根據(jù)癌旁組織與癌組織的類別,將CLEC10A的表達譜數(shù)據(jù)整理如下圖所示:

上傳至“配對圖”選項下,即可得到如下結(jié)果


按照上述類似的操作,匯總7個GEO數(shù)據(jù)集和TCGA數(shù)據(jù)庫的數(shù)據(jù),利用拼圖工具,簡要匯總?cè)缦拢?br>


Fig.2 CLEC10A的表達與肺腺癌患者臨床指標的相關(guān)性

在數(shù)據(jù)中選擇腫瘤類型“TCGA-LUAD”,在參數(shù)中輸入分子“CLEC10A”,選擇臨床腫瘤T分級,統(tǒng)計方法選擇“One-Way ANOVA”,Y軸坐標標題注釋,并根據(jù)需要調(diào)整圖形樣式,點擊“確認”,但目前還不能將Anova的分析結(jié)果標記于圖片上。(Fig. 2A)


上接步驟2截圖的統(tǒng)計分析結(jié)果,如下圖所示,其中“保存結(jié)果”按鈕可以稍后進行圖片組圖,“方差齊性檢驗”為統(tǒng)計方法的選擇提供依據(jù),One-Way Annova的p值也展示在下述統(tǒng)計表格內(nèi)。

其余步驟同步驟2,依次選擇臨床-N.stage、M.stage和UICC-stage,此處不再重復,并根據(jù)需要調(diào)整圖形樣式,點擊“確認”即可,即可依次得到CLEC10A與臨床指標相關(guān)性的圖像。(Fig. 2B, C, D)

Fig. 2E-F的制作流程
選擇臨床意義下拉菜單的“單因素多因素COX回歸”,再選中LUAD的測序數(shù)據(jù),根據(jù)本文章的圖示,依次選中T、N、M、gender、age和單基因名稱(CLEC10A),并注意方框4中的內(nèi)容,右側(cè)的內(nèi)容為比較組,而左側(cè)內(nèi)容為對照組,之后選中OS分析即可。


點擊下載CSV表格,表格打開之后的概覽如下圖所示。

點擊基礎(chǔ)繪圖中的森林圖,并下載示例數(shù)據(jù),以為數(shù)據(jù)整理提供參考;


根據(jù)上圖表格的格式,并結(jié)合原文森林圖的圖示,將4.3步驟獲得的數(shù)據(jù)分布整理為單因素Cox回歸和多因素Cox回歸的表格。

單擊森林圖,先后上傳整理好的單因素和多因素Cox分析文件,點擊確認,即可先后得到相應的單因素和多因素分析的森林圖。


利用仙桃工具的拼圖工具,得到如下圖示:

Fig.3 CLEC10A在肺腺癌組織中的共表達基因(LinkedOmics數(shù)據(jù)庫)

在線搜索LinkedOmics數(shù)據(jù)庫,根據(jù)下圖可先注冊賬號,再進行操作,這樣獲得的結(jié)果可保存于對應的賬號中;但也可以直接點擊作為訪問者使用。


按照提示步驟,逐次選擇腫瘤類型、RNA-Seq數(shù)據(jù)類型、特定類型的樣本(可選)和基因名稱-CLEC10A。

選擇目標數(shù)據(jù)集(同樣也是肺腺癌的測序數(shù)據(jù))和統(tǒng)計方法(與文獻提供的方法相一致),點擊提交請求,獲得結(jié)果。


選中獲得的數(shù)據(jù)集結(jié)果,即可在下方看到LinkFinder數(shù)據(jù)塊,可得到圖3A、B、C。

選擇LinkInterpreter模塊,根據(jù)文章內(nèi)容選擇GSEA富集分析,分析條件選擇默認即可得到圖3中的E和F圖像。

進入GEPIA 2版本的數(shù)據(jù)(http://gepia2.cancer-pku.cn/#index),根據(jù)下述序號,點擊進入“survival map”模塊內(nèi),將圖3B、C中獲得的相關(guān)下調(diào)和下調(diào)基因輸入3方塊中,選擇肺癌的TCGA數(shù)據(jù)集,點擊繪圖,即可得到圖3D的結(jié)果。再將下調(diào)和上調(diào)的survival map圖組合在一起即可,此處只展示出部分結(jié)果。

Fig.4根據(jù)Timer和Estimate算法推斷出CLEC10A的表達與肺腺癌組織內(nèi)免疫細胞浸潤的相關(guān)性。

進入TIMER version. 1版本,在下方輸入框中鍵入基因名稱,cancer Type選中肺腺癌(TCGA的測序數(shù)據(jù)),免疫浸潤為數(shù)據(jù)庫默認的6中免疫細胞,即可一鍵得到下圖所示的圖像,點擊JPG或PDF下載,此圖即為Figure 4A。

Fig4.B圖為GSE數(shù)據(jù),需自行使用R語言的Timer算法進行計算,得到B圖,此處不再演示。
Fig.4 C-F均為ESIMATE算法估算每個樣本的免疫評分和間質(zhì)評分,再將其與患者的預后做關(guān)聯(lián),目前只能依靠R語言的ESTIMATE算法進行實現(xiàn)。
進入仙球工具的臨床意義板塊,選擇預后分析之KM曲線圖,按照下述步驟,即可得到在TCGA-LUAD數(shù)據(jù)集里CLEC10A與患者預后的相關(guān)性。即Fig4. G。


在仙球?qū)W術(shù)之數(shù)據(jù)集檢索框內(nèi)鍵入GSE72094,即可看到相應的“數(shù)據(jù)下載“”按鈕和GPL信息,分別點擊數(shù)據(jù)下載》》series matrix file文件,用以獲取CLEC10A的表達譜和生存信息;點擊GPL選項,下拉至頁面底部,點擊view full table,按Ctrl+G在頁面內(nèi)搜索CLEC10A對應的探針號,在下圖中可看到有兩個探針對應CLEC10A,記錄下來,再到series matrix file文件內(nèi)找到上述兩個探針對應的表達值,取其平均值,即為該基因的表達值。


從Series-matrix file文件中提取出CLEC10A對應探針的表達值、患者的生存狀態(tài)和生存時間數(shù)據(jù),按照status、Time、Expression的順序整理出如下表格。

上傳至仙桃工具的生存曲線圖,按照如下步驟,上傳數(shù)據(jù),即可得到Fig.4 H圖像;


Fig.5 根據(jù)TISIDB數(shù)據(jù),推斷出CLEC10A的表達水平與肺腺癌腫瘤標本內(nèi)淋巴細胞浸潤、免疫調(diào)控因子和炎性趨化因子的相關(guān)性


進入TISIDB數(shù)據(jù)庫(http://cis.hku.hk/TISIDB/index.php),在下方gene symbol處鍵入CLEC10A,點擊提交之后,即可獲得第二張頁面,選擇基因名稱。

選中Lymphocyte模塊,下拉頁面即可獲得Figure. 5A中的熱圖,


按下述順序選擇熱圖旁邊的腫瘤類型指標和免疫細胞類型,即可得到Fig. 5A的散點圖。其余散點圖也是類似操作,此處不再重復。

選中Immunomodulator模塊,可在下方2處看到免疫抑制劑、免疫激活劑和MHC分子類型,該三處指標分別對應Fig.5B,C,D的熱圖。散點圖的獲取方法與上述3步驟類似,點擊右鍵另存為即可。


選中Chemokine模塊,可在下方2處看到炎癥因子和受體,該兩處指標分別對應Fig.5E和F的熱圖。散點圖的獲取方法與上述3步驟類似,點擊右鍵另存為即可。

S.1 根據(jù)HPA數(shù)據(jù)庫,證明CLEC10A在肺腺癌組織與正常組織間的表達差異


進入HPA數(shù)據(jù)庫(https://www.proteinatlas.org/),鍵入CLEC10A基因于搜索框內(nèi)。

點擊Pathology選項進入該基因在組織內(nèi)表達情況的免疫組化圖片;


下拉頁面至蛋白表達選項中,選中肺癌即可。

下拉頁面至Location處,即可看到作者選取上述免疫組化圖片的源材料。


根據(jù)作者提供的信息,包括正常組織(2268)和癌癥組織(1847),從左至右即為原圖片S.1,但作者提供的2268(正常組織)圖片并未在數(shù)據(jù)庫內(nèi)找到,可能是由于數(shù)據(jù)庫更新,而導致的區(qū)別。

S.2 根據(jù)Timer數(shù)據(jù)庫,展示CLEC10A與多種腫瘤組織內(nèi)免疫細胞浸潤的相關(guān)性


上述圖像是CLEC10A在Timer數(shù)據(jù)庫中分別選擇所有腫瘤之后,拼接所構(gòu)成的大圖,其中免疫細胞的選擇為默認的6中免疫細胞,其具體操作方法同本文章的第4部分的第一步驟,將獲取的PDF圖片在AI軟件內(nèi)拼接即可,此處不再重復演示。


好了 小伙伴們,是不是感受到仙桃工具的強大之處了嗎?上述實踐證明出沒有R語言一樣也可以做出媲美R語言的圖片,心動不如行動,趕快動手操作起來吧!!


文章復現(xiàn)丨驚!2021年5分生信文章,只用20分鐘復現(xiàn)!怎么做的?答案藏在這里!的評論 (共 條)

分享到微博請遵守國家法律
巴中市| 抚松县| 皋兰县| 灵石县| 福清市| 桃江县| 武强县| 蓬安县| 望江县| 铜梁县| 富锦市| 县级市| 富川| 阿巴嘎旗| 大埔区| 武强县| 兴化市| 萍乡市| 邢台市| 洛阳市| 井研县| 柳州市| 华坪县| 平度市| 高唐县| 奉贤区| 恭城| 敖汉旗| 板桥市| 达日县| 桦甸市| 肇州县| 华容县| 定结县| 雷山县| 格尔木市| 友谊县| 鄂尔多斯市| 大名县| 仪陇县| 南平市|