簡(jiǎn)單又實(shí)用!鐵死亡+免疫浸潤(rùn)3+套路,零代碼,15分鐘教你復(fù)現(xiàn)!(附詳細(xì)操作教程)
今天為大家?guī)硪黄?021年1月發(fā)表在BMC Cancer(影響因子: 3.15)上的單基因純生信文章。本文揭示了在腎透明細(xì)胞癌中,鐵蛋白吞噬相關(guān)基因NCOA4的低表達(dá)與腫瘤愈后不佳以及免疫細(xì)胞浸潤(rùn)缺陷相關(guān)。

期刊簡(jiǎn)介

酸菜大大高度總結(jié)快速入門生信的方法就是,學(xué)習(xí)生信文章的“文章套路+數(shù)據(jù)復(fù)現(xiàn)”,現(xiàn)在我們就按照這個(gè)思路來解讀并復(fù)現(xiàn)這篇文章吧。
文章套路
1.要素拆解
題目:Low expression of ferritinophagy-related NCOA4 gene in relation to unfavorable outcome and defective immune cells infiltration in clear cell renal carcinoma疾病:腎透明細(xì)胞癌 (clear cell renal carcinoma,ccRCC)表型:癌癥愈后不佳 + 免疫細(xì)胞浸潤(rùn)缺陷數(shù)據(jù)來源:TCGA (KIRC) + GEO (GSE66271和GSE53757)分析策略:表達(dá)差異 + 臨床意義 + 交互網(wǎng)絡(luò)
2.數(shù)據(jù)解讀
簡(jiǎn)單的來說,本文的思路是,比較ccRCC的癌癥組織和正常組織中NCOA4的表達(dá)差異(圖1,圖2),分析NCOA4對(duì)于ccRCC的臨床意義(表1, 圖3, 圖4),并進(jìn)行NCOA4的蛋白互作信息和免疫相關(guān)分析(圖5, 圖6, 表2)。作者采用TCGA數(shù)據(jù)庫(kù)和2個(gè)GEO數(shù)據(jù)庫(kù)的數(shù)據(jù)相互佐證,使文章可信度更高。詳細(xì)解讀如下▼

數(shù)據(jù)復(fù)現(xiàn)
1.復(fù)現(xiàn)工具
(1)仙桃學(xué)術(shù)生信工具(https://www.xiantao.love)(小貼士:仙桃學(xué)術(shù)生信工具已經(jīng)實(shí)現(xiàn)TCGA和GEO數(shù)據(jù)云端化,大家不用擔(dān)心網(wǎng)絡(luò)不好數(shù)據(jù)難下載了,也不用花費(fèi)大量的時(shí)間和精力學(xué)習(xí)R語言了。在這里只要點(diǎn)擊鼠標(biāo)或者搜索關(guān)鍵詞就能快速找到想要的數(shù)據(jù),還能迅速實(shí)現(xiàn)數(shù)據(jù)整理、數(shù)據(jù)清洗、數(shù)據(jù)分析、可視化出圖,生信文章變得so easy啦!)(2)HPA數(shù)據(jù)庫(kù)(https://www.proteinatlas.org/)(3)STRING數(shù)據(jù)庫(kù)(https://string-db.org/)(4)TIMER數(shù)據(jù)庫(kù)(https://cistrome.shinyapps.io/timer/)(5)GEPIA2數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/)
2.文章復(fù)現(xiàn)
本文一共6張圖片和2個(gè)表格,讓我們逐一實(shí)現(xiàn)吧。
表1 基線資料表▼

這個(gè)表格基本每篇文章都出現(xiàn),這里我們只簡(jiǎn)單介紹。
進(jìn)入仙桃學(xué)術(shù)生信工具:https://www.xiantao.love/products【】【高級(jí)版】->【立即使用】(注:免費(fèi)版和基礎(chǔ)版都可以進(jìn)行統(tǒng)計(jì)和可視化,由于高級(jí)版功能最全,這里選擇高級(jí)版作為范例)。▼

【分析工具】-> 【基線資料表】-> 【腎透明細(xì)胞癌】-> 【NCOA4】->調(diào)整參數(shù)-> 【確認(rèn)】,即可得到基線資料表。此時(shí)即“保存結(jié)果”到云端的歷史記錄,也可用其他格式保存到電腦中。
▼(具體可參見仙桃學(xué)術(shù)丨絕了!一分鐘零代碼無痛搞定臨床統(tǒng)計(jì),這個(gè)神器簡(jiǎn)單又高級(jí)?。?/strong>

圖1 TCGA數(shù)據(jù)庫(kù)中NCOA4在癌癥組織和正常組織中的表達(dá)(箱狀圖)▼

看似五顏六色五彩繽紛的圖,復(fù)現(xiàn)起來難度并不大,讓我們一個(gè)一個(gè)復(fù)現(xiàn)每個(gè)小圖吧~
圖1a 泛癌中NCOA4在癌癥和正常組織中的表達(dá)【表達(dá)差異】-> 【非配對(duì)樣本】-> 【泛癌】 ->【NCOA4】 ->【確認(rèn)】-> 【保存結(jié)果】
▼(小貼士:建議后續(xù)需要拼圖的圖片均選擇“保存結(jié)果”,這樣可將保存的結(jié)果直接在“拼圖工具”中進(jìn)行拼圖,省去了后面上傳圖片的步驟,咱們能偷懶就盡量偷懶,把時(shí)間花在更必要的地方,對(duì)吧~)

圖1b ccRCC中NCOA4在癌癥和正常組織中的表達(dá)
與圖1a類似,僅需把疾病類型換成“腎透明細(xì)胞癌”即可。▼

圖1c ccRCC中NCOA4在不同年齡段的表達(dá)▼

【臨床意義】-> 【臨床相關(guān)性】-> 【TCGA-KIBC】-> 【Age】-> 按照年齡段分組,按“+”可添加分組 -> 輸入目的分子“NCOA4” -> 【確認(rèn)】
(注:仙桃學(xué)術(shù)采用的年齡分組標(biāo)準(zhǔn)是按照中國(guó)國(guó)家癌癥中心統(tǒng)計(jì)的患癌年齡分界,和原文4個(gè)年齡段的分組不盡相同。每篇文章采用的各分組指標(biāo)可能都不太一致,只要把標(biāo)準(zhǔn)解釋清楚即可。)▼

圖1d-j ccRCC中NCOA4在不同性別、TNM分期、病理分期、組織分級(jí)、ccRCC分類的表達(dá)和圖1c類似,只需更改選擇分析參數(shù),點(diǎn)擊“確認(rèn)”即可得到想要的圖片。
拼圖
得到圖1的所有圖片后,【拼圖工具】-> 保存在云端的“所有圖片”在左下角 ->拖拽到右邊的空白頁面-> 調(diào)整圖片的大小和位置-> 選擇“ABC標(biāo)注”▼

圖片接近輔助線的時(shí)候有磁吸功能輔助對(duì)齊,最下方可添加“參考線”來輔助圖片對(duì)齊,得到滿意的圖片后,選擇合適的格式“下載”保存,即可得到發(fā)表級(jí)別的圖片了。▼

在下載的圖片中已經(jīng)自動(dòng)標(biāo)記好了字母。▼

圖2 GEO和HPA數(shù)據(jù)庫(kù)中NCOA4在癌癥組織和正常組織中的表達(dá)(箱狀圖免疫組化圖)▼

圖2a GSE66271數(shù)據(jù)集中NCOA4在癌癥組織和正常組織中的表達(dá)(小貼士:仙桃學(xué)術(shù)上線了數(shù)據(jù)集檢索,目前可以檢索GEO的數(shù)據(jù)集,并且還能直接進(jìn)行一站式的下游分析,咱們又能偷更多的懶啦,撒花撒花~)(GEO數(shù)據(jù)集詳細(xì)使用方法參見:重磅丨GEO數(shù)據(jù)集檢索上線,解鎖一站式分析的爽感~)
仙桃學(xué)術(shù)首頁:https://www.xiantao.love/??-> 【數(shù)據(jù)集檢索】▼

輸入GEO數(shù)據(jù)集名稱“GSE66271”-> 【檢索】-> 【選擇樣本】 -> 勾選所有樣本-> 【添加到樣本庫(kù)】-> 【進(jìn)入我的樣本庫(kù)】▼

這里要對(duì)樣本進(jìn)行分組,先按“Title”對(duì)組織樣本類型進(jìn)行排序,這樣就能正常組織在一起,癌癥組織在一起;在正常組織前面打“√”,點(diǎn)擊“加入分組1”,同樣勾選癌癥組織,點(diǎn)擊“加入分組2”,把樣本庫(kù)中想要分析的樣本分成兩個(gè)組。添加好分組后,點(diǎn)擊“提交分析”;分析完成后,就能下載結(jié)果了,我們這里只需要“表達(dá)譜CSV”和“結(jié)果報(bào)告下載”。
▼(小貼士:不同用戶每天可以提交分析的次數(shù)是不同的,普通版2次/天,基礎(chǔ)版5次/天,高級(jí)版10次/天。如果需要分析的數(shù)據(jù)較多,建議升級(jí)權(quán)限,要不然只能眼巴巴的盼著明天快來~)

(小貼士:這里提供了豐富的結(jié)果內(nèi)容,包括箱式圖、PCA圖、UMAP圖、火山圖、熱圖等,看見一大波美圖蹦出來,都能用在文章中,突然覺得自己有點(diǎn)牛氣了哇~)
用Excel軟件打開“表達(dá)譜CSV”,查找目的基因“NCOA4”,復(fù)制整行。▼

新建一個(gè)Excel表格,選擇“粘貼”下的“轉(zhuǎn)置”,把這行數(shù)據(jù)粘貼到表格的第一列。▼

再回到“表達(dá)譜CSV”文件,復(fù)制第一行的整行,并粘貼轉(zhuǎn)置到新的Excel表格“GEO腫瘤正?!钡牡诙小(?/p>


刪除第二行,因?yàn)榻酉聛硪玫男畔]有這一行。▼

點(diǎn)擊“排序”下的“自定義排序”。▼

在彈出的排序警告中選擇“擴(kuò)展選定區(qū)域”。▼

選中“Gene.Symbol”按“確定”,所有數(shù)據(jù)就會(huì)按照“Gene.Symbol”的順序來排序了。▼

解壓“差異分析-自選樣本分析報(bào)告”,打開“output”中的“樣本表格.xlsx”,并用以上方法將所有數(shù)據(jù)按“GSM”來排序,這樣兩個(gè)數(shù)據(jù)中的基因符號(hào)就是一致的了。▼

將“樣本表格.xlsx”中的“group”列和“GSM”列復(fù)制粘貼到新Excel表格中,檢查一下“Gene.Symbol”列和“GSM”列是不是完全一致的。▼

如果完全一致,就可以把“Gene.Symbol”和“GSM”兩列刪除了,只留下“NCOA4”和“group”兩列,并按照“group”將所有數(shù)據(jù)排序。▼

將分組2的NCOA4的數(shù)據(jù)剪切下來。▼

粘貼到第二列,刪除其他多余數(shù)據(jù),并重命名列名為“Normal”和“Tumor”。▼

保存文件-> 打開仙桃學(xué)術(shù)的生信工具-> 【基礎(chǔ)繪圖】-> 【分組比較】-> 上傳剛剛保存的文件-> 調(diào)整圖片參數(shù)-> 【確定】-> 【保存結(jié)果】
▼(小貼士:以上Excel的操作看似復(fù)雜,其實(shí)熟練以后一分鐘就能搞定,遠(yuǎn)比從GEO數(shù)據(jù)庫(kù)下載數(shù)據(jù)再進(jìn)行基因分析效率高得多呢,大膽的來試試吧~)

用同樣的方法畫出“GSE53757”的圖2b,【保存結(jié)果】。
圖2c The Human Protein Atlas數(shù)據(jù)庫(kù)中NCOA4在癌癥組織的表達(dá)量低于正常組織
進(jìn)入HPA數(shù)據(jù)庫(kù):https://www.proteinatlas.org/
輸入目的基因NCOA4 -> 【Search】▼

選擇“Tissue”,即正常組織標(biāo)本。▼

選擇“KIDNEY”▼

找到和文章中類似的圖片,點(diǎn)擊。▼

打開圖片看大圖,覺得合適,點(diǎn)鼠標(biāo)右鍵“另存圖片為”保存圖片。▼

用同樣的方法, 【PATHOLOGY】-> 【CANCER】-> 【RENAL CANCER】 ▼

找一個(gè)和文章類似的圖片打開。▼

同樣保存圖片。▼

回到仙桃生信工具,【基礎(chǔ)繪圖】-> 【上傳圖片】-> 【確認(rèn)】-> 【保存結(jié)果】,將2個(gè)HPA數(shù)據(jù)庫(kù)中下載的圖片都上傳。▼

【拼圖工具】-> 拖拽圖片拼圖-> 【下載結(jié)果】 ?▼

圖3 NCOA4高低表達(dá)組的KM生存分析▼

【臨床意義】-> 【KM曲線圖】-> 【腎透明細(xì)胞癌】-> 鍵入“NCOA4”->【確認(rèn)】 ▼
(詳見仙桃學(xué)術(shù) |一分鐘無代碼搞定KM生存曲線分析)

同樣的方法畫出圖3b,拼好圖就好了。
圖4 單因素和多因素分析的森林圖▼

首先進(jìn)行單因素和多因素Cox回歸分析【臨床意義】-> 【單因素|多因素Cox回歸分析】-> 【腎透明細(xì)胞癌】-> 調(diào)整參數(shù)-> 【OS】-> 【確認(rèn)】 ▼

下載Excel格式的表格,這里單因素和多因素結(jié)果是在一起的,我們需要分別保存。▼

選取結(jié)果前4列,另存為“單因素分析.xlsx”。▼

選取結(jié)果的第1,2,5,6列,另存為“多因素分析.xlsx”。▼

回到仙桃學(xué)術(shù)
【基礎(chǔ)繪圖】-> 【森林圖】-> 上傳數(shù)據(jù)-> 調(diào)整參數(shù)-> 【確認(rèn)】▼

把4個(gè)圖片拼接起來就是圖4了。
圖5 NCOA4的PPI蛋白互作網(wǎng)絡(luò)▼

進(jìn)入STRING數(shù)據(jù)庫(kù):https://string-db.org/
輸入目的基因“NCOA4”-> 【SEARCH】 ▼

可保存圖片,也可保存Excel數(shù)據(jù),兩者結(jié)合即完成圖5。▼

圖5 NCOA4相關(guān)免疫細(xì)胞浸潤(rùn)圖▼

進(jìn)入TIMER數(shù)據(jù)庫(kù):https://cistrome.shinyapps.io/timer/點(diǎn)擊【Gene】 ▼

輸入“NCOA4”-> 選擇“KIRC”-> 【SUBMIT】-> 下載圖片▼

表2 NCOA4與免疫細(xì)胞標(biāo)志物的相關(guān)分析▼

仍然在TIMER中選擇“KIRC”-> 填入“NCOA4”和需要進(jìn)行相關(guān)分析的分子-> 選擇【None】或【Tumor Purity】-> 【確定】-> 獲得圖片-> 將圖中的“cor”值和“P”值填入表格。▼

進(jìn)入GEPIA2數(shù)據(jù)庫(kù):http://gepia.cancer-pku.cn/【Correlation】-> 填入“NCOA4”和需要進(jìn)行相關(guān)分析的分子->選擇“TCGA Tumor”下的“KIRC Tumor”或“TCGA Normal”下的“KIRC Normal”-> 【Plot】 -> 獲得圖片-> 將圖中的“P”值和“R”值填入表格。▼

全文總結(jié)
本文完成了“挑”、“聯(lián)”、“靠”,采用多數(shù)據(jù)集相互驗(yàn)證,使用多數(shù)據(jù)庫(kù)分析,內(nèi)容較詳實(shí),論據(jù)較充分。如果能將分子機(jī)制或者免疫分析做得更深入,分子機(jī)制間的因果關(guān)系會(huì)更清晰通透。▼

簡(jiǎn)單又實(shí)用!鐵死亡+免疫浸潤(rùn)3+套路,零代碼,15分鐘教你復(fù)現(xiàn)?。ǜ皆敿?xì)操作教程)的評(píng)論 (共 條)
