單基因泛癌免疫分析,手把手教你復(fù)現(xiàn)(附詳細(xì)操作步驟)
大家好,我是濤濤。第一篇用工具復(fù)現(xiàn)的生信文章,我們就來(lái)無(wú)代碼復(fù)現(xiàn)一篇2020年1月發(fā)表在Frontiers in oncology的一篇4.8分的文章。

瞧,迎面向我們走來(lái)的是“單基因泛癌免疫分析”的文章!
(藏鏡人:這是在開運(yùn)動(dòng)會(huì)嗎?這是什么方陣,怎么我從來(lái)沒有見過(guò),不明覺厲?。。?/span>(濤濤醬:哈哈,沒錯(cuò)!如果把我們生信比作是一場(chǎng)運(yùn)動(dòng)會(huì)開幕式的話,那么首屈一指的必定是引領(lǐng)時(shí)代潮流的“單基因泛癌分析”了?。?br>
單基因泛癌分析,顧名思義,就是一個(gè)基因在多種腫瘤中的分析。
大家應(yīng)該都有看過(guò)古裝劇吧?拿到“免死金牌”的那個(gè)勇士,可以獨(dú)闖一切皇宮內(nèi)的門禁?!皢位蚍喊┓治觥币彩且粯拥览怼V灰阏业搅诉@個(gè)特別的基因,也即拿到了這塊“免死金牌”,你就能自如穿梭于各個(gè)腫瘤,在里面恣意馳騁,生出一篇又一篇的高分生信文章!
(藏鏡人:這!么!好!啥也別說(shuō)了,快來(lái)教教如何單基因泛癌分析?。?/span>(濤濤醬:擒賊先擒王,要想做出一篇“單基因泛癌分析”的文章,里面林林種種的生信手段你總得先學(xué)會(huì)吧?)(藏鏡人:蛤?那不就又得花上一年半載的嗎……)(濤濤醬:嘿嘿,這時(shí)候就得隆重推出我們的仙桃生信工具了!不用代碼,不用R語(yǔ)言,只要鼠標(biāo)!只要鼠標(biāo)!泛癌分析帶回家?。?br>
閑話少敘,我們一起來(lái)看一下我們今天的文章題目:Prognostic and Immunological Role of FUN14 Domain Containing 1 in Pan-Cancer: Friend or Foe?
FUN14 Domain Containing 1,簡(jiǎn)稱為FUNDC1。這個(gè)基因在線粒體自噬里面起到了重要作用。作者在這篇文章中,通過(guò)探討FUNDC1在泛癌的預(yù)后以及免疫浸潤(rùn)情況從而論證了FUNDC1基因在腫瘤中的作用。
在“材料和方法”部分,作者開宗明義地闡明了本文實(shí)現(xiàn)的生信手段。



復(fù)現(xiàn)任務(wù)
▲?圖1. FUNDC1在泛癌中的表達(dá)模式
▲?圖2. Kaplan-Meier生存曲線比較了PrognoScan中不同癌癥類型中FUNDC1的高表達(dá)和低表達(dá)
▲?圖3. Kaplan-Meier生存曲線比較了Kaplan-Meier plotter中不同類型癌癥中FUNDC1的高表達(dá)和低表達(dá)
▲?圖4.?具有不同臨床病理特征的肝細(xì)胞癌中FUNDC1 mRNA表達(dá)與OS和PFS的相關(guān)性
▲?圖5. LIHC和LUSC中FUNDC1表達(dá)與免疫浸潤(rùn)水平的相關(guān)性
▲?圖6. FUNDC1表達(dá)與LIHC和LUSC中的B細(xì)胞浸潤(rùn)和巨噬細(xì)胞極化相關(guān)
▲?表1. FUNDC1與TIMER免疫細(xì)胞基因標(biāo)記之間的相關(guān)性
▲?表2. FUNDC1與GEPIA中B細(xì)胞,巨噬細(xì)胞和單核細(xì)胞的基因標(biāo)志物之間的相關(guān)性
復(fù)現(xiàn)工具
◆?仙桃學(xué)術(shù)工具
(https://www.xiantao.love/products)
◆?Oncomine數(shù)據(jù)庫(kù)
(www.oncomine.org)
◆?TIMER數(shù)據(jù)庫(kù)
(http://timer.cistrome.org/)
◆?GEO數(shù)據(jù)庫(kù)
(https://www.ncbi.nlm.nih.gov/gds/?term=)
現(xiàn)在一切準(zhǔn)備就緒,沒時(shí)間解釋了,快上車!跟著我一起開始復(fù)現(xiàn)之旅吧!
?
Figure 1
FUNDC1在泛癌中的表達(dá)模式

在此濤濤想要提醒大家,需要把這兩個(gè)代表圖都深深地記下來(lái)(你存在,我深深的腦海里~)
因?yàn)檫@兩個(gè)圖是典型的Oncomine與Timer的代表圖。至于我們的神仙武器“仙桃”在線工具能不能實(shí)現(xiàn)呢?答案是肯定的,只不過(guò)在不遠(yuǎn)的將來(lái)!我們帥氣的程序員小哥哥正在努力開發(fā)中,我們期待“仙桃學(xué)術(shù)”早日將這兩個(gè)圖的制作收入囊中!
那下面我們就分別來(lái)看看Oncomine與Timer的制作過(guò)程。
第一步:登錄Oncomine的網(wǎng)站,用機(jī)構(gòu)郵箱注冊(cè)并登錄。(https://www.oncomine.org/resource/login.html)

第二步:研究把基因FUNDC1。在search欄中輸入分子FUNDC1,并點(diǎn)擊search按鈕,頁(yè)面自動(dòng)刷新如下。選擇目標(biāo)區(qū)域進(jìn)行截圖,這樣圖A的結(jié)果就出來(lái)了。


接下來(lái),我們繼續(xù)復(fù)現(xiàn)Figure 1B。
登錄TIMER數(shù)據(jù)庫(kù)的網(wǎng)站(http://timer.cistrome.org/)

選擇Exploration,選擇Gene_De,在文字框內(nèi)輸入基因名FUNDC1,點(diǎn)擊submit。

而后獲得以下分析結(jié)果,保存成pdf格式。

最后把Oncomine獲得的結(jié)果與TIMER數(shù)據(jù)庫(kù)分析得到的結(jié)果在Illustrator或者Photoshop軟件中進(jìn)行拼圖,就得到我們的圖1。
或者采用我們仙桃最炙手可熱剛剛“出爐”的拼圖功能喔!(這回程序員小哥哥又開發(fā)了一大利好,那就是可以用自己的圖片來(lái)拼圖啦!)
進(jìn)入仙桃學(xué)術(shù)工具(https://www.xiantao.love/products);選擇高級(jí)版,點(diǎn)擊“立即使用”(注:免費(fèi)版和基礎(chǔ)版都可以進(jìn)行統(tǒng)計(jì)和可視化,由于高級(jí)版功能最全,這里選擇高級(jí)版作為范例)

選擇基礎(chǔ)繪圖 –上傳圖片,點(diǎn)擊進(jìn)入

此處開始上傳自己的圖片,但是記得圖片要為pdf、tiff、tif、png的格式喔!

上傳好之后,可以調(diào)整圖片的寬度和高度參數(shù),最后點(diǎn)擊確認(rèn)。

記得點(diǎn)擊下方第一個(gè)“保存結(jié)果”按鈕,才能進(jìn)行下一步的拼圖喔!
點(diǎn)擊拼圖工具,進(jìn)入拼圖頁(yè)面。


拖拽目標(biāo)圖片進(jìn)入畫布。(在對(duì)齊圖片的時(shí)候可以選擇橫向參考線和縱向參考線輔助對(duì)齊。兩個(gè)圖片對(duì)齊時(shí),接近輔助線的時(shí)候還有磁吸功能,拼圖非常便利!

點(diǎn)擊PDF下載,還會(huì)自動(dòng)標(biāo)記字母哦!點(diǎn)擊下載,即可保存成pdf圖片。(小貼士,這里也可以把圖稍微放大,或者兩圖直接的行間距放大,可以在右側(cè)減少留白)

這樣圖就拼好啦!是不是比其他軟件更輕松更便利呢??(是?。?br>
其實(shí),關(guān)于圖1B,濤濤醬想說(shuō)的是,仙桃學(xué)術(shù)也可以做得出來(lái)喔,而且效果更精美!
進(jìn)入仙桃學(xué)術(shù)工具,選擇表達(dá)差異(挑)- 非配對(duì)樣本,點(diǎn)擊進(jìn)入。選擇疾病-泛癌。
因?yàn)橛械陌┓N的正常樣本數(shù)不夠,用GTEx數(shù)據(jù)庫(kù)的正常樣本補(bǔ)足,將TCGA與GTEx數(shù)據(jù)庫(kù)聯(lián)合分析。這里建議選擇XENA-TCGA-GTEx泛癌數(shù)據(jù)。參數(shù)部分的類型選擇-箱圖/柱狀圖,基因輸入FUNDC1。點(diǎn)擊確認(rèn)。

FUNDC1泛癌的結(jié)果就分析出來(lái)啦。保存結(jié)果,點(diǎn)擊大圖,下載pdf文檔。


Figure 2
Kaplan-Meier生存曲線比較了PrognoScan中不同癌癥類型中FUNDC1的高表達(dá)和低表達(dá)

通過(guò)各位看官兒的火眼金睛可以看出,很顯然Figure 2是由多幅不同腫瘤內(nèi)有關(guān)不同結(jié)局指標(biāo)的K-M生存曲線。同樣的道理,這幅圖的實(shí)現(xiàn)也可以有兩種方式。
(濤濤醬:掌握了多種方式實(shí)現(xiàn),才有助于科研發(fā)展嘛!就好比高中數(shù)學(xué)解題一樣對(duì)吧?)(藏鏡人:好好分享你的文章復(fù)現(xiàn),別提數(shù)學(xué),腦殼疼?。?br>
兩種方式分別是:PrognoScan以及仙桃學(xué)術(shù)。
而作為我們?nèi)f能的“仙桃學(xué)術(shù)”,當(dāng)然要放在后位來(lái)介紹啦!
法一:PrognoScan
登入PrognoScan網(wǎng)站(http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html)

別看這個(gè)網(wǎng)站,長(zhǎng)得很簡(jiǎn)陋,其實(shí)有大作用呢!
(濤濤醬:大概就好比懸疑劇最后的大boss 往往都是一開始被大家忽視的小人物?)
在方框內(nèi)輸入感興趣的基因,比如本文的:FUNDC1
點(diǎn)擊“SUBMIT”

(藏鏡人:哇?。。【谷挥心敲炊啵?/span>(濤濤醬:See?你看吧,而且卷動(dòng)鼠標(biāo)往下,還可以看到更多的腫瘤喔?。?/span>

由于Figure 2的圖太多,但類型相似,一一復(fù)現(xiàn)占篇幅,那我們就以Figure 2A來(lái)做一個(gè)示范。
Figure 2A里面作者是探討膀胱癌中FUNDC1與結(jié)局指標(biāo)DSS的關(guān)系。

在其中能找到膀胱癌范圍內(nèi)DSS對(duì)應(yīng)的條目。點(diǎn)擊圖片中間的“PROBE ID”

而后就會(huì)出現(xiàn)

繼續(xù)往下你就能看到我們想要的圖啦!

右鍵保存即可下載至電腦中。
其他幾幅圖同理可得。最后拼圖得到我們的圖2。
法二:仙桃學(xué)術(shù)
進(jìn)入仙桃學(xué)術(shù)工具(https://www.xiantao.love/products)
先復(fù)現(xiàn)圖A。選擇臨床意義(靠)- KM曲線圖,點(diǎn)擊進(jìn)入

選擇TCGA-BLCA, FPKM, 分子輸入FUNDC1,預(yù)后類型選擇DSS,點(diǎn)擊確認(rèn)。得到以下的結(jié)果。保存結(jié)果。

但是在這里需要提醒大家的一點(diǎn)是,仙桃學(xué)術(shù)KM曲線圖的部分目前的數(shù)據(jù)是來(lái)自TCGA數(shù)據(jù)庫(kù)的喔,而本文作者的數(shù)據(jù)是來(lái)自GEO。在不久的未來(lái),仙桃學(xué)術(shù)也會(huì)為大家提供GEO的數(shù)據(jù),大家再耐心等等,多多轉(zhuǎn)發(fā)文章讓程序員小哥哥加雞腿,這樣他們就有動(dòng)力啦!
Figure 3
Kaplan-Meier生存曲線比較了Kaplan-Meier plotter中不同類型癌癥中FUNDC1的高表達(dá)和低表達(dá)

這幅圖和圖二其實(shí)沒什么區(qū)別,就是用Kaplan-Meier生存曲線做出來(lái)的圖而已。所以其實(shí)這也給我們提供了另一個(gè)解題思路,除了上述的兩種方法之外,我們還有第三種方法——Kaplan-Meier Plot。
復(fù)現(xiàn)步驟:
打開Kaplan-Meier Plotter網(wǎng)站(http://www.kmplot.com/analysis/)

跟著我,點(diǎn)擊如下按鈕。

這里可以選擇21種腫瘤(包括乳腺癌、卵巢癌、肺癌及胃癌)超過(guò)54000個(gè)基因(mRNA, miRNA, 蛋白)進(jìn)行生存分析。其數(shù)據(jù)主要來(lái)源于GEO、EGA和TCGA。只有你想不到,沒有你沒想到!
緊接著,在方框里輸入我們要復(fù)現(xiàn)的FUNDC1,選擇分析的結(jié)局指標(biāo)OS,而后勾選不同的癌種,最后點(diǎn)擊下圖的分析按鈕。

真的是一鍵出圖!要多神奇就有多神奇!
最后把這些圖放在Illustrator或者Photoshop軟件中進(jìn)行拼圖,就得到我們的圖3。

最后還可以將圖片保存成PDF格式。
依次同理可以復(fù)現(xiàn)Figure 3的其他圖片。
Figure 4
具有不同臨床病理特征的肝細(xì)胞癌中FUNDC1 mRNA表達(dá)與OS和PFS的相關(guān)性

這個(gè)圖是典型的多因素Cox回歸分析的森林圖結(jié)果。
總體復(fù)現(xiàn)思路應(yīng)該如此概括,先進(jìn)行多因素的臨床變量與預(yù)后結(jié)局關(guān)聯(lián)的Cox回歸分析,再構(gòu)建森林圖。
有了這個(gè)思路,復(fù)現(xiàn)就不難做到啦!步驟如下:
第一步:多因素的臨床變量與預(yù)后結(jié)局關(guān)聯(lián)的Cox回歸分析
選擇臨床意義(靠)- 單因素|多因素Cox回歸,點(diǎn)擊進(jìn)入

選擇TCGA-LIHC , FPKM, 分子輸入FUNDC1,采用默認(rèn)的預(yù)后類型(overall survival)。在左側(cè)框里選擇臨床變量,或者輸入基因名(可以填一個(gè)或多個(gè)基因名),在右側(cè)框可里選擇亞組變量,包括FUNDC1基因表達(dá)的Low或者High等變量。
如果需要再增加變量,點(diǎn)擊右側(cè)的加號(hào);如果需要剔除某個(gè)變量,需要在變量的右側(cè)點(diǎn)擊減號(hào)。確定好臨床變量和分組信息后,點(diǎn)擊確認(rèn)。會(huì)分析出統(tǒng)計(jì)分析表,以及統(tǒng)計(jì)數(shù)據(jù)、相應(yīng)的材料與方法、結(jié)果部分的描述。




進(jìn)一步保存成word文檔和excel結(jié)果。分析結(jié)果如下。

第二步:基于以上表格,制作森林圖結(jié)果
選擇基礎(chǔ)繪圖 - 森林圖,點(diǎn)擊進(jìn)入

目前仙桃學(xué)術(shù)生信工具并沒有針對(duì)單基因的森林圖分析。需要根據(jù)多因素Cox回歸分析的結(jié)果進(jìn)行整理。
基礎(chǔ)繪圖—分組比較—森林圖

點(diǎn)擊下載示例數(shù)據(jù),看一下示例數(shù)據(jù)的格式。需要把多因素cox回歸分析結(jié)果整理成以下形式。

將之前cox回歸分析的excel結(jié)果刪除B、C列單因素分析結(jié)果,只保留多因素cox分析結(jié)果。

點(diǎn)擊excel文件上傳。為了避免森林圖過(guò)寬,字體重疊,把寬度調(diào)整為15cm(先點(diǎn)擊確認(rèn),如果字體重疊,再回來(lái)擴(kuò)大寬度的厘米數(shù),直到森林圖字體不重疊為止)。點(diǎn)擊確認(rèn)。

圖片行內(nèi)字?jǐn)?shù)過(guò)寬,需要橫拉條拉動(dòng)才能看全頁(yè)面。這時(shí)候選擇“查看大圖”。

得到結(jié)果如下。由此森林圖復(fù)現(xiàn)出來(lái)了。

Figure 5
LIHC和LUSC中FUNDC1表達(dá)與免疫浸潤(rùn)水平的相關(guān)性

圖A是在LIHC肝細(xì)胞癌中,F(xiàn)UNDC1的表達(dá)與各類免疫細(xì)胞浸潤(rùn)的關(guān)聯(lián)程度,其中第一張圖是B細(xì)胞。我們就示范復(fù)現(xiàn)一下圖A的第一張圖。
同樣也是兩個(gè)方法:TIMER 以及 仙桃!
法一:TIMER數(shù)據(jù)庫(kù)(http://timer.cistrome.org/)

選擇Immune Association里面的Gene

而后,在方框里選擇基因FUNDC1以及需要探究的免疫細(xì)胞。

然后,點(diǎn)擊“submit”!可以看到以下結(jié)果

找到你想要的腫瘤類型與細(xì)胞亞型,此處為L(zhǎng)IHC與B cell。鼠標(biāo)點(diǎn)擊這個(gè)數(shù)值。

而后就能出圖啦!

其他方法依次類推,最后將結(jié)果拼圖就得到我們的圖5。
法二:仙桃學(xué)術(shù)
選擇交互網(wǎng)絡(luò)(聯(lián))–免疫浸潤(rùn)—散點(diǎn)圖,點(diǎn)擊進(jìn)入

接下來(lái)左側(cè)選擇TCGA-LIHC,F(xiàn)PKM,右側(cè)參數(shù)的分子部分選擇感興趣的基因,而算法參數(shù)選擇要研究的細(xì)胞,此處選擇B cells。

最后,點(diǎn)擊“確認(rèn)”,就能一鍵出圖啦!

Table 1
FUNDC1與TIMER免疫細(xì)胞基因標(biāo)記之間的相關(guān)性

(藏鏡人:我的天啊,這表格也太大了吧,里面都是些什么數(shù)字啊,看得云里霧里的?。?br>
細(xì)心的你一定能夠發(fā)現(xiàn),這個(gè)圖其實(shí)就是圖5各個(gè)細(xì)胞的Spearman r值與p值的匯總??!
所以運(yùn)用圖5介紹的Timer或我們的仙桃,就能做出這一幅“曠世巨作”喔!
Figure?6
FUNDC1表達(dá)與LIHC和LUSC中的B細(xì)胞浸潤(rùn)和巨噬細(xì)胞極化相關(guān)

聰明的你一定也發(fā)現(xiàn)了吧?圖6和圖5其實(shí)是一模一樣的,只是其中研究浸潤(rùn)的是不同細(xì)胞而已,所以直接參照前文的圖5就可以依樣畫瓢地如法炮制啦!
Table 2
FUNDC1與GEPIA中B細(xì)胞,巨噬細(xì)胞和單核細(xì)胞的基因標(biāo)志物之間的相關(guān)性

表2與表1也是一個(gè)道理的喔!
(藏鏡人:可是我看到這里,前面的又忘了欸 o(╥﹏╥)o )(濤濤醬:如果前面所說(shuō)的Timer或者仙桃免疫浸潤(rùn)散點(diǎn)圖還不會(huì)的話,趕緊往上滑回去再多看幾眼喔?。?br>
恭喜你看到這里,也就意味著你已經(jīng)掌握了復(fù)現(xiàn)單基因泛癌免疫分析的一大半了!
(藏鏡人:蛤?那另一半在哪呢?)(濤濤醬:哈哈,另一半就是立刻登陸仙桃學(xué)術(shù)
開始實(shí)操吧?。?/span>