【生信小工具】零代碼分析基因之間的表達(dá)相關(guān)性(pearson和spearman)!

大家好,小云又來(lái)分享生信小工具嘍~
今天小云分享一種相關(guān)性分析的小工具!
可以用零代碼生信分析在線工具(網(wǎng)址:http://www.biocloudservice.com/home.html?)中的“基于表達(dá)信息挖掘與靶基因相關(guān)的基因”模塊。

1.?分析原理?
在生信分析中,我們往往希望對(duì)我們關(guān)注的某一個(gè)基因進(jìn)行下游功能的探索,然而,單個(gè)基因想要研究,大多數(shù)情況下只能是通過(guò)實(shí)驗(yàn)進(jìn)行,通常會(huì)對(duì)該基因進(jìn)行敲除或過(guò)表達(dá)后進(jìn)行測(cè)序,從而和正常組進(jìn)行比較,得到差異基因認(rèn)為是受該基因影響的,但是這樣做一是耗時(shí)耗力,而是得到的差異基因仍然是一堆,我們?nèi)匀徊恢滥男┗蚝驮摶蛎芮邢嚓P(guān)。
皮爾森相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù)為研究基因之間的表達(dá)相關(guān)性提供了很好的思路,因此本軟件通過(guò)基于基因在各個(gè)樣本中的表達(dá)矩陣,利用皮爾森相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù)計(jì)算原理,分別獲得各個(gè)基因與關(guān)注基因的相關(guān)性排名,通過(guò)給定的基因個(gè)數(shù)N,繪制相關(guān)性最強(qiáng)的TOPN 基因和關(guān)注基因的散點(diǎn)分布圖,并標(biāo)識(shí)出具體的相關(guān)系數(shù)和顯著性p.value 值,從而為下游功能研究提供參考。

2.?具體操作步驟
(1)進(jìn)入小工具頁(yè)面后,可以使用說(shuō)明、常見(jiàn)問(wèn)題、輸入數(shù)據(jù)模板等選項(xiàng),點(diǎn)擊頁(yè)面中的”上傳數(shù)據(jù)”。

(2)提示上傳數(shù)據(jù)需要“文件名和格式要和示例數(shù)據(jù)一致”,可以根據(jù)”輸入數(shù)據(jù)模板”整理數(shù)據(jù),并上傳。

(3)數(shù)據(jù)整理:點(diǎn)擊”輸入數(shù)據(jù)模板”進(jìn)入以下頁(yè)面,可以看到給出的模板,點(diǎn)擊文件可以在線預(yù)覽和下載。


(4)制作好數(shù)據(jù)后,點(diǎn)擊“上傳文件”,如圖顯示上傳成功。


點(diǎn)擊頁(yè)面最下方的“返回程序主頁(yè)面”。

輸入”基因名字”和“相關(guān)基因個(gè)數(shù)”,點(diǎn)擊“Submit”即可跳轉(zhuǎn)到結(jié)果展示頁(yè)面。

結(jié)果會(huì)輸出一個(gè)表格csv 格式文件,一個(gè)pdf 格式的圖片文件??梢栽诰€預(yù)覽,也可以直接下載全部結(jié)果。

????
3. 結(jié)果展示和解讀
(1)FTL_cor.pdf

該圖表示各個(gè)基因與關(guān)注基因的相關(guān)性散點(diǎn)圖,縱軸名稱是其它各個(gè)基因symbol,橫軸名稱為關(guān)注基因symbol,最上方P 值表示顯著行p.value 值,r 值表示pearson 相關(guān)系數(shù)
(2)FTLother_gene_cor.csv

該表格表示各個(gè)基因和關(guān)注基因之間的相關(guān)系數(shù)及p.value 值,第二和第三列分別表示計(jì)算得到的各個(gè)基因和關(guān)注基因的pearson 相關(guān)系數(shù)和對(duì)應(yīng)的顯著性p.value 值,第四和第五列分別表示計(jì)算得到的各個(gè)基因和關(guān)注基因的spearman 相關(guān)系數(shù)和對(duì)應(yīng)的顯著性p.value 值,第六列為對(duì)應(yīng)的基因symbol
?
總結(jié)
本軟件通過(guò)基于基因在各個(gè)樣本中的表達(dá)矩陣,利用皮爾森相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù)計(jì)算原理,分別獲得各個(gè)基因與關(guān)注基因的相關(guān)性排名,通過(guò)給定的基因個(gè)數(shù)N,繪制相關(guān)性最強(qiáng)的TOPN 基因和關(guān)注基因的散點(diǎn)分布圖,并標(biāo)識(shí)出具體的相關(guān)系數(shù)和顯著性p.value 值。
設(shè)置參數(shù)少,用戶只需要輸入基因在所有樣本中的表達(dá)值矩陣,并設(shè)置好感興趣或關(guān)注的基因symbol?與預(yù)期得到的相關(guān)性最強(qiáng)的基因個(gè)數(shù),軟件將自行計(jì)算出矩陣中其它各個(gè)基因和關(guān)注基因之間的皮爾森相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù),并繪制與關(guān)注基因相關(guān)性最強(qiáng)的少數(shù)基因和關(guān)注基因的分布散點(diǎn)圖。感興趣的小伙伴趕緊動(dòng)手用起來(lái)吧!

?