使用Gfold進(jìn)行無(wú)重復(fù)樣本轉(zhuǎn)錄組差異表達(dá)分析
一.軟件下載安裝
使用工具 Gfold, 下載鏈接:
https://zhanglab.#edu.cn/softwares/GFOLD/index.html

但是在試用gfold的時(shí)候報(bào)錯(cuò)了,error while loading shared libraries: libgsl.so.0: cannot open shared object file: No such file or directory。
好煩。。。。
find / -name libgsl.so.*

還是有很多libgsl.so.*文件的,只截圖了部分結(jié)果。
問(wèn)題解決:
參考網(wǎng)友1的辦法,該大神有一些小錯(cuò)誤,但我在人家基礎(chǔ)上進(jìn)行的學(xué)習(xí)改進(jìn),在此謝過(guò)大神。

然后lib目錄下多了一個(gè)libgsl.so.0文件

然后再試用一下gfold命令,安裝成功:

二.軟件使用
1.使用說(shuō)明可以參照官網(wǎng)上示例。


JOBS:
count: 有時(shí)候一個(gè)read 可能map到多個(gè)基因上,這時(shí)這個(gè)read就在每個(gè)基因上都進(jìn)行了計(jì)數(shù),重復(fù)計(jì)數(shù)了,此外,如果一個(gè)基因在多個(gè)染色體上或者同一條染色體的不同鏈上,只有在一個(gè)染色體上的同一鏈的外顯子會(huì)被歸到這個(gè)基因上,不在這條染色體和同一鏈上的會(huì)被忽視。
diff:對(duì)每個(gè)基因,計(jì)算GFOLD值和其它統(tǒng)計(jì)值。diff接受count結(jié)果作為input。有關(guān)輸入格式的更多信息,請(qǐng)參考count的輸出格式。如果你對(duì)計(jì)數(shù)所采用的策略不滿意,你可以自己生成基因讀取計(jì)數(shù)。Input中,“GeneSymbol”和“Read Count”很關(guān)鍵。Count結(jié)果的第三列(gene length)只會(huì)影響RPKM的值,如果缺失這列信息,diff就不會(huì)產(chǎn)生RPKM的值。Count結(jié)果的第四列對(duì)于diff來(lái)說(shuō)沒(méi)有用處。
2.運(yùn)行命令行:
/home/lvqiang/miniconda3/envs/gfold/bin/gfold diff -s1 hsv2-12hAS -s2 hsv2-12h-Control -suf .read_cnt -o 12hASVS12Cont.diff
3.輸入輸出文件要求及結(jié)果解讀:
參考別人的意見(jiàn),輸入文件共有五列,每一列的命名分別為:GeneSymbol,GeneName,ReadCount,gene exon length,RPKM,第一列和第二列內(nèi)容可以一樣,第5列我沒(méi)有填寫(xiě),會(huì)在結(jié)果中生成。
輸入文件命名如下圖,以.read_cnt為后綴,命令行參數(shù)設(shè)置上只寫(xiě)名字就行,否則會(huì)報(bào)錯(cuò)提示找不到文件,:

計(jì)算過(guò)程:

結(jié)果:會(huì)生成兩個(gè)文件

diff文件記錄了差異表達(dá)的結(jié)果,diff文件中g(shù)fold列信息含義:

三.篩選差異表達(dá)基因:
gfold列的值是log2 fold change, >0的為上調(diào)基因,<0的為下調(diào)基因,=0的為沒(méi)有差異的基因,可進(jìn)一步通過(guò)腳本命令行篩選上調(diào)、下調(diào)的基因,因?yàn)槲疫@次做的病毒基因的表達(dá)和上調(diào),基因數(shù)目非常少,肉眼看就知道了。
但是要是做動(dòng)植物分析時(shí),就得需要命令行了,參考大神2的命令行:
四.參考:
1.鏈接:http://events.jianshu.io/p/aebd9510f892
2.鏈接:https://www.jianshu.com/p/25038fa16717
本文使用 文章同步助手 同步