oebiotech云平臺表達量計算詳細教程
背景知識介紹
基因表達量常見的衡量指標有:FPKM、TPM、RPKM。
FPKM:Fragments Per Kilobase Million或者Fragments Per Kilobase Per Million Reads。
即每一百萬條Reads中,比對到該基因的1000個base的fragments總數(shù)。
F1表示mapping到該基因的fragments總數(shù)
L1表示該基因長度
FT表示mapping到參考基因組的總fragments數(shù)
RPKM:Reads Per Kilobase Million或者Reads Per Kilobase Per Million Reads,即每一百萬條Reads中,比對到該基因1000個base的Reads數(shù)。
R1 表示mapping到該基因的reads總數(shù)
L1表示該基因長度
RT表示mapping到基因組的總reads數(shù)
FPKM意義與RPKM的區(qū)別僅在于,F(xiàn)ragment 與 Read。
RPKM的誕生是針對早期的SE測序,F(xiàn)PKM則是在PE測序上對RPKM的校正。
Reads即是指下機后fastq數(shù)據(jù)中的每一條Reads,F(xiàn)ragments則是指每一段用于測序的核酸片段,在SE中,一個Fragments只測一條Reads,所以,Reads數(shù)與Fragments數(shù)目相等;在PE中,一個Fragments測兩端,會得到2條Reads,但由于后期質(zhì)量或比對的過濾,有可能一個Fragments的2條Reads最后只有一條進入最后的表達量分析??傊?,對某一對Reads而言,這2條Reads只能算一個Fragments,所以,F(xiàn)ragment的最終數(shù)目是Reads的1到2倍之間。
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千個堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)。
R1表示mapping到該基因的Transcripts總數(shù)
L1表示該基因長度
Rtotal表示矯正后的所有基因的counts總和。
計算TPM分為3步:
step1:根據(jù)基因/轉(zhuǎn)錄本長度校正count值;假設(shè)某基因count值為R1,則校正后count值為:R1/(L1/1000),L1為該基因的長度;
step2:計算total 校正后count值;即所有基因的校正后count值總和,Rtotal;
step3:根據(jù)公式計算TPM;
歐易云平臺-表達量計算
2.1 表達量計算小工具用于將轉(zhuǎn)錄組的counts數(shù)據(jù)轉(zhuǎn)換成FPKM或者TPM標準化的數(shù)據(jù)。
參考右側(cè)的使用說明,正確整理數(shù)據(jù)格式即可實現(xiàn)數(shù)據(jù)轉(zhuǎn)換。
注:表頭含義,第一列列名為id,第2-n列為樣本名稱,沒有的填寫為0,這里不允許不填,不填寫會報錯。
2.2頁面參數(shù)選擇
將整理完的表格,上傳至表達量矩陣表位置
進行轉(zhuǎn)換之前要先選擇物種,選擇的物種要與研究的目標物種一致,不同物種所選擇的基因的長度是不一樣的,這里要特別注意,如果選錯物種則計算出的結(jié)果是錯的。
2.3 標準化方法的選擇:
主要有兩種方法FPKM和TPM,適用于當(dāng)前歐易轉(zhuǎn)錄組報告數(shù)據(jù)標準化方法。
2.4 結(jié)果展示:
點擊結(jié)果下載,自動下載標準化后的數(shù)據(jù)。
猜你想看
1、科研輕而“易”舉——歐易生物云平臺煥新歸來!
2、探"云"指南 | 歐易云ROC分析曲線
3、技術(shù)指南 | CUT&Tag技術(shù)大放送,Q&A助力了解詳情
4、免疫研究工具天花板—IOBR包說明書來啦~
原創(chuàng)聲明:本文由歐易生物(OEBIOTECH)學(xué)術(shù)團隊報道,本文著作權(quán)歸文章作者所有。歡迎個人轉(zhuǎn)發(fā)及分享,未經(jīng)作者的允許禁止轉(zhuǎn)載。