最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

CRMSS | 又一款預(yù)測circRNARBP結(jié)合位點的工具

2023-02-14 15:56 作者:circRNA官方號  | 我要投稿

簡介

環(huán)狀RNA(circRNA) 是反向剪接和共價閉合的RNA。它們與RNA結(jié)合蛋白 (RBP) 的相互作用對許多疾病的發(fā)展有多重影響。目前已經(jīng)有不少工具可用于識別circRNA上的RBP結(jié)合位點,但準確性、穩(wěn)健性和解釋性都不足。

為此,中南大學(xué)計算機科學(xué)與工程學(xué)院王建新教授團隊開發(fā)了一款全新的工具——CRMSS,一種基于多尺度特征序列和結(jié)構(gòu)特征來預(yù)測 circRNA-RBP結(jié)合位點的方法。該項成果發(fā)表在了Briefings in Bioinformatics?(IF=13.994) 期刊上。



算法優(yōu)勢

1??不同的序列編碼方法對性能的影響比較

CRMSS采用了k-mer算法,并與One-hot、CircRNA2vec、KNFP、Pseudo-coding四種序列編碼方法進行了比較(表1)。結(jié)果顯示CRMSS的k-mer方法獲得了最佳性能。在其他編碼方式下,預(yù)測性能都會有一定程度的下降,尤其是One-hot編碼方法,導(dǎo)入數(shù)據(jù)的稀疏性導(dǎo)致性能出現(xiàn)明顯下降。這些結(jié)果表明CRMSS的序列編碼方法不僅更準確而且更穩(wěn)定


表1. 不同序列編碼方案對基準數(shù)據(jù)集的影響

2??CRMSS與現(xiàn)有預(yù)測工具之間的比較

作者將CRMSS與目前最先進的四種工具CRIP、PASSION、CircSLNN和iCircRBPDHN在評估指標和統(tǒng)計分析方面,對基準數(shù)據(jù)集進行5倍的交叉驗證。

一方面,作者采用指定的評估指標來評估性能,測試了僅具有circRNA結(jié)構(gòu)特征(RNA secondary structure, RSS)或僅具有RBP特征(RNA binding Domain, RBD)的模型,以分析不同特征的影響,并檢查了37個RBP上的所有結(jié)合位點。37個RBP的平均結(jié)果用于評估模型(圖1)。可以看到,CRMSS的性能優(yōu)于這四種工具,獲得了最高的平均AUC值 0.899,并且在AUPR和Recall中表現(xiàn)得更好。

圖1. 不同工具在37個RBP上的測試結(jié)果

另一方面,作者采用了Friedman檢驗和Nemenyi檢驗進行統(tǒng)計分析,并繪制了一個測試圖,其中每個模型的平均排名值作為中點,CD 值作為線長(圖2)。從圖中可以看出,CRMSS的線與CRIP、Passion、CircSLNN的線沒有重疊,這說明它們之間有很大的區(qū)別。與其他工具相比,CRMSS的線與iCircRBP-DHN的線接近,表明它們之間的差異較小。


圖2. Friedman–Nemenyi檢驗對37個RBP的AUC測試結(jié)果

3??RSS和RBD模型對性能的影響比較

作者分析了RSS和RBD的影響,從圖 1 中可以看到僅RSS或僅RBD會降低所有RBP的平均性能。然后,作者計算了AUC比率以獲取RSS和RBD對每個RBP的影響(圖3)。與RBD模型(Model 1)相比,RSS模型(Model 2)的性能下降更小,這表明RNA結(jié)構(gòu)信息比RBP信息更能影響circRNA上的結(jié)合位點


圖3. RSS和RBD模型對每個RBP的影響

4??RBP結(jié)合性能的比較

為了進一步研究CRMSS模型是否捕捉到RBP的結(jié)合偏好。一般認為在相同的生物過程中,RBP往往具有相似的結(jié)合偏好。作者使用BLAST方法計算基準數(shù)據(jù)集中所有RBP對的序列相似性。圖 4(A) 顯示所有RBP對的平均序列相似性約為0.13。作者選擇了兩組序列相似性差異較大的RBP對進行對照實驗,將具有最高序列相似性的10個RBP對設(shè)置為組1,而組2包含具有最低序列相似性的10個RBP對。從圖 4(B) 來看,兩組在序列相似性方面有顯著差異。對于每個RBP對,作者用一個RBP的結(jié)合位點訓(xùn)練模型,然后預(yù)測另一個RBP的結(jié)合位點,預(yù)測精度反映了RBP對結(jié)合偏好的相似性。從圖 4(C) 來看,組1中的RBP對的平均精度接近0.7,而組2中的RBP對的平均精度不超過0.3。因此,作者認為擁有更相似序列的RBP具有更接近的結(jié)合偏好


圖4. RBP結(jié)合性能的影響

5??實際應(yīng)用測試

為了測試CRMSS在實際應(yīng)用中的表現(xiàn),作者選取了兩方面的數(shù)據(jù)集進行研究。

一方面,作者從NPInter數(shù)據(jù)庫中收集了經(jīng)過實驗驗證的circRNA-RBP相互作用對。如圖5所示,從所有的相互作用對中都檢測到了結(jié)合位點,表明CRMSS的預(yù)測結(jié)果是可靠的。


圖5. 預(yù)測實驗驗證的circRNA-RBP對上的結(jié)合位點


另一方面,作者采用RIP-seq數(shù)據(jù)集比較了CRMSS和上述四種工具的優(yōu)劣(表2)。其中,被兩種方法(Clirc和circRIP)檢測到的114個結(jié)合位點被設(shè)置為可靠的結(jié)合位點,而兩種方法都沒有檢測到的60個結(jié)合位點則設(shè)置為不可靠的結(jié)合位點。作者去除了577個結(jié)合位點的標簽,將對應(yīng)的circRNA和RBP信息輸入到訓(xùn)練好的CRMSS模型中,并重新預(yù)測結(jié)合位點的標簽。在114個可靠的結(jié)合位點中,約有107個可以被準確檢測,CRMSS的準確率達到93.9%;在60個不可靠的結(jié)果中,只檢測到兩個預(yù)測的結(jié)合位點。從表2可知,CRMSS在所有工具中的表現(xiàn)最優(yōu)異。

表2.不同工具在RIP-seq數(shù)據(jù)集中的檢測能力

方法策略

對于circRNA,作者用k-mer編碼circRNA序列,用RNAplfold計算circRNA的二級結(jié)構(gòu),然后將circRNA的兩個特征連接起來。對于RBP,每個RBP都使用RBD的序列和結(jié)構(gòu)頻率進行編碼。接著,作者分別將circRNA和RBP特征傳輸?shù)接啥喑叨菴NN層形成的殘差塊,輸出被連接起來并傳輸?shù)骄哂凶灾髯⒁鈾C制的BiLSTM。最后,作者使用softmax對具有完全連接層的結(jié)合位點進行分類。


圖6.CRMSS方法概述

小結(jié)


綜合上述所有的比較結(jié)果表明,CRMSS捕獲到了結(jié)合偏好并給出了可靠的預(yù)測。

與現(xiàn)有的RBP結(jié)合位點預(yù)測工具相比,CRMSS的性能表現(xiàn)得最優(yōu)異,不僅提供了準確的預(yù)測,而且有助于進一步研究分子機制。

感興趣的研究者可以嘗試下載使用。


參考文獻

Zhang L, Lu C, Zeng M, Li Y, Wang J. CRMSS: predicting circRNA-RBPbinding sites based on multi-scale characterizing sequence and structure features. Brief Bioinform. 2023 Jan 19;24(1):bbac530.?

轉(zhuǎn)載請聯(lián)系郵箱授權(quán):circRNA@163.com


CRMSS | 又一款預(yù)測circRNARBP結(jié)合位點的工具的評論 (共 條)

分享到微博請遵守國家法律
浦城县| 道真| 田林县| 南昌县| 迭部县| 涿州市| 万源市| 永年县| 华容县| 凤庆县| 河南省| 柳州市| 甘谷县| 襄垣县| 广东省| 衡阳市| 监利县| 离岛区| 澄江县| 新疆| 星座| 兴山县| 乐至县| 简阳市| 瓦房店市| 阳新县| 临潭县| 七台河市| 东乡| 丹棱县| 南华县| 镇赉县| 罗甸县| 抚远县| 沛县| 桃园市| 年辖:市辖区| 清徐县| 浮梁县| 闵行区| 乌拉特前旗|