網(wǎng)絡(luò)藥理學(xué)常見(jiàn)問(wèn)題匯總——靶點(diǎn)、成分問(wèn)題

1.請(qǐng)問(wèn)大分子的多肽類藥物可以做網(wǎng)藥嗎?
答:可以查閱文獻(xiàn)看有無(wú)類似文章參考,現(xiàn)一般為小分子藥物成分,像大分子在swisstargetprediction可能無(wú)法預(yù)測(cè),不過(guò)也可通過(guò)查閱文獻(xiàn)對(duì)相關(guān)靶點(diǎn)進(jìn)行富集分析。大分子如蛋白-蛋白分子對(duì)接、多肽-蛋白分子對(duì)接、核酸-蛋白分子對(duì)接等大分子的分子對(duì)接,但是大分子涉及分子大,分子運(yùn)動(dòng)較小,比較符合硬性對(duì)接,且軟件運(yùn)算相較于小分子更大。
?
2.做出交集靶點(diǎn)后,怎么找交集靶點(diǎn)對(duì)應(yīng)的有效成分,因?yàn)橐粋€(gè)靶點(diǎn)可能對(duì)應(yīng)幾個(gè)成分,一個(gè)成分也可能對(duì)應(yīng)幾個(gè)靶點(diǎn)?
答:這樣尋找有效成分的條件不夠充分,可根據(jù)CytoCNA分析出成分與靶點(diǎn)的Degree值和靶點(diǎn)之間的Degree值等,選取排列靠前的核心靶點(diǎn)和核心成分進(jìn)行分子對(duì)接等。也可以考慮作用疾病核心靶點(diǎn)、確證通路來(lái)進(jìn)一步縮小有效成分的范圍,分子對(duì)接加強(qiáng)可信度,最終實(shí)驗(yàn)來(lái)確認(rèn)是否有效。從不同角度分析,采用方式不同。
?
3.使用tcmsp數(shù)據(jù)庫(kù)和文獻(xiàn)補(bǔ)充藥物成分夠了嗎?
答:一般是可以的。但還是根據(jù)自己需求來(lái),適當(dāng)補(bǔ)充和加用其它數(shù)據(jù)庫(kù)。
可以多個(gè)數(shù)據(jù)庫(kù)取并集擴(kuò)大化合物的數(shù)量,或者通過(guò)爬蟲(chóng)程序爬取文獻(xiàn)中藥物相關(guān)成分的信息,進(jìn)行匯總。
?
4.swisstargetprediction數(shù)據(jù)庫(kù)預(yù)測(cè)完活性成分的靶點(diǎn)后,需要按照gene_symbol進(jìn)行去重么?
答:先保存好每個(gè)成分靶點(diǎn)的文件,不用去重。然后匯總成一個(gè)總文件之后,篩選得到score>0(大于零或零以上,根據(jù)自己需求調(diào)整)的成分靶點(diǎn),再去重。
?
5.如果成分沒(méi)有Pubchem?CID,是不是要用swissadme看它的類藥五原則符不符合從而考慮是否是有效化合物,而不能直接刪除不要它?
答:1.是數(shù)據(jù)庫(kù)查找的已經(jīng)經(jīng)過(guò)OB?DL篩選符合,但無(wú)pubchem?id?可不考慮再用SWISS?ADME,也不要?jiǎng)h掉(注:SWISS?ADME?畫(huà)結(jié)構(gòu)也可預(yù)測(cè))2.成分不是在數(shù)據(jù)庫(kù)測(cè)得和無(wú)ID?,最好用SWISS?ADME篩選再做判斷。
?
6.請(qǐng)問(wèn)基因的fold?change值是什么?要怎么算呢,算的話如何卡那些值?
答:差異倍數(shù)(FC),需要用到R語(yǔ)言進(jìn)行差異分析,一般取log2(fold?change)的絕對(duì)值大于1。
(1)一般篩選差異基因參考的是logFC值,其公式表達(dá)為:log2(Mean(Exp(實(shí)驗(yàn)組))-Mean(Exp(對(duì)照組)),簡(jiǎn)寫(xiě)為log2(Mean(Exp(A))-Mean(Exp(B)),或者有些基因出現(xiàn)表達(dá)為0甚至負(fù)數(shù)的情況,公式也可以為log2(Mean(Exp(A))-Mean(Exp(B)+1)[避免出現(xiàn)log2(0)的情況]
(2)一般選擇差異基因有兩個(gè)指標(biāo),logFC和p-value,其中l(wèi)ogFC取值一般為±1,即規(guī)定實(shí)驗(yàn)組和對(duì)照組的基因表達(dá)平均數(shù),前者是后者的2倍或者是1/2倍,如果認(rèn)為閾值過(guò)低,篩選的差異基因數(shù)量過(guò)多,則可以考慮將logFC的閾值上調(diào),logFC取±1.5或者±2【實(shí)驗(yàn)組和對(duì)照組表達(dá)值比較,前者是后者的4倍或者1/4倍【log2(4)/log2(1/4)】】;p-value是默認(rèn)基因表達(dá)數(shù)據(jù)【數(shù)據(jù)預(yù)處理后】符合高斯分布,p-value一般選0.05,即95%的置信區(qū)間,如果篩選的差異基因過(guò)多,可以考慮嚴(yán)格標(biāo)準(zhǔn),p-value選0.01【99%置信】甚至0.001【99.9%置信】。
?
7.?在篩選化合物時(shí),用OB,DL值感覺(jué)篩選出來(lái)的跟這個(gè)藥沒(méi)多大關(guān)系了,都是谷甾醇,槲皮素等這些些成分?
答:OB和DL目前還是比較常用,可以增加篩選條件,例如,HL和BBB等,還可以根據(jù)文獻(xiàn)對(duì)活性成分進(jìn)行補(bǔ)充。當(dāng)然這也是TCMSP數(shù)據(jù)庫(kù)存在的問(wèn)題,個(gè)別藥會(huì)存在成分篩選時(shí)的同質(zhì)化現(xiàn)象(可參考《網(wǎng)絡(luò)藥理學(xué)“異病-異方”關(guān)鍵成分篩選同質(zhì)化現(xiàn)象思考》該文章)。
?
8.?疾病靶點(diǎn)和成分靶點(diǎn)取交集后有230個(gè)基因,導(dǎo)入string分析后只剩下190了,這個(gè)要怎么說(shuō)明呢?是因?yàn)槲野堰@里設(shè)置成0.9的原因嗎?
答:在minimum?required?interaction?score上的卡值會(huì)影響到我們獲得的基因數(shù),根據(jù)string上的相應(yīng)算法,選值越高,最基因之間的相互聯(lián)系越緊密,基因數(shù)會(huì)越少。其次,我們要知道,目前“蛋白-蛋白”關(guān)聯(lián)信息依然不完備,且表現(xiàn)出不同程度的注釋分散度和可靠性。STRING?數(shù)據(jù)庫(kù)的目的在于收集、評(píng)估及整合所有公用的“蛋白-蛋白”互作資源,并與計(jì)算機(jī)預(yù)測(cè)的結(jié)果互為補(bǔ)充。
?
9.問(wèn)一下大家,做化合物靶點(diǎn)篩選時(shí),發(fā)現(xiàn)導(dǎo)出的化合物靶點(diǎn)中有這樣的“CHRNA3?CHRNB4”,請(qǐng)問(wèn)在整理的時(shí)候需要把他們分開(kāi)嗎?
答:一般是將它們分開(kāi)的。但我們發(fā)現(xiàn)有時(shí)它們對(duì)應(yīng)的是同一蛋白時(shí),可以將它們同時(shí)寫(xiě)在一起。
?
10.Swisstargetpredicition中獲得的藥物成分對(duì)應(yīng)靶點(diǎn)都需要在uniprot里面校準(zhǔn)基因名嗎?
答:不需要。該數(shù)據(jù)庫(kù)中的靶點(diǎn)名稱就是參考uniprot數(shù)據(jù)庫(kù),基因symbol是一樣的。但我們也可以根據(jù)自己情況適當(dāng)?shù)臋z測(cè)校準(zhǔn)基因(因?yàn)橛行┗蚩赡茉?/span>Swisstargetpredicition中有而在uniprot上沒(méi)有,但其實(shí)影響不大)。
?
?
11.PubchemCID粘貼到Pubchem,想獲取smile號(hào),搜出來(lái)的成分比輸進(jìn)去的要少,需要處理嗎?還是隨它自己少?
答:需要處理。我們要知道少哪個(gè)并記錄,為之后用其他方法找到該成分做好準(zhǔn)備。(其他方法有:可以通過(guò)1.SWISSADME或SWISStargertprediction直接畫(huà)出結(jié)構(gòu)找到smile號(hào);2.可以通過(guò)https://www.novopro.cn/tools/mol2smiles.html
去轉(zhuǎn)換;3.可以用chemdraw軟件獲得)
?
12.在TCMSP上的靶點(diǎn)做的效果沒(méi)有swisstargetprediction上的好,如果有成分在swisstargetprediction沒(méi)有預(yù)測(cè)到靶點(diǎn)的話,就這個(gè)成分可以加上TCMSP上的靶點(diǎn)嗎,別的成分不加?
答:最好只用一個(gè)數(shù)據(jù)庫(kù)預(yù)測(cè)靶點(diǎn),不同數(shù)據(jù)庫(kù)的算法不一樣,一般不能聯(lián)合使用。如果聯(lián)用的話,缺少的話可以針對(duì)的對(duì)那個(gè)成分進(jìn)行補(bǔ)充,但也可把所有的成分缺少的也補(bǔ)上。找成分靶點(diǎn)方式有多種,可用swisstarget找成分靶點(diǎn)較多,找的也比較全,靶點(diǎn)可能性控制在0.10以上較好。TCMSP上的靶點(diǎn)找后要在uniprot上轉(zhuǎn)換gene?symbol。還有TECM,BatMan等數(shù)據(jù)庫(kù)也可以進(jìn)行靶點(diǎn)預(yù)測(cè)。
?
13.關(guān)于疾病-通路-靶點(diǎn)-成分-藥物網(wǎng)絡(luò)構(gòu)建的相關(guān)問(wèn)題。問(wèn)題①network文件里面的成分靶點(diǎn)是成分在swisstargetprediction預(yù)測(cè)的所有靶點(diǎn)呢,還是各成分相對(duì)的成分靶點(diǎn)和疾病靶點(diǎn)的交集靶點(diǎn)呢?②type文件里面的靶點(diǎn)又是什么靶點(diǎn),是成分疾病交集靶點(diǎn)嗎?
答:1.network文件里原本是各成分對(duì)應(yīng)的交集基因靶點(diǎn),但“藥學(xué)生阿程”視頻里介紹是將各成分對(duì)應(yīng)的所有靶點(diǎn)都列出來(lái)了,在cytoscape里刪掉那部分不屬于交集基因的。當(dāng)然你也可以直接列出各成分對(duì)應(yīng)的交集基因靶點(diǎn)(可用venny去?。?/span>
2.tape文件是疾病與各成分的交集基因靶點(diǎn)
?
14.核心靶點(diǎn)TNF,在PDB查到TNF13,TNF9,TNF14等這些,該怎么處理?
答:在uniprot里找到Gene是TNF的那個(gè)就是。然后根據(jù)這個(gè)uniprot id在PDB找即可。也可在PubMed的gene或者protein確定這個(gè)靶點(diǎn)的蛋白名稱,或者通過(guò)gene?name在string數(shù)據(jù)庫(kù)里面轉(zhuǎn)化蛋白名稱再判斷。出現(xiàn)相似的基因名可能是同一個(gè)基因家族的基因,結(jié)構(gòu)也比較相似,可以根據(jù)受體蛋白的選擇方式適當(dāng)比較選擇。
?
15.請(qǐng)問(wèn)除了TCMSP、TCMIP、HERB數(shù)據(jù)庫(kù)可以查中藥成分,還有其它的嗎?(如找某種礦物藥沒(méi)找到,也試以下其它數(shù)據(jù)庫(kù))除在TTD數(shù)據(jù)庫(kù)搜索疾病靶點(diǎn),還有哪些數(shù)據(jù)庫(kù)?
答:成分搜取數(shù)據(jù)庫(kù)有?TCM@Taiwan(http://tcm.cmu.edu.tw)???The?Encyclopedia?of?Traditional?Chinese?Medicine?(http://www.nrc.ac.cn:9090/ETCM/)???SymMap(https://www.symmap.org/)???HIT(http://lifecenter.biosino.org/hit/)???Batman-TCM(http://bionet.ncpsb.org.cn/batman-tcm/)???YaTCM(http://cadd.pharmacy.nankai.edu.cn/yatcm/home)???NPACT(http://crdd.osdd.net/raghava/npact/)???NPASS(http://bidd2.nus.edu.sg/NPASS)???CHEM-TCM(http://www.chemtcm.com/)???TCM-ID(http://bidd.nus.edu.sg/group/TCMsite/)
相應(yīng)的疾病基因靶點(diǎn)數(shù)據(jù)庫(kù)還有:Genecards,OMIM,DisGENet等
?
16.找的一個(gè)中藥的成分,在TCMSP網(wǎng)站按照OB值≥30%,DL≥0.18,篩選出7個(gè)成分。但這7個(gè)成分里只有1個(gè)能夠在pubchem中找到Isomeric?SMILES,這個(gè)成分在SwissTargetPrediction中下載了成分基因表格。剩下的6個(gè)成分中,按照視頻教程,有3個(gè)通過(guò)TCMSP找出related?targets并進(jìn)入uniport尋找基因名,并建立好表格。最后剩下3個(gè)成分,完全沒(méi)有相關(guān)靶點(diǎn)信息?
答:1.實(shí)在不能一個(gè)數(shù)據(jù)庫(kù)找全的,可以選取其他數(shù)據(jù)庫(kù)找成分及靶點(diǎn) 2.找不到對(duì)應(yīng)SMILES號(hào),可以TCMSP下載MOL2文件轉(zhuǎn)換SDF格式/還有模型轉(zhuǎn)化為SMILES號(hào)(百度有網(wǎng)頁(yè)版在線轉(zhuǎn)換)導(dǎo)入SWISS進(jìn)行靶點(diǎn)預(yù)測(cè),或者自己畫(huà)結(jié)構(gòu)。(可參考11問(wèn)的其他方法)
?
17.在TCMSP里按照OB,DL設(shè)置后,比如當(dāng)歸,只剩下兩種成分了,這樣會(huì)不會(huì)把一些有效成分篩選掉?
答:一:建議是把握住能把握的,能夠明確知道的幾個(gè)直接作用你目的疾病,雖然少但是相對(duì)來(lái)說(shuō)范圍縮小了,富集結(jié)果不會(huì)太分散,分析的過(guò)程也是在不斷篩選最有可能的作用機(jī)制,盡量不要有太多干擾的因素,網(wǎng)藥的局限性是已知的信息,把握能夠獲取到的能夠有支撐的,未知的難以把握,精力也有限,與你疾病越相關(guān)理論上預(yù)測(cè)結(jié)果也越靠近,但是最終還是要回歸實(shí)驗(yàn)的驗(yàn)證,平臺(tái)的網(wǎng)藥是各個(gè)成分的組合,而實(shí)際上的復(fù)方組成不僅復(fù)雜,還有配伍、炮制等產(chǎn)生的作用,以及機(jī)體本身,這些都無(wú)法給出。
二:還有你收集文獻(xiàn),中文的少就試試外文的,還有檢索方式等等,如果做不到收集的又準(zhǔn)又全,那建議就單獨(dú)降低標(biāo)準(zhǔn)OB小于等于20、DL大于等于0.1,范圍放大一點(diǎn)點(diǎn),后續(xù)再進(jìn)行分析篩選。
?
18.用TCMSP經(jīng)過(guò)ob和dl(30和0.18)篩選剩3個(gè)成分
各位大佬,請(qǐng)問(wèn)一個(gè)中藥用herb數(shù)據(jù)庫(kù)篩選相對(duì)分子量小于等于500后剩8個(gè)成分,再用lipinsk五原則篩選后剩4個(gè)還有必要做下去嗎?
答:與17問(wèn)疑惑相同,建議查詢篩去的成分是否與疾病直接相關(guān)再做取舍,不要局限于數(shù)值的限定,另數(shù)據(jù)庫(kù)有限,還可查閱文獻(xiàn)資料搜索成分加以補(bǔ)充。
?
19.請(qǐng)問(wèn)一下對(duì)于這種帶Cl離子化合物的SMILES號(hào),在Swisstargetprediction庫(kù)檢索不出來(lái)怎么辦?主要問(wèn)題是提供的smiles號(hào)和圖片上傳到Swisstargetprediction后,它說(shuō)提供了多個(gè)分子號(hào),那個(gè)Cl和其他的并不是連接到一起的,但是我手動(dòng)刪除也感覺(jué)不太對(duì),像是變成了另一個(gè)化學(xué)式。(芍藥-3-阿拉伯糖苷Peonidin-3-arabinoside,COC1=C(C=CC(=C1)C2=[O+]C3=CC(=CC(=C3C=C2OC4C(C(C(CO4)O)O)O)O)O)O.[Cl-])
答:1.有嘗試過(guò)2D結(jié)構(gòu)圖導(dǎo)入庫(kù)中也檢索不出來(lái);是中草藥的主要成分的話,這個(gè)就要你自己考慮了先排除了或看看tcmsp等其它數(shù)據(jù)庫(kù)有沒(méi)有該成分對(duì)應(yīng)靶點(diǎn);2.碰到這種加了氯離子或者碘離子的,只要能載pubchem里找到就好辦直接輸入cas號(hào)或者分子名稱找到符合的點(diǎn)開(kāi),其實(shí)它就是一個(gè)整體和氯離子或碘離子組合在一起的,點(diǎn)進(jìn)去的話有分開(kāi)的結(jié)構(gòu)式,用不含離子那個(gè)結(jié)構(gòu)式就行。然后你再比對(duì)一下tcmsp上的。3.我遇到的基本分子量哪些是吻合的(6月8日記錄);你可以試一下加氯離子之后預(yù)測(cè)的靶點(diǎn)和不加氯離子的靶點(diǎn)出來(lái)以后得結(jié)果是不是一樣的。
?
20.成分靶點(diǎn)基因的獲得的兩種方法:一是獲得pubchem?CID,在Pubchem里找Isomeric?SMILES到再導(dǎo)入swisstargetprediction獲得;二是復(fù)制TCMSP的靶點(diǎn)名稱全名再用Uniprot轉(zhuǎn)換成靶點(diǎn)基因,但是有時(shí)候這兩種方法做出來(lái)的結(jié)果不一樣。這兩種方法哪種更準(zhǔn)確一些呢?
答:不同數(shù)據(jù)庫(kù)算法不一樣,TCMSP的靶點(diǎn)來(lái)自drugbank,可能不全;swisstargetprediction主要針對(duì)靶點(diǎn)獲取而開(kāi)發(fā),缺點(diǎn)是需要對(duì)應(yīng)SMILES或畫(huà)出結(jié)構(gòu)等數(shù)據(jù)庫(kù)各有優(yōu)勢(shì)。相應(yīng)的還有其他數(shù)據(jù)庫(kù)可以選擇視頻有介紹。
?
21.如想做精油中100多種化合物對(duì)皮膚炎癥的網(wǎng)絡(luò)藥理學(xué),是不是可以將所有化合物的靶點(diǎn)結(jié)合起來(lái),然后與疾病靶點(diǎn)做一個(gè)交集?
答:可以,只是工作量有點(diǎn)大了。這些化合物都是有效成分嗎(是否經(jīng)過(guò)篩選),是否對(duì)治療疾病有意義。
?
22.請(qǐng)問(wèn)我在ETCM里面,找到的藥物成分,和在CAS化源網(wǎng)里面找到的同名成分分子量不一樣,怎么辦?
答:最重要的是看結(jié)構(gòu)和相對(duì)分子質(zhì)量是否一致。