JCIM | 細胞色素P450 3A7選擇性抑制劑和底物的預(yù)測模型
今天介紹的是美國國立衛(wèi)生研究院(NIH)于2023年1月發(fā)表在Journal of Chemical Information and Modeling的一篇論文:《Predictive Models for Human Cytochrome P450 3A7 Selective Inhibitors and Substrates》。本研究旨在利用化學(xué)結(jié)構(gòu)分析建立“First-in-Class”的預(yù)測模型,用于預(yù)測細胞色素P450(CYP)3A亞家族抑制劑和底物,以區(qū)分藥物對胎兒/新生兒和成人的作用。

研究背景
細胞色素P450是最廣為人知的藥物代謝酶之一,參與了大多數(shù)臨床藥物的代謝。在人類肝臟中,細胞色素P450 3A亞家族是最豐富的一類,其表達在發(fā)育過程中發(fā)生變化,特征是在出生后不久就從細胞色素P450 3A7轉(zhuǎn)變?yōu)榧毎?strong>P450 3A4。這些變化提供了一種潛在的方法,可以區(qū)分藥物對胎兒/新生兒和成人的影響。由于藥物既可以作為CYP抑制劑,也可以作為底物,了解藥物代謝和抑制對將藥物不良反應(yīng)和藥物相互作用(DDI)的可能性降至最低至關(guān)重要。然而,至今尚未報道有關(guān)CYP3A7預(yù)測模型的研究。
在以往的建模工作中,主要集中在預(yù)測細胞色素P450酶的抑制物或底物,而忽略了與發(fā)育階段相關(guān)的異構(gòu)體。本研究收集了5000種已知藥物和生物活性分子與CYP酶的結(jié)合數(shù)據(jù),以及3300組~3A4和~3A7的CYP3A亞家族的代謝穩(wěn)定性數(shù)據(jù)?;谶@些數(shù)據(jù),作者確定了CYP3A7特異性抑制劑和底物,并建立了相對于CYP3A4的CYP3A7抑制劑/底物預(yù)測模型。作者嘗試了各種機器學(xué)習(xí)算法和特征選擇方法,以獲得最佳的模型,并針對每種抑制劑/底物類型進行預(yù)測。這些模型可以用于篩選大量的新的類藥化合物,以確定它們可能對胎兒/新生兒產(chǎn)生的潛在影響。此外,與CYP3A7特異性抑制劑/底物相關(guān)的化學(xué)特征可以為藥物的發(fā)現(xiàn)和開發(fā)提供指導(dǎo)。
化學(xué)結(jié)構(gòu)表征及模型構(gòu)建
將化合物的化學(xué)結(jié)構(gòu)轉(zhuǎn)換為兩種常用的結(jié)構(gòu)指紋,即ECFP4和ToxPrint。其中,ECFP4用于構(gòu)建分類模型,而ToxPrint用于識別對CYP3A7/CYP3A4活性重要的結(jié)構(gòu)特征。利用Fisher精確檢驗,通過ToxPrint指紋確定每個結(jié)構(gòu)特征對于CYP3A7/CYP3A4的顯著性,p值<0.05則被視為統(tǒng)計顯著性。
為了篩選每個CYP3A7/CYP3A4抑制劑/底物類別的特征,作者在五個不同的p值截斷值(從0.01到0.05)下進行了篩選。作者使用了五種分類方法,包括樸素貝葉斯(NB)、神經(jīng)網(wǎng)絡(luò)(NNET)、隨機森林(RF)、支持向量機(SVM)和極度梯度提升樹(XGboost)。每個模型都使用了五倍交叉驗證進行評估,并使用了四種抽樣方法進行平衡數(shù)據(jù)集,包括下采樣、上采樣、ROSE和SMOTE。
數(shù)據(jù)來源
作者購買了CYP3A4 (產(chǎn)品編號:456202)、CYP3A7 (產(chǎn)品編號:456237)、NADPH 和AXYGEN試劑。用于實驗的化合物組來自NCATS的~2,800種藥物和NCATS中帶有生物活性標(biāo)簽的~2,200種類藥化合物。CYP3A7/CYP3A4 抑制試驗與先前研究 (PubChem AID: 1851) 中描述的方案相同,出于建模目的,曲線等級小于-1為是活性(1),否則被認為是非活性的(0)。在代謝穩(wěn)定性測定中,底物一般可以在短時間內(nèi)代謝,出于分類目的,t1/2?< 30min為底物,t1/2?> 30min為非底物。其他化合物 (~10%)具有不確定性,應(yīng)在建模中忽略。
實驗結(jié)果
4.1 CYP3A4和CYP3A7抑制劑/底物數(shù)據(jù)集
本研究中,共包括4511個藥物樣品,這些樣品在抑制實驗中被鑒定為活性抑制劑或非活性物質(zhì),以及子集中的3381個樣品在代謝穩(wěn)定性實驗中被鑒定為底物或非底物。這些樣品在兩種實驗中的活性數(shù)據(jù)如圖1所示,其中使用曲線排名表示化合物的抑制效應(yīng),使用代謝半衰期(t1/2 min)表示化合物的代謝穩(wěn)定性。

CYP3A4和CYP3A7數(shù)據(jù)集分為兩類:活性數(shù)據(jù)集和選擇性數(shù)據(jù)集(圖2)。活性數(shù)據(jù)集包括CYP3A4抑制劑、CYP3A7抑制劑、CYP3A4底物和CYP3A7底物。選擇性數(shù)據(jù)集包括CYP3A7選擇性抑制劑(對CYP3A4)、CYP3A7底物(非抑制劑)、CYP3A7抑制劑(非底物)和CYP3A7選擇性底物(對CYP3A4)。

4.2 預(yù)測CYP3A4和CYP3A7抑制劑/底物
圖三總結(jié)了在不同數(shù)據(jù)集上,不同模型的預(yù)測結(jié)果。其中RF在CYP3A4和CYP3A7抑制劑預(yù)測方面表現(xiàn)最好,SVM在CYP3A4和CYP3A7底物預(yù)測方面表現(xiàn)最好。數(shù)據(jù)重新平衡有助于提高某些模型的性能,但對某些模型沒有影響。

4.3 顯著的結(jié)構(gòu)特征
作者鑒定出128個結(jié)構(gòu)特征用于CYP3A7/CYP3A4的活性(抑制劑或底物)或選擇性,這些特征通過ToxPrint定義(圖4)。對于每個CYP3A7/CYP3A4活性類別,顯著化學(xué)特征的數(shù)量按升序排列,分別為:CYP3A7/CYP3A4常見底物(19個)、CYP3A4選擇性底物(29個)、CYP3A7選擇性抑制劑(29個)、CYP3A7選擇性底物(31個)、CYP3A7/CYP3A4常見抑制劑(31個)和CYP3A4選擇性抑制劑(35個)。在表1中,突出顯示了包含這些顯著特征的代表性化學(xué)結(jié)構(gòu)。


結(jié)論
本研究通過一個生物發(fā)光抑制性酶反應(yīng)的高通量篩選,對大約5000個藥物樣品在人類CYP3A4和CYP3A7同工酶中進行了藥代動力學(xué)評估,并對其中的約3300個化合物進行了CYP底物的代謝穩(wěn)定性測試。結(jié)果得到了大量可靠的數(shù)據(jù),為開發(fā)和評估預(yù)測模型提供了堅實的基礎(chǔ)。研究中應(yīng)用了五種監(jiān)督式機器學(xué)習(xí)算法(NB,NNET,RF,SVM和XGBoost)構(gòu)建了CYP3A7抑制劑/底物的預(yù)測模型,并以CYP3A4作為比較基準(zhǔn)。研究還通過特征篩選方法縮減維度,以解決高維數(shù)據(jù)處理的問題,并通過四種數(shù)據(jù)重平衡方法解決數(shù)據(jù)不平衡問題。最終,該研究成功地開發(fā)出了精確、魯棒的預(yù)測模型,可以預(yù)測CYP3A7和CYP3A4抑制劑/底物類別,并對相關(guān)藥物代謝和開發(fā)新藥物具有一定的指導(dǎo)意義。
參考文獻
Xu T, Kabir M, Sakamuru S, et al. Predictive Models for Human Cytochrome P450 3A7 Selective Inhibitors and Substrates. J Chem Inf Model. 2023;63(3):846-855. doi:10.1021/acs.jcim.2c01516
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點僅代表作者本人觀點,不代表AIDD Pro平臺,如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵擾或者其他信息錯誤解讀,請及時聯(lián)系A(chǔ)IDD Pro (請?zhí)砑游⑿盘杝ixiali_fox59)進行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺。有問題可發(fā)郵件至sixiali@stonewise.cn