最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

諾華公司小分子篩選平臺設(shè)計的演變【02】

2023-07-05 10:48 作者:AIDDPro  | 我要投稿

生物和化學(xué)結(jié)構(gòu)空間覆蓋

1.1 生物靶點(diǎn)分類

個別生物靶點(diǎn)生物活性數(shù)據(jù)是從一個名為 "hithub?"的內(nèi)部系統(tǒng)獲得的。該系統(tǒng)包括來自不同來源的生物活性數(shù)據(jù),如ChEMBL、Clarivate Integrity和GOSTAR。對于每個靶點(diǎn),定義了兩個化合物類別。第一類包括所有與靶點(diǎn)相互作用的化合物,無論其化學(xué)結(jié)構(gòu)如何,其活性要求為AC50在靶點(diǎn)上≤10μM。第二類是基于考慮效力和選擇性標(biāo)準(zhǔn)的綜合得分。這一類的目的是通過結(jié)合多種來源的數(shù)據(jù)來確定對其他靶點(diǎn)具有高選擇性的強(qiáng)效化合物。第一類通常包含來自更嚴(yán)格的第二類的化合物。使用慷慨和嚴(yán)格的分類方法可以在第二類是空的或更嚴(yán)格的一類包含不太有利的特性時識別化合物。如果需要,這種方法可以從更寬松的類別中選擇可溶和可滲透的化合物。

1.2 生物化合物空間分類

為了補(bǔ)充按單個靶點(diǎn)對化合物進(jìn)行分組的做法,可以利用跨越多個靶點(diǎn)或檢測的生物特征數(shù)據(jù)。當(dāng)有實(shí)驗(yàn)數(shù)據(jù)時,可使用HTS Fingerprints高含量篩選FPs等實(shí)驗(yàn)資料,而當(dāng)缺乏實(shí)驗(yàn)數(shù)據(jù)時,可采用預(yù)測模型推斷的生物資料。在這種情況下,使用從輪廓QSAR(pQSAR)推斷的活性概況和從多分類天真貝葉斯模型推斷的二元活性預(yù)測。為了從這些活性概況中獲得離散的類別,使用馬爾科夫聚類算法(MCL),一種圖聚類算法進(jìn)行聚類。構(gòu)建相似性圖,如果兩個化合物的輪廓呈現(xiàn)出高于所選截止值的皮爾遜相關(guān)性,則在它們之間創(chuàng)建一條邊。每個活動特征數(shù)據(jù)集都被單獨(dú)聚類。每種類型的聚類數(shù)量是平衡的,以確保平等的權(quán)重,目標(biāo)是每一種類型的聚類大約30-50k??刂屏6鹊腗CL聚類的 "膨脹 "參數(shù)也相應(yīng)地被選擇。

1.3 化學(xué)空間分類

為了確保生物活性空間的覆蓋,并適應(yīng)需要不同化學(xué)類型的新靶點(diǎn),NIBR開發(fā)了一個基于規(guī)則的骨架分類系統(tǒng),稱為骨架樹和骨架網(wǎng)絡(luò)。這種分類法以化學(xué)結(jié)構(gòu)為基礎(chǔ),根據(jù)特定(子)骨架的存在將化合物分配到各個類別。產(chǎn)生眾多小類的較大的骨架被排除在外,而單子骨架則被忽略。為了解決缺乏環(huán)狀核心的結(jié)構(gòu),納入了兩個基于直徑為4的擴(kuò)展連接指紋(ECFP_4)的分類。使用MCL算法計算了相似性圖并進(jìn)行了聚類。從文本挖掘技術(shù)中借來的化學(xué)主題模型,也被用來將化合物組織成特定的 "主題 "或化學(xué)系列。為了捕捉三維形狀信息,利用了形狀分類模型。在早期版本中,使用了基于低能量構(gòu)象的慣性原理的形狀分類。形狀三角形中的網(wǎng)格單元作為形狀分類。在后來的版本中,F(xiàn)astROCS軟件與高度并行的計算相結(jié)合,使ROCS三維組合得分相似性圖的計算成為可能。這種形狀表示法同時考慮了構(gòu)象靈活性和藥理特征。總的來說,這些分類系統(tǒng)提供了一個全面的框架來組織基于骨架、化學(xué)主題和三維形狀的化合物,加強(qiáng)了對化學(xué)空間的理解,促進(jìn)了對生物活性空間的多樣化覆蓋。

1.4 人工策劃的分類

除了計算上的分類,化學(xué)家的背景知識也通過額外的分類被納入。這些分類來自于三個來源:

  1. 項(xiàng)目代碼:在注冊期間,化合物被分配了基于控制詞匯的項(xiàng)目代碼。雖然這些代碼可能不代表同質(zhì)的化學(xué)系列,但它們確實(shí)反映了預(yù)期的生物活性,即使不一定被觀察到。

  2. 化合物系列和收藏夾(CS&F)數(shù)據(jù)庫:這個內(nèi)部數(shù)據(jù)庫允許藥物化學(xué)家定義化學(xué)系列,并將標(biāo)志性的化合物和支架子結(jié)構(gòu)查詢分配給它們。對候選藥物的優(yōu)化進(jìn)展進(jìn)行注釋,并提供化合物或支架之間的關(guān)系定義?;瘜W(xué)家對一個化學(xué)系列的起點(diǎn)進(jìn)行標(biāo)記,通常是對篩選結(jié)果進(jìn)行標(biāo)記。為每個CS&F系列創(chuàng)建一個成員列表,將單獨(dú)分配的化合物和與該系列的子結(jié)構(gòu)查詢相匹配的化合物結(jié)合起來。

  3. 庫代碼:通過組合或平行方法合成的化合物被分配到特定的庫代碼。每個庫代碼對應(yīng)于一個包含所有用它注釋的化合物的類別。

這些由化學(xué)家提供的額外分類增強(qiáng)了計算分類,有助于選擇不同的化合物類別,利用他們在藥物化學(xué)方面的背景知識和專業(yè)知識。

迭代的化合物選擇過程

該算法的目標(biāo)是將定義的類作為覆蓋目標(biāo)進(jìn)行迭代,從每個類中選擇排名最好的復(fù)合樣本,并多次重復(fù)這一循環(huán)。該算法對分類的來源是不可知的,把每個類當(dāng)作一組樣本。適當(dāng)?shù)靥幚砣哂嗍呛苤匾模员苊鈴牟煌姆诸惙桨钢羞x擇高度重疊的化合物。

當(dāng)一個化合物根據(jù)其在一個類別中的化合物資格被選擇時,該化合物所屬的所有其他類別也被認(rèn)為被覆蓋,導(dǎo)致潛在的 "連帶覆蓋"。為了彌補(bǔ)這一點(diǎn),在隨后的幾輪中會停止從受影響的類中進(jìn)行選擇,直到類的數(shù)量恢復(fù)到目標(biāo)。考慮到類的大小也是至關(guān)重要的。由于化學(xué)聚類大小的分布,聚類往往會產(chǎn)生大量的單個化合物和小聚類。為了防止在最初的迭代中挑選出不切實(shí)際的化合物數(shù)量,可以將抽樣限制在某個最小規(guī)模以上的聚類。這種選擇是合理的,因?yàn)檩^大集群的代表為后續(xù)篩選和迭代過程提供了更多機(jī)會。一旦化合物被按屬性排序并被分配到覆蓋等級,并且定義了每個迭代的最小集群大小,選擇算法就會被執(zhí)行以產(chǎn)生多樣性網(wǎng)格。然而,不是以細(xì)粒度的方式將化合物分配到平板上,而是通常的做法是將多個采選輪次組合在一起,形成規(guī)模逐步增大的平板子集(例如,50k、125k、250k、500k和滿甲板)。這種方法可以實(shí)現(xiàn)目標(biāo)板塊的大小,是項(xiàng)目組篩選時的首選。

結(jié)果

第一個篩選平臺創(chuàng)建于2015年,2019年根據(jù)四年來篩選實(shí)踐的經(jīng)驗(yàn),開發(fā)了一個修改版。

在2015年的版本中,采用了細(xì)粒度的屬性排序方法,通過帕累托排序?qū)⒍鄠€目標(biāo)結(jié)合起來。在排名中明確使用了分子量(MW)和clogP,目標(biāo)是在MW 150至350和clogP 1至3的范圍內(nèi),這在當(dāng)時被認(rèn)為是理想的熱門分子。不理想的亞結(jié)構(gòu)、低溶解度和低滲透性被作為負(fù)面標(biāo)志。頻繁先導(dǎo)化合物的標(biāo)志也被納入排名中。2015年的排名顯示出對低分子量(<350 Da)和頂級類別(A和B)中1-3的clogP范圍的強(qiáng)烈偏愛,使這些化合物片段化。然而,與C類相比,人們擔(dān)心這些類別的命中率降低,表明化合物的多樣性不平衡。在2019年版本中,根據(jù)觀察到的2015年deck的局限性,改變了排名標(biāo)準(zhǔn)。高溶解度高滲透性被引入作為A列的積極選擇標(biāo)準(zhǔn)。分子量和clogP不再直接考慮排名,但較低的MW和clogP對于實(shí)現(xiàn)良好的滲透性和溶解度仍然是有利的。這一變化對2019年deck的前兩列和前三行的化學(xué)起點(diǎn)的豐富性產(chǎn)生了積極影響。在2019年中加入了計算的生物特征,對天然產(chǎn)物集合的處理,以及對外部合作的篩選子集的應(yīng)用。總的來說,2019年版本中的修改旨在解決2015年牌中觀察到的局限性,提高命中率,并提高藥物化學(xué)優(yōu)化項(xiàng)目的化學(xué)起點(diǎn)的多樣性和質(zhì)量。

結(jié)論

2019年的篩選平臺網(wǎng)格是NIBR基于平板多樣性驅(qū)動的子集篩選的主要來源。它被用于整個NIBR基地的各種生化和細(xì)胞檢測,每年有50-100個子集篩選,篩選的化合物超過50,000個。該網(wǎng)格的設(shè)計涵蓋了不同的目標(biāo)并擁有適當(dāng)?shù)幕衔锾匦浴6ㄆ趶?fù)制該牌子可以進(jìn)行機(jī)構(gòu)學(xué)習(xí)。從2015年平臺的學(xué)習(xí)導(dǎo)致了對溶解性和滲透性的關(guān)注,作為化合物吸引力的決定因素?;谕茢嗟纳锘钚缘臋C(jī)器學(xué)習(xí)模型和聚類被納入2019年的方法中,加強(qiáng)了多樣性的選擇。篩選者和項(xiàng)目組的溝通和教育被認(rèn)為是關(guān)鍵。發(fā)現(xiàn)C列有最高的幾率為困難的目標(biāo)類確定起點(diǎn)。2019年的篩選平臺被認(rèn)為是很平衡的,能夠?qū)崿F(xiàn)多樣性驅(qū)動的子集和迭代篩選。

參考資料:

Schuffenhauer, Ansgar et al. "Evolution Of Novartis' Small Molecule Screening Deck Design", <i>Journal of medicinal chemistry</i> 63.23 (2020): 14425-14447.

版權(quán)信息

本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺,如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯誤解讀,請及時聯(lián)系A(chǔ)IDD Pro (請?zhí)砑游⑿盘杝ixiali_fox59)進(jìn)行刪改處理。

原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺。有問題可發(fā)郵件至sixiali@stonewise.cn


諾華公司小分子篩選平臺設(shè)計的演變【02】的評論 (共 條)

分享到微博請遵守國家法律
乳山市| 兴海县| 林周县| 海林市| 乐业县| 衡阳市| 美姑县| 平潭县| 加查县| 封丘县| 台北县| 搜索| 阿坝县| 福安市| 津南区| 盐源县| 溧水县| 禄丰县| 江阴市| 都江堰市| 鸡东县| 田林县| 澄城县| 福州市| 桑日县| 蓝田县| 新民市| 常宁市| 利川市| 饶河县| 平舆县| 二连浩特市| 福安市| 苍南县| 长垣县| 上虞市| 石景山区| 新昌县| 安新县| 丹东市| 蛟河市|