最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

利用主動(dòng)學(xué)習(xí)方法高效設(shè)計(jì)肽結(jié)合聚合物

2023-06-27 09:37 作者:AIDDPro  | 我要投稿

本文討論了主動(dòng)學(xué)習(xí)(AL)算法在化學(xué)研究領(lǐng)域的應(yīng)用。傳統(tǒng)的機(jī)器學(xué)習(xí)(ML)模型需要大量的標(biāo)記數(shù)據(jù)集進(jìn)行訓(xùn)練,但在化學(xué)領(lǐng)域,獲得這樣的數(shù)據(jù)集十分困難。主動(dòng)學(xué)習(xí)解決了這個(gè)問(wèn)題。

01 主動(dòng)學(xué)習(xí)

用于解決分類問(wèn)題的機(jī)器學(xué)習(xí),如今已經(jīng)是很熟悉的話題了,我們知道所有分類模型都需使用標(biāo)記樣本訓(xùn)練,并且分類模型的效果依賴于標(biāo)記樣本的質(zhì)量。一個(gè)好的分類模型離不開(kāi)大量?jī)?yōu)質(zhì)的訓(xùn)練數(shù)據(jù),但是在實(shí)際應(yīng)用條件下,我們得到的數(shù)據(jù)往往都是沒(méi)有經(jīng)過(guò)處理的,而數(shù)據(jù)的處理是一項(xiàng)相當(dāng)龐大且繁瑣的工作,并且有時(shí)候還需要一些專業(yè)人士才能處理,因此需要耗費(fèi)巨大的人力成本和時(shí)間成本?;诖?,在機(jī)器學(xué)習(xí)領(lǐng)域中,提出主動(dòng)學(xué)習(xí)方法,優(yōu)化分類模型。

主動(dòng)學(xué)習(xí)算法會(huì)通過(guò)某些方法找到樣本數(shù)據(jù)中最有價(jià)值的數(shù)據(jù),然后我們把刪選出來(lái)的數(shù)據(jù)交由專家進(jìn)行人工標(biāo)注后,將標(biāo)注后的數(shù)據(jù)放入訓(xùn)練集對(duì)分類模型進(jìn)行迭代優(yōu)化訓(xùn)練,這一過(guò)程稱為主動(dòng)學(xué)習(xí)。簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)中的主動(dòng)學(xué)習(xí)能夠用更少的人工成本獲取更有價(jià)值的標(biāo)記樣本從而使分類器具有更好的泛化性能。和以往被動(dòng)學(xué)習(xí)算法不同的是,主動(dòng)學(xué)習(xí)算法會(huì)根據(jù)某一些策略將未標(biāo)記樣本中的一部分樣本進(jìn)行標(biāo)記,然后重新投入訓(xùn)練集中,用來(lái)輔助分類器的訓(xùn)練。AL已經(jīng)被用于分子和材料設(shè)計(jì)中,通過(guò)優(yōu)化所需的屬性來(lái)加速發(fā)現(xiàn)有前途的候選物。用于測(cè)試的候選物要么是通過(guò)計(jì)算預(yù)測(cè)和實(shí)驗(yàn)測(cè)試重新生成的,要么是從現(xiàn)有數(shù)據(jù)中選擇的。候選物的選擇是基于最大化模型性能("探索")或針對(duì)特定屬性("開(kāi)發(fā)")。AL已經(jīng)在各個(gè)領(lǐng)域找到了應(yīng)用,包括預(yù)測(cè)反應(yīng)產(chǎn)量、發(fā)現(xiàn)有機(jī)半導(dǎo)體、尋找具有特定性質(zhì)的材料、設(shè)計(jì)成像劑、預(yù)測(cè)量子化學(xué)性質(zhì)和幫助藥物發(fā)現(xiàn)。雖然許多研究從大量的初始數(shù)據(jù)集開(kāi)始,但也有一些例子表明AL從極小的數(shù)據(jù)集開(kāi)始,即使在數(shù)據(jù)稀缺的情況下也顯示出它的有效性。

02 主動(dòng)學(xué)習(xí)(AL)在基于聚合物的藥物輸送系統(tǒng)設(shè)計(jì)中的應(yīng)用

在藥物輸送系統(tǒng)領(lǐng)域,實(shí)驗(yàn)數(shù)據(jù)是有限的,而且實(shí)驗(yàn)成本很高,AL的使用可以幫助研究人員更好地設(shè)計(jì)實(shí)驗(yàn)。AL輔助建模的主要目的是快速識(shí)別具有改進(jìn)特性的給藥系統(tǒng),而不是像傳統(tǒng)的機(jī)器學(xué)習(xí)方法那樣使預(yù)測(cè)能力最大化。

AL被整合到一個(gè)迭代的設(shè)計(jì)策略中,最初的小型數(shù)據(jù)集被用來(lái)開(kāi)發(fā)一個(gè)起始模型。然后,這個(gè)模型被用來(lái)建議新的設(shè)計(jì)和實(shí)驗(yàn),這些設(shè)計(jì)和實(shí)驗(yàn)隨后被用來(lái)更新模型,提高精確度。目標(biāo)是利用計(jì)算和實(shí)驗(yàn)工具對(duì)龐大的設(shè)計(jì)空間進(jìn)行智能采樣,以有效地確定所需產(chǎn)品。設(shè)計(jì)過(guò)程考慮到各種參數(shù),如聚合物和藥物結(jié)構(gòu),以及實(shí)驗(yàn)條件。研究重點(diǎn)是發(fā)現(xiàn)能夠選擇性地結(jié)合特定肽或小分子的合成聚合物。這些聚合物有可能被用作異種生物的清除劑、靶向傳遞系統(tǒng)或藥物溶解度的增強(qiáng)劑。由于數(shù)據(jù)有限和稀少,傳統(tǒng)的定量結(jié)構(gòu)-活性關(guān)系(QSAR)模型無(wú)法應(yīng)用,這種情況AL明顯更為適用。

為了驗(yàn)證所提出的方法,作者選擇了ASGPR作為分子識(shí)別篩選的靶點(diǎn)。ASGPR參與各種生物過(guò)程,在很多的疾病中已成為藥物輸送的靶點(diǎn)?;诖蠓肿拥淖R(shí)別系統(tǒng)在特異性、穩(wěn)定性和克服與小分子藥物相關(guān)的挑戰(zhàn)方面具有優(yōu)勢(shì)。該研究旨在設(shè)計(jì)一種基于聚合物的靶向分子,用于肝臟疾病的定向治療和預(yù)防ASGPR靶向與病原體的相互作用。

03 方法

該研究采用隨機(jī)森林回歸(RFR)、隨機(jī)森林分類(RFClf)和高斯過(guò)程回歸(GPR)方法建立定量結(jié)構(gòu)-屬性關(guān)系(QSPR)模型。最初的數(shù)據(jù)集是隨機(jī)選擇的,或者通過(guò)選擇不同的對(duì)象。測(cè)試了不同的主動(dòng)學(xué)習(xí)策略,包括利用、探索、混合選擇、隨機(jī)選擇和一個(gè)假設(shè)的完美策略。這些策略的性能是根據(jù)模型的準(zhǔn)確性和候選人的改進(jìn)來(lái)評(píng)估的。實(shí)驗(yàn)涉及使用Biacore X100機(jī)器和兔肝的ASGPR進(jìn)行ASPGR結(jié)合測(cè)量。KD值使用1:1關(guān)聯(lián)模型進(jìn)行評(píng)估。

04 結(jié)果

本研究介紹了一種將經(jīng)典的機(jī)器學(xué)習(xí)方法與主動(dòng)學(xué)習(xí)(AL)相結(jié)合的方法,利用最小的實(shí)驗(yàn)測(cè)量發(fā)現(xiàn)具有所需特性的化合物。AL策略(Y-MAX、Y-VAR、混合Y-MAX-Y-VAR)的性能與隨機(jī)選擇和假設(shè)的完美策略在回歸和分類情況下進(jìn)行了比較?;旌蟉-MAX-Y-VAR策略顯示出最好的性能,平衡了探索和利用。研究發(fā)現(xiàn),在探索小的化學(xué)空間時(shí),分類建模在AL中更有效率。

與以前的研究相比,AL方法需要的數(shù)據(jù)量較小,取得了類似的性能。AL算法被成功地應(yīng)用于尋找選擇性地與蛋白質(zhì)目標(biāo)結(jié)合的聚合物。它強(qiáng)調(diào)了AL對(duì)于高效和成本效益的設(shè)計(jì)活動(dòng)的潛力。該研究的結(jié)論是,AL指導(dǎo)下的用于藥物輸送的聚合物材料的開(kāi)發(fā)提供了多種好處,在保持準(zhǔn)確性的同時(shí)減少了數(shù)據(jù)要求。該方法可以使用可獲得的計(jì)算工具輕松實(shí)現(xiàn),并有可能在藥物輸送系統(tǒng)開(kāi)發(fā)中得到更廣泛的應(yīng)用。參考資料:https://blog.csdn.net/it_is_me_a/article/details/103477074

Rakhimbekova A, Lopukhov A, Klyachko N, et al. Efficient design of peptide-binding polymers using active learning approaches[J]. Journal of Controlled Release, 2023, 353: 903-914.

版權(quán)信息

本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺(tái),如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯(cuò)誤解讀,請(qǐng)及時(shí)聯(lián)系A(chǔ)IDD Pro (請(qǐng)?zhí)砑游⑿盘?hào)sixiali_fox59)進(jìn)行刪改處理。

原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺(tái)。有問(wèn)題可發(fā)郵件至sixiali@stonewise.cn


利用主動(dòng)學(xué)習(xí)方法高效設(shè)計(jì)肽結(jié)合聚合物的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
全南县| 桑植县| 四平市| 伊吾县| 阜康市| 桑植县| 科技| 廉江市| 郯城县| 乌拉特后旗| 吴忠市| 陕西省| 榕江县| 大冶市| 新巴尔虎左旗| 阜新市| 凉山| 横山县| 上林县| 汤阴县| 藁城市| 宣恩县| 苏尼特左旗| 布尔津县| 平武县| 古田县| 奎屯市| 新乡市| 重庆市| 阜新市| 永新县| 城步| 南岸区| 武宣县| 澜沧| 鹰潭市| 陆川县| 伊宁市| 安康市| 兴和县| 双峰县|