人工智能賦能合成生物學(xué)——像開發(fā)軟件一樣編程生物細(xì)胞
人工智能(AI)正在改變我們理解和操縱生物系統(tǒng)的方式。傳統(tǒng)上,科學(xué)家們依賴自然選擇和進(jìn)化來(lái)發(fā)現(xiàn)和優(yōu)化蛋白質(zhì)序列。 但現(xiàn)在,AI為我們提供了一個(gè)全新的平臺(tái),使我們能夠在設(shè)計(jì)和優(yōu)化蛋白質(zhì)時(shí)超越自然的局限性。 Arzeda這家合成生物學(xué)初創(chuàng)公司的聯(lián)合創(chuàng)始人Alexandre Zanghellini強(qiáng)調(diào),人工智能為科學(xué)家提供了超越自然的蛋白序列多樣化可能性,其潛在影響是深遠(yuǎn)的,人工智能為細(xì)胞編程帶來(lái)了革命性的變革。 iSynBio造物 |?來(lái)?源 劉奕 |?作 者
01
現(xiàn)代的人工智能技術(shù)正在推動(dòng)生物學(xué)領(lǐng)域的創(chuàng)新和進(jìn)步
這種技術(shù)為生物科學(xué)家提供了一種全新的工具,使他們能夠應(yīng)用編程的方式改造生物細(xì)胞,這與軟件工程師使用編程語(yǔ)言編寫計(jì)算機(jī)代碼的過程有許多相似之處。 利用這些尖端技術(shù),研究者已經(jīng)成功地合成了一些在自然界中尚未發(fā)現(xiàn)的蛋白質(zhì)。 這種結(jié)合的一個(gè)關(guān)鍵領(lǐng)域是合成生物學(xué),它在醫(yī)學(xué)、制藥、食品科學(xué)、農(nóng)業(yè)、能源以及氣候變化研究中都正在突破傳統(tǒng)的界限。 與傳統(tǒng)的生物技術(shù)不同,合成生物學(xué)不僅僅是對(duì)現(xiàn)有生物系統(tǒng)的修改,該領(lǐng)域主要研究如何對(duì)現(xiàn)有的蛋白質(zhì)或生物材料進(jìn)行重新編程或再利用,并從零開始設(shè)計(jì)和構(gòu)建生物系統(tǒng),以實(shí)現(xiàn)預(yù)定的功能或目標(biāo)。 Biospring Partners是一家專注于對(duì)生命科學(xué)領(lǐng)域的股權(quán)投資機(jī)構(gòu),該機(jī)構(gòu)的聯(lián)合創(chuàng)始人Jennifer Lum坦言:“科學(xué)家們正在實(shí)現(xiàn)對(duì)一個(gè)細(xì)胞進(jìn)行編碼和編程,使其產(chǎn)生所需要的特定物質(zhì)?!? 這就像軟件工程師從頭開始編寫一個(gè)全新的程序,而不是僅僅修改現(xiàn)有的代碼。利用AI,生物學(xué)家可以模擬數(shù)百萬(wàn)種可能的蛋白質(zhì)結(jié)構(gòu)和功能,然后選擇最有前景的設(shè)計(jì)進(jìn)行實(shí)驗(yàn)驗(yàn)證。
圖1.合成生物學(xué)的市場(chǎng)規(guī)模和復(fù)合年化增長(zhǎng)率。照片來(lái)源:MarketsandMarkets1。
合成生物學(xué)允許科學(xué)家設(shè)計(jì)和制造定制的生物系統(tǒng),以滿足特定的需求。這種能力為各種行業(yè)提供了獨(dú)特的解決方案。 同時(shí),隨著全球?qū)沙掷m(xù)性和環(huán)境保護(hù)的關(guān)注增加,合成生物學(xué)為生產(chǎn)更加環(huán)保和可持續(xù)的產(chǎn)品提供了新的途徑。 基于這些市場(chǎng)需求,合成生物學(xué)領(lǐng)域的發(fā)展對(duì)經(jīng)濟(jì)能產(chǎn)生深遠(yuǎn)的影響。據(jù)市場(chǎng)研究機(jī)構(gòu)MarketsandMarkets的統(tǒng)計(jì)數(shù)據(jù)顯示,2022年,全球合成生物學(xué)市場(chǎng)的收入達(dá)到了114億美元。 預(yù)測(cè)顯示,到2027年,這一數(shù)字將增長(zhǎng)至357億美元,對(duì)應(yīng)的復(fù)合年化增長(zhǎng)率為25.6%。由于合成生物學(xué)的巨大潛力,越來(lái)越多的風(fēng)險(xiǎn)投資和大型企業(yè)開始投資這一領(lǐng)域,進(jìn)一步推動(dòng)了市場(chǎng)的增長(zhǎng)。 圖2.?云計(jì)算和分布式計(jì)算的興起 近年來(lái),DNA測(cè)序和合成技術(shù)的進(jìn)步使得合成生物學(xué)的研究和應(yīng)用變得更加可行和經(jīng)濟(jì)。 隨著云計(jì)算和分布式計(jì)算的興起,使得科學(xué)家們獲得了處理更大量數(shù)據(jù)的能力,并能夠以更快的速度和更大的規(guī)模進(jìn)行基因組測(cè)序,以獲取各種DNA或蛋白的合成生物學(xué)元件。 得益于強(qiáng)大的計(jì)算能力,科學(xué)家如今能夠更為精確地模擬和研究由DNA序列編碼的蛋白質(zhì)間的相互作用,并且能有更豐富的元件以設(shè)計(jì)更大規(guī)模的組合實(shí)驗(yàn)。 斯坦福大學(xué)醫(yī)學(xué)院的院長(zhǎng)及醫(yī)學(xué)事務(wù)副總裁Dr. Lloyd Minor指出:“合成生物學(xué)的深層意義在于,首先深入探索生物體的各種機(jī)制,了解來(lái)源于不同底盤細(xì)胞的特定DNA序列和及其功能。 基于這些知識(shí),科學(xué)家們將有能力對(duì)這些細(xì)胞進(jìn)行表型的操控和功能的重新設(shè)計(jì),從而實(shí)現(xiàn)特定的功能,如生產(chǎn)生物燃料或產(chǎn)生特定的抗病物質(zhì),并將這些功能應(yīng)用于各個(gè)領(lǐng)域。 隨著測(cè)序數(shù)據(jù)的增加,數(shù)據(jù)的分析和解讀變得越來(lái)越復(fù)雜。越來(lái)越多的合成生物學(xué)公司認(rèn)識(shí)到人工智能在產(chǎn)品開發(fā)生命周期中的價(jià)值,人工智能可以幫助科學(xué)家從大量的數(shù)據(jù)中快速找到有價(jià)值的信息,提高數(shù)據(jù)利用率。
02
從最初的設(shè)計(jì)階段,借助生成式人工智能模型,研發(fā)科學(xué)家可以產(chǎn)生更多的變量和選擇
在構(gòu)建和測(cè)試階段,科學(xué)家可以借助AI的預(yù)測(cè)能力,來(lái)迅速確定預(yù)期的結(jié)果,以減少哪些一定不會(huì)起效的設(shè)計(jì),實(shí)現(xiàn)更快的產(chǎn)品研發(fā)周期。 AI不僅可以在產(chǎn)品設(shè)計(jì)和測(cè)試階段發(fā)揮作用,在擴(kuò)大發(fā)酵生產(chǎn)過程中,AI可以對(duì)生產(chǎn)過程中進(jìn)行實(shí)時(shí)監(jiān)控,預(yù)測(cè)和優(yōu)化,從而提高生產(chǎn)效率和降低成本。這一過程是確保產(chǎn)品得到廣泛市場(chǎng)化應(yīng)用的關(guān)鍵環(huán)節(jié)。 David Baker教授是來(lái)自于華盛頓大學(xué)的生物化學(xué)與計(jì)算生物學(xué)專家,管理著一個(gè)先進(jìn)的人工智能指導(dǎo)蛋白設(shè)計(jì)實(shí)驗(yàn)室。 Baker實(shí)驗(yàn)室下設(shè)近80名博士研究生和博士后研究員,它是華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所的重要組成部分。 在這個(gè)實(shí)驗(yàn)室中,研究團(tuán)隊(duì)設(shè)計(jì)了多種新型蛋白質(zhì),并被用于多種應(yīng)用,如藥物開發(fā)和已在韓國(guó)獲得批準(zhǔn)的Covid疫苗——SKYCovione。 圖3.華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所的David Baker教授。照片來(lái)源:華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所2。
Dr. Baker表示,得益于深度學(xué)習(xí)技術(shù)與驗(yàn)證新蛋白質(zhì)功能的實(shí)驗(yàn)室方法的緊密結(jié)合,他所在的領(lǐng)域創(chuàng)新速度在過去兩年中已經(jīng)增長(zhǎng)了10倍。 實(shí)驗(yàn)室的研究人員正在進(jìn)行一系列項(xiàng)目,從癌癥治療到流感疫苗,以及用于治療腹瀉和克羅恩病的治療方法。 這完全是科幻小說(shuō)中所描述的場(chǎng)景,人們?nèi)匀徊桓蚁嘈胚@是真的,但這些場(chǎng)景已經(jīng)來(lái)到了現(xiàn)實(shí)。 在過去的二十年中,已有17家初創(chuàng)公司從Dr. Baker的實(shí)驗(yàn)室中創(chuàng)始,預(yù)計(jì)僅在今年就會(huì)從實(shí)驗(yàn)室中孵化出現(xiàn)三到四家新的公司。 圖4.Arzeda公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Alexandre Zanghellini。照片來(lái)源:Arzeda3。
Arzeda公司是合成生物學(xué)從實(shí)驗(yàn)室研究轉(zhuǎn)向商業(yè)市場(chǎng)應(yīng)用的典型代表,該公司迄今已籌集了5100萬(wàn)美元,并在每個(gè)西雅圖擁有65名員工。 這家初創(chuàng)企業(yè)采用人工智能蛋白質(zhì)設(shè)計(jì)技術(shù),專門設(shè)計(jì)酶和蛋白質(zhì)的序列。該技術(shù)綜合應(yīng)用了生成式AI、結(jié)合其他AI模型如判別式的AI模型,以及非AI模型的計(jì)算模型如物理建模等方法。 在實(shí)驗(yàn)室中,Arzeda驗(yàn)證了這些設(shè)計(jì)的有效性,并研發(fā)高效率的生產(chǎn)流程,在實(shí)驗(yàn)室驗(yàn)證完成后,與合同制造伙伴合作進(jìn)行放大規(guī)模的發(fā)酵生產(chǎn)。 例如,Arzeda已經(jīng)研發(fā)出一種酶,能夠提高將甜菊提取物轉(zhuǎn)化為高純度且更昂貴的甜味劑的效率。 公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官Alexandre Zanghellini指出雖然其他公司可能采用傳統(tǒng)的方法來(lái)實(shí)現(xiàn)這一轉(zhuǎn)化,但通過ProSweet酶可以被大幅度降低轉(zhuǎn)化的成本,預(yù)計(jì)該酶將在2023年的第四季度正式上市。 除了自己研發(fā)的管線之外,Arzeda還與不同的合作伙伴共同投資研發(fā)項(xiàng)目,如與聯(lián)合利華這樣的大型企業(yè)合作,進(jìn)行高效能和可持續(xù)性的洗滌酶的研發(fā)及銷售。 聯(lián)合利華是一個(gè)跨國(guó)快速消費(fèi)品公司,旗下品牌包括:Dove(多芬)、Lipton(立頓)、Knorr(家樂)等。 圖5.在巴拉圭的種植園中的甜菊幼苗。照片來(lái)源:JORGE ADORNO/路透社4。
通過大型語(yǔ)言模型、生成式AI的創(chuàng)新以及更多的數(shù)據(jù)來(lái)訓(xùn)練這些模型,合成生物學(xué)在過去三四年中開始蓬勃發(fā)展。 這是一個(gè)巨大的變化,能夠使得設(shè)計(jì)和編程合成細(xì)胞的速度五倍到十倍,這使科學(xué)家能夠超越自然中突變的效率,并找到一些全新的序列。 盡管人工智能在合成生物學(xué)領(lǐng)域取得了很多進(jìn)展,并擁有廣闊的前景,但這仍然是一個(gè)新興領(lǐng)域,與其他領(lǐng)域相比,合成生物學(xué)和生命科學(xué)在利用AI方面存在一些局限性。 一些圖像識(shí)別和語(yǔ)言模型模型,能應(yīng)用“海量的圖片數(shù)據(jù)”和互聯(lián)網(wǎng)的文本知識(shí),這些圖像和文本很容易進(jìn)行數(shù)據(jù)集的收集和清洗整理。 而在生物學(xué)和生命科學(xué)領(lǐng)域中,現(xiàn)有的數(shù)據(jù)格式并不是統(tǒng)一的,而且很大一部分?jǐn)?shù)據(jù)并不向公眾開放,并且許多重要的發(fā)現(xiàn)還是取決于科學(xué)家們孜孜不倦的探索。 人工智能在合成生物學(xué)領(lǐng)域利用AI所能取得的進(jìn)展,會(huì)取決數(shù)據(jù)上的障礙而影響其發(fā)展速度。但隨著更多的數(shù)據(jù)和標(biāo)準(zhǔn)化實(shí)驗(yàn)結(jié)果被收集,AI模型可以不斷地學(xué)習(xí)和改進(jìn),持續(xù)進(jìn)步。 此外,合成生物學(xué)產(chǎn)品仍然面臨著很多市場(chǎng)化過程中的挑戰(zhàn),其中一個(gè)直接挑戰(zhàn)是,公眾對(duì)于這些轉(zhuǎn)基因生物及微生物的擔(dān)憂。 在人工智能的幫助下,現(xiàn)在工程化生物體或生命系統(tǒng)以執(zhí)行特定行為并不特別困難,但目前公眾對(duì)這些轉(zhuǎn)基因產(chǎn)物的接受度和信任度是存在挑戰(zhàn)的。 民以食為天,尤其是在農(nóng)業(yè)和食品業(yè)等領(lǐng)域應(yīng)用這些轉(zhuǎn)基因生物,需要謹(jǐn)慎且嚴(yán)格的監(jiān)管。 人工智能的濫用也存在很大的問題,例如,編碼產(chǎn)生有毒有害物質(zhì)的合成細(xì)胞也是存在著可能性的,那么針對(duì)這些行為,需要如何實(shí)施監(jiān)測(cè)、監(jiān)管以及安全監(jiān)督措施呢? 基于合成生物學(xué)的產(chǎn)品仍需遵循一套標(biāo)準(zhǔn)的監(jiān)管流程,但由于合成生物學(xué)是一種新型產(chǎn)業(yè),這些流程目前是存在一定政策上缺失的,隨著合成生物技術(shù)的發(fā)展可能會(huì)促使對(duì)更加嚴(yán)格監(jiān)管的需求。
金現(xiàn)代是國(guó)內(nèi)領(lǐng)先的數(shù)字化解決方案供應(yīng)商。在生物醫(yī)藥領(lǐng)域,我們以幫助生物醫(yī)藥企業(yè)完成數(shù)字化轉(zhuǎn)型為愿景,以GMP規(guī)范為指引,打造了覆蓋研發(fā)、質(zhì)量、生產(chǎn)、倉(cāng)儲(chǔ)全鏈路的數(shù)字化解決方案,幫助企業(yè)全面落地GMP規(guī)范。 宜明(蘇州)細(xì)胞生物是我們服務(wù)的一家坐落在蘇州生物醫(yī)藥園區(qū)的企業(yè)。我們幫助宜明完成了數(shù)字化轉(zhuǎn)型,實(shí)現(xiàn)了GMP標(biāo)準(zhǔn)下的全鏈條數(shù)字化管理,將線下業(yè)務(wù)轉(zhuǎn)到線上,進(jìn)行跨部門集中統(tǒng)一管理。有效保障了企業(yè)的合規(guī)性,并利用AI信息識(shí)別、物聯(lián)網(wǎng)等技術(shù),提升了生產(chǎn)、實(shí)驗(yàn)室等部門的工作效率。 近年來(lái),生物醫(yī)藥市場(chǎng)面臨迫切的產(chǎn)業(yè)轉(zhuǎn)型需求,最重要的產(chǎn)業(yè)推動(dòng)力源于兩點(diǎn):創(chuàng)新科技的應(yīng)用與賦能,以及創(chuàng)新研究開發(fā)領(lǐng)域的探索和突破。金現(xiàn)代始終堅(jiān)持“創(chuàng)新是第一生產(chǎn)力”,在技術(shù)、人才、產(chǎn)品和服務(wù)領(lǐng)域持續(xù)強(qiáng)投入。未來(lái),我們將與時(shí)代同頻,緊緊服務(wù)國(guó)家戰(zhàn)略,推動(dòng)中國(guó)生物醫(yī)藥企業(yè)的數(shù)字化升級(jí),助力中國(guó)生物醫(yī)藥企業(yè)騰飛。 基于生物醫(yī)藥企業(yè)的降本增效和GMP合規(guī)需求,金現(xiàn)代打造覆蓋生物醫(yī)藥企業(yè)研發(fā)、生產(chǎn)、質(zhì)量、物流全鏈路的一站式信息化解決方案,已在生物醫(yī)藥行業(yè)龍頭企業(yè)“宜明細(xì)胞”成功應(yīng)用,幫助企業(yè)解決監(jiān)管政策要求嚴(yán)、人工記錄追溯難、數(shù)據(jù)有效利用低等痛點(diǎn),建設(shè)規(guī)范、高效、智能的數(shù)字化工廠。