最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)學(xué)的簡潔性推動了進(jìn)化速度?

2018-12-15 20:55 作者:博科園  | 我要投稿

為了在天文學(xué)的巨大可能性集合中尋找到最佳解決方案,計(jì)算機(jī)科學(xué)家們正從進(jìn)化生物學(xué)中尋找靈感。

博科園

神造論者堅(jiān)信,進(jìn)化必須將300多種氨基酸按照正確的順序組合在一起,才能創(chuàng)造出中等大小的蛋白質(zhì)。如果每個位置上可能會出現(xiàn)20種氨基酸中的一種,那么這似乎會出現(xiàn)20^300種以上的可能性,這一龐大數(shù)量使得可觀測宇宙中的原子數(shù)量變得無關(guān)緊要。即使不考慮那些能使某些序列有效對等的冗余,進(jìn)化在數(shù)十億年之內(nèi)通過隨機(jī)突變找到正確組合的可能性也非常小。他們論點(diǎn)中的致命缺陷是進(jìn)化不僅僅隨機(jī)測試序列:自然選擇過程篩選了這一領(lǐng)域。

博科園-科學(xué)科普:此外大自然似乎還發(fā)現(xiàn)了其他捷徑,將廣闊的可能性空間縮小成更小、可探索的子集,從而提高產(chǎn)生有效解決方案的幾率。計(jì)算機(jī)科學(xué)家也面臨著類似挑戰(zhàn)——在天文學(xué)巨大的可能性集合中尋找最佳解決方案。一些研究者試圖從生物學(xué)中尋找靈感,盡管生物學(xué)家仍在嘗試弄清楚生命究竟如何運(yùn)轉(zhuǎn)。遺傳算法是一種已經(jīng)流行了幾十年的優(yōu)化方法,它利用自然選擇原理用于新的設(shè)計(jì)——機(jī)器人、藥物和運(yùn)輸系統(tǒng)等,訓(xùn)練神經(jīng)網(wǎng)絡(luò)或?qū)?shù)據(jù)進(jìn)行加密和解密。該技術(shù)將隨機(jī)解決問題的方法視為“生物體”,生物體具有代碼中描述的某些“遺傳”特征或元素。解決方案并不是特別完美,但生物體隨后會經(jīng)歷隨機(jī)突變組合,有時還會發(fā)生模仿基因重組過程的變化,產(chǎn)生第二代生物體,這些生物體又會被測試其執(zhí)行所需任務(wù)的“適應(yīng)性”。

在找尋一個問題解決方案的廣泛區(qū)域時,大多數(shù)路徑都是死胡同。現(xiàn)在,進(jìn)化或許已經(jīng)找到了提高成功幾率的方法。圖片:Ricardo Bessa for Quanta Magazine

最終這個過程的多次重復(fù)會產(chǎn)生一個非常適合的個體,或者解決方案。一些專家計(jì)劃將這種方法進(jìn)一步優(yōu)化:在所謂的遺傳編程中,開發(fā)出可以編寫程序并高效地提出解決方案的軟件。事實(shí)證明,這一目標(biāo)十分棘手,因?yàn)檠芯咳藛T必須考慮特定的數(shù)據(jù)類型和結(jié)構(gòu),以及其他條件。有趣的是,基于進(jìn)化的思維方式(尤其是遺傳編程)在概念上與數(shù)學(xué)理論重疊,而數(shù)學(xué)理論在生物學(xué)和計(jì)算機(jī)科學(xué)中基本上都處于邊緣地帶。最近一些科學(xué)家試圖利用數(shù)學(xué)理論來洞察自然和人工進(jìn)化如何高效創(chuàng)造新奇和學(xué)會學(xué)習(xí)。關(guān)鍵是,復(fù)雜性、隨機(jī)性和信息的特定概念直到現(xiàn)在還沒有多少實(shí)際應(yīng)用。

1、鍵盤上的猴子

這個理論在20世紀(jì)60年代盛行,用來處理所謂的算法信息。它以概率和復(fù)雜性的直觀思考方式作為出發(fā)點(diǎn),這種思想認(rèn)為,對于某些輸出,描述如何生成某種東西在計(jì)算上比實(shí)際生成它更容易。舉個老生常談的例子,猴子在電腦上隨意按鍵。輸入π的前15000個數(shù)字的可能性非常小,隨著所輸入數(shù)字的增長,這種可能性呈指數(shù)級下降。如果猴子的按鍵被解釋為隨機(jī)編寫的電腦程序來生成圓周率,那么成功的幾率,或者說“算法概率”就會顯著提高。例如在編程語言C中生成π的前15000位的代碼可以短至133個字符。

換句話說,算法信息論本質(zhì)上是:當(dāng)隨機(jī)性在描述它的程序的級別而不是在輸出本身的級別上運(yùn)行時,產(chǎn)生某些類型輸出的概率要大得多。通過這種方式,復(fù)雜的結(jié)構(gòu)例如分形,更容易由偶然產(chǎn)生。但算法信息論很快出現(xiàn)了一個問題,數(shù)學(xué)家們發(fā)現(xiàn),給定輸出(指定所需的最短程序的長度)的算法復(fù)雜度(也稱為Kolmogorov復(fù)雜度,以該理論的創(chuàng)始人之一安德烈?科爾莫戈羅夫(Andrey Kolmogorov)的名字命名)不可計(jì)算。因此,計(jì)算機(jī)科學(xué)家無法確定壓縮字符串或其他對象的正確方法。由此算法信息論大多被歸入純數(shù)學(xué)領(lǐng)域,用于探索相關(guān)定理,定義隨機(jī)性和結(jié)構(gòu)的概念。

圖片:Lucy Reading-Ikkanda/Quanta Magazine

IBM托馬斯·j·沃森中心(Thomas J. Watson Center)和里約熱內(nèi)盧聯(lián)邦大學(xué),也是該理論的另一位創(chuàng)始人,著名數(shù)學(xué)家格雷戈里·查廷(Gregory Chaitin)說:從數(shù)學(xué)上講,這是一種簡單、美麗的復(fù)雜性度量方法,但在現(xiàn)實(shí)應(yīng)用中,它看起來遙不可及。然而這并沒有阻止他去嘗試,他希望這一理論能被正式用于證明DNA作為軟件的觀點(diǎn)。2012年他出版了一本書描述了進(jìn)化如何被視為在軟件空間中隨機(jī)游走。他認(rèn)為,行走過程中的突變并不遵循統(tǒng)計(jì)上的隨機(jī)概率分布了,相反它們遵循基于Kolmogorov復(fù)雜性的分布,但是他沒有辦法測試。現(xiàn)在,一些科學(xué)家希望重振這一理論,使之與生物學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域相關(guān)。

2、對簡單性的偏愛

瑞典卡羅林斯卡學(xué)院(Karolinska Institute)計(jì)算機(jī)科學(xué)家赫克托?澤尼爾(Hector Zenil)是試圖復(fù)興這一理論的科學(xué)家之一。他一直在與其他研究人員合作,利用Kolmogorov復(fù)雜性來分析生物網(wǎng)絡(luò)的復(fù)雜性,比如模擬細(xì)胞中基因調(diào)控或蛋白質(zhì)相互作用的網(wǎng)絡(luò)。研究人員對網(wǎng)絡(luò)的算法信息內(nèi)容進(jìn)行比擬(由于實(shí)際值無法計(jì)算),然后在網(wǎng)絡(luò)中引入一個突變,測試其對Kolmogorov復(fù)雜性的影響。希望通過這種方法揭示出網(wǎng)絡(luò)的各種元素的相對重要性,以及網(wǎng)絡(luò)如何對有意的變化作出功能性的反應(yīng)。最近發(fā)表在《arxiv》上的結(jié)果顯示:通過引入導(dǎo)致網(wǎng)絡(luò)描述性程序變長的突變,使網(wǎng)絡(luò)向更大的Kolmogorov復(fù)雜性移動,趨向于增加系統(tǒng)可以執(zhí)行的功能數(shù)量,同時其對動更加敏感。

如果它們推動網(wǎng)絡(luò)變得更加簡單,則會出現(xiàn)更少但更穩(wěn)定的功能。但是Kolmogorov復(fù)雜性是否能作為一種工具之外的東西——作為蔡廷認(rèn)為的變革驅(qū)動力還有待觀察。盡管算法信息的確存在問題,但它在生物學(xué)領(lǐng)域確實(shí)有一些吸引力。傳統(tǒng)上,用來描述進(jìn)化動力學(xué)的數(shù)學(xué)框架是種群遺傳學(xué),但是群體遺傳學(xué)也有其局限性;例如,它不能解釋生命的起源和其他主要的生物轉(zhuǎn)變,也不能解釋全新基因的出現(xiàn)。一個在數(shù)學(xué)理論中迷失的概念是生物創(chuàng)造力的體現(xiàn),如果我們把算法信息考慮進(jìn)去,創(chuàng)造力就會自然而然地融入其中。進(jìn)化過程本身會隨著時間的推移而改善并變得更有效率的觀點(diǎn)也是如此。

著名數(shù)學(xué)家格雷戈里·查廷(Gregory Chaitin)是算法信息論的創(chuàng)始人之一,他認(rèn)為進(jìn)化可以被理解為在軟件空間中進(jìn)行的一種隨機(jī)計(jì)算。圖片:Courtesy of Gregory Chaitin

英國赫特福德大學(xué)(University of Hertfordshire)的計(jì)算機(jī)科學(xué)家、人工智能教授丹尼爾?波拉尼(Daniel Polani)說:如果這可以通過算法復(fù)雜度漸近下降來表達(dá),我也不會感到驚訝。澤尼爾和團(tuán)隊(duì)開始實(shí)驗(yàn)探索算法復(fù)雜性框架的生物學(xué)和計(jì)算含義。利用他們開發(fā)的用于分析和干擾網(wǎng)絡(luò)的復(fù)雜度近似技術(shù),他們通過使突變偏向于產(chǎn)生算法復(fù)雜度較低矩陣的突變,“進(jìn)化”出人工遺傳網(wǎng)絡(luò),以達(dá)到某些目標(biāo)——表示基因之間相互作用的1和0矩陣。換句話說,他們選擇了更大的結(jié)構(gòu)。他們最近在英國皇家學(xué)會(Royal Society)《開放科學(xué)》(Open Science)上發(fā)表報告稱:與統(tǒng)計(jì)上的隨機(jī)突變相比,這種突變偏差導(dǎo)致網(wǎng)絡(luò)明顯更快地向解決方案進(jìn)化。

瑞典卡羅林斯卡學(xué)院(Karolinska Institute)的計(jì)算機(jī)科學(xué)家赫克托?澤尼爾(Hector Zenil)試圖從生物網(wǎng)絡(luò)算法(或Kolmogorov)的復(fù)雜度來分析進(jìn)化中的生物網(wǎng)絡(luò)。圖片:Courtesy of Hector Zenil, Photo by CSHV/Skof

其他特征也出現(xiàn)了,包括持久規(guī)則的結(jié)構(gòu),這些結(jié)構(gòu)在矩陣中已經(jīng)達(dá)到了一定程度的簡單化,新一代不太可能改進(jìn)。澤尼爾(Hector Zenil):一些區(qū)域更容易或更不容易發(fā)生突變,這僅僅是因?yàn)樗鼈兛赡苓M(jìn)化出了某種程度的簡單性。研究人員提出,基因記憶反過來更快地產(chǎn)生更大的結(jié)構(gòu),這意味著算法上的突變也可能導(dǎo)致多樣性的爆發(fā)和滅絕。這意味著當(dāng)我們討論進(jìn)化時,考慮計(jì)算過程很有成效,他希望利用對隨機(jī)性和復(fù)雜性的理解來識別更容易發(fā)生突變的區(qū)域,或者找出某些基因相互作用與癌癥等疾病相關(guān)的原因。

3、迭代軟件

澤尼爾希望探索生物進(jìn)化是否也遵循同樣的計(jì)算規(guī)則,但大多數(shù)專家對此表示懷疑。目前還不清楚是什么自然機(jī)制導(dǎo)致了算法復(fù)雜度的近似,或者導(dǎo)致了突變偏差。此外,法國國家科學(xué)研究中心(National Center for Scientific Research)的數(shù)學(xué)家朱塞佩朗戈(Giuseppe Longo)說:把生命完全編碼成四個字母的想法是錯誤的。DNA極其重要,但如果它不在細(xì)胞中,不在生物體中,不在生態(tài)系統(tǒng)中,那就沒有意義了。其他交互作用也在發(fā)揮作用,而這種算法信息的應(yīng)用無法捕捉到復(fù)雜性的程度。盡管如此,這個概念還是引起了一些人的興趣,特別是因?yàn)樗伎歼M(jìn)化和計(jì)算過程的方式似乎與遺傳編程的軟件進(jìn)化目標(biāo)有一些共同之處。

事實(shí)上查廷和澤尼爾關(guān)于Kolmogorov復(fù)雜性和遺傳編程方法的觀點(diǎn)之間存在著一些有趣的暗示。例如,2001年一個研究小組報告表示:遺傳程序輸出的復(fù)雜性可以被原始程序的Kolmogorov復(fù)雜性所限制。在大多數(shù)情況下,Kolmogorov復(fù)雜性并沒有在計(jì)算機(jī)科學(xué)家理解算法中發(fā)揮作用。相反,研究者們嘗試了其他方法來修改所涉及的基因和突變。另一些人則偏向于支持替換較大代碼塊的突變。馬薩諸塞州漢普郡學(xué)院(Hampshire College)的計(jì)算機(jī)科學(xué)家李斯佩克特(Lee Spector)說:人們已經(jīng)發(fā)現(xiàn)了幾百種不同版本的突變和交叉。斯佩克特最近領(lǐng)導(dǎo)的一個團(tuán)隊(duì)展示了在生物體基因組中添加和刪除突變的優(yōu)點(diǎn),而不是直接用另一個基因替換一個基因。

這種新的遺傳算法最終在基因組搜索空間中以指數(shù)形式擴(kuò)展了路徑的數(shù)量,并帶來了更好的解決方案。盡管如此,許多研究人員仍選擇背道而馳,繼續(xù)尋找一種聰明的方法——通過縮小搜索空間來加快搜索速度,同時又不會對搜索空間造成太大的限制;但這種搜索方式可能會錯過最佳結(jié)果。正如尤金?威格納(Eugene Wigner)在1960年指出的那樣:自然科學(xué)中數(shù)學(xué)的不合理有效性。計(jì)算機(jī)科學(xué)家發(fā)現(xiàn),更簡單的模型往往被證明更為普遍、有效。問題是,它是否能告訴我們一些關(guān)于宇宙深處的東西,無論如何,它看起來真的有用嗎?

讓程序朝著簡單方向發(fā)展可能具有破壞性,例如獎勵程序長度較短之類的東西,可能會削減對后代人有用的假想殘次品,可能犧牲實(shí)驗(yàn)過程中的最佳解決方案,所以你被困住了。但是簡單仍然十分誘人,并且可能大有用處。在去年發(fā)表的論文中,斯佩克特和同事們發(fā)現(xiàn),如果他們減小程序的大小——有時僅為25%的原始大小,在執(zhí)行遺傳編程技術(shù)過程中,程序的表現(xiàn)要好于新的數(shù)據(jù),并且能夠廣泛用于一般問題。這也是他一直關(guān)注算法信息論研究的部分原因,不過還沒有到算法信息論究竟如何影響這個領(lǐng)域。

4、從生命中學(xué)習(xí)

也許澤尼爾的團(tuán)隊(duì)已經(jīng)朝著發(fā)現(xiàn)這種影響邁出了第一步,但是為了使他們的工作的應(yīng)用程序更具有普遍的現(xiàn)實(shí)性,他們將首先在其他類型的搜索問題上測試他們的方法。威斯康星大學(xué)麥迪遜分校(University of Wisconsin, Madison)的理論神經(jīng)科學(xué)家拉里薩阿爾巴塔基斯(Larissa Albantakis)說:盡管如此,在基于結(jié)構(gòu)的限制方面有很好的觀點(diǎn),自然界在很多方面都存有結(jié)構(gòu),如果你把它作為出發(fā)點(diǎn),那么嘗試所有可能的一致突變就有點(diǎn)可笑了,任何對我們有意義的事情都是以某種方式構(gòu)建起來。

盡管斯佩克特仍然懷疑澤尼爾最近的研究是否能超越他所探索的具體問題,但這些概念背后的信息論非常有趣,而且可能相當(dāng)重要。它令人興奮,部分原因是它似乎遙不可及。也許同一領(lǐng)域的人沒有意識到某些見解。畢竟,算法信息利用了許多基因編程專家可能沒有納入他們工作的概論,包括進(jìn)化的開放性。斯佩克特說:我有一種強(qiáng)烈的感覺,這里有重要的東西等待我們挖掘,目前研究與實(shí)際應(yīng)用之間仍有很大差距。把生命看作不斷發(fā)展迭代的軟件想法非常有趣,無論是考慮人工生命還是生物生命,都需要具有長遠(yuǎn)的目光!

博科園-科學(xué)科普|參考期刊文獻(xiàn):《皇家學(xué)會開放科學(xué)》等

文:Jordana Cepelewicz/Quanta magazine/Quanta Newsletter

DOI:10.1098/rsos.180399

DOI:10.1145 / 3071178.3071330

DOI:doi.org/10.1007/3-540-45355-5_28

博科園-傳遞宇宙科學(xué)之美


數(shù)學(xué)的簡潔性推動了進(jìn)化速度?的評論 (共 條)

分享到微博請遵守國家法律
平谷区| 广平县| 吴旗县| 宣汉县| 新源县| 临夏市| 水富县| 潜江市| 宁海县| 曲周县| 尼玛县| 安仁县| 南汇区| 台东市| 普宁市| 巴林右旗| 巴青县| 新平| 邵东县| 五寨县| 武鸣县| 丹东市| 上林县| 凌海市| 雅江县| 阿尔山市| 文山县| 泰州市| 资中县| 阳曲县| 石门县| 湟中县| 美姑县| 和静县| 绥化市| 灵宝市| 大理市| 新竹县| 霍州市| 南平市| 洪湖市|