ChatGPT核心研發(fā)者的跨界思維: 怎樣打破禁錮教育和創(chuàng)新的枷鎖丨展卷
ChatGPT核心研發(fā)者的跨界思維: 怎樣打破禁錮教育和創(chuàng)新的枷鎖丨展卷
撰文?|?肯尼斯·斯坦利(Kenneth Stanley)、喬爾·雷曼(Joel Lehman)
翻譯 |?彭相珍
一
對目標的質疑,探索空間,踏腳石
想象一下,每天一覺醒來,不用去琢磨今天該干點什么,你有過這樣的體驗嗎?假設你去上班,你的老板一反常態(tài)的沒有開例會,既不討論工作基準,也不說明工作節(jié)點,而是告訴你要做你最感興趣的事,你該如何自處?待稍后你上網(wǎng)瀏覽新聞,里面既沒有提到關于學習成績的國家標準測試,也沒有提及未達成的經(jīng)濟目標。說來也奇怪,當老師的還是該上課的上課,市場上該進行的交易也沒有受到影響?;蛟S近期你不會碰上這么漫無目的的一天,但萬一碰上了,這樣的日子該怎么過?你或許會感到茫然困惑,或不知所措,或迷失方向。但有沒有可能,你反而會覺得日子更好了?
有意思的是,我們難得去談論“目標”在自身文化體系中的主導地位,盡管我們自出生起就受其影響。從蹣跚學步到第一天進幼兒園再到成年,我們跨入了一場評估的無限循環(huán)之中,且所有評估既有目的用于衡量特定目標,由社會或我們自己設定的進展。比如精通一門學科并找到一份對口的工作。實際上,“目標”從一開始就躲在幕后,從源頭開始,隨著時間的推移不斷積蓄力量,最終主宰我們的一切。
在某種程度上,我們不得不相信目標的意義,才能允許他主導我們生活的方方面面,但背后的原因也可能恰恰相反,即我們已經(jīng)太習慣于通過目標來界定所有的努力,甚至忘了我們可以去質疑目標的價值。
在本書中我們將提出一系列的問題,質疑做事“有目標”的好處,但在此需要著重指出的是,我們主要針對的是所謂的高大上的目標,因為此類目標的實現(xiàn)是徹底的未知數(shù)。比如醫(yī)學研究人員尚未研發(fā)出治愈癌癥的方法,計算機科學在短期內(nèi)也很難說是否可以創(chuàng)造出足以媲美人類智力的人工智能。如果能發(fā)明一種不存在任何風險、環(huán)境友好且用之不盡的能源當然很好,但沒有人知道何時會實現(xiàn)?;蛘吒祚R行空一些,發(fā)明時間旅行機器或瞬間移動怎么樣?你甚至會給自己設定一些“大目標”,比如賺它10個億?!S著“志向”變得越來越“高遠”,實現(xiàn)的希望便越發(fā)渺?!@便是最耐人尋味的地方了。
那么問題來了,如何才能實現(xiàn)“高大上”的目標呢?
把成功視為探索發(fā)現(xiàn)的過程會很有用。我們可以認為,畫出一幅杰作,本質上是在所有具備可能性的作品集合中將其發(fā)現(xiàn),好比我們在一切可能性中,搜尋想要的那個“唯一”,即我們所謂的“目標”。
因此,我們可以把創(chuàng)造力看作一種搜索的手段,但這種類比并不全面,如果我們在尋找目標,那么我們必定是在某些范圍內(nèi)找出目標,這個范圍可以被稱作“搜索空間”,即所有具備可能性事物的集合?,F(xiàn)在試著發(fā)揮一下想象力——就好像不同的可能性出現(xiàn)在一個大房間的不同位置,在這個巨大的房間里,從一面墻到另一面墻從地面到天花板,每一個你能想到的圖像都在空中某個位置盤旋著,數(shù)萬億的圖像在黑暗中閃閃發(fā)光。
從“搜索空間”的角度思考,“發(fā)現(xiàn)”便是我們把創(chuàng)造的過程,看作搜索這個龐大房間的過程。從某種意義上說,自古以來人類文明的發(fā)展過程就是不斷探索這個房間的過程,我們探索的越多,就越清楚創(chuàng)造發(fā)明的可能性。你對這個房間探索得越多,就越能明白接下來該去往何處。通過這種方式,藝術家在創(chuàng)作時恰恰就是在存儲了所有具備可能性圖像的大空間中,尋找一些特殊或異常美麗的事物。他們在房間里探索的越多,成功的可能性也就越大。
上述思維方式不僅適用于繪畫,我們同樣可以想象出一個裝滿任何其他東西的房間,舉個例子,它可以是裝滿了電腦的大房間。如果你在計算機領域鉆研了很長時間,那就會發(fā)現(xiàn)一件很有趣的事:你首先會開始理解這個房間的形狀,知道一臺電腦是如何聯(lián)通另一臺的,就像鋪著腳踏石的蜿蜒小路一樣。如果你在這條路上徘徊的時間足夠長,甚至能看到一些有趣的“可能性”開始在某些地方“探頭探腦”。
那我們?yōu)槭裁匆腔灿诖?,何不直接前往頂尖計算機所在的位置呢?原因便是通往未來的唯一線索,只能在過去中尋獲。世界上第一臺計算機ENIAC于1946年問世,每秒可運行5000條指令,而現(xiàn)如今一臺普通的臺式電腦,每秒能運行超過100億條指令。換言之,ENIAC的運行速率只有現(xiàn)今一臺普通電腦速率的200萬分之一,真算得上是蝸牛爬了。
你可能會想,設計師們?yōu)楹尾辉?946年就把目標定為制造一臺高速計算機呢?當然現(xiàn)代人都知道這是可能實現(xiàn)的目標,但為什么第一臺計算機運行得這么慢?這就是世界運作的方式,在這個滿是電腦的大房間被人踏足之前,沒有人知道那里會存在何種可能性,你得在出發(fā)之前先參觀一番。簡而言之,在1946年,制造更高速計算機的踏腳石還不為人知,因為其尚未被發(fā)現(xiàn),就像我們目前還不知道把如今的計算機速度再提升200萬倍的踏腳石在哪里一樣。帶有踏腳石(stepping stone)性質的事物是通往更高層可能性的門戶,我們必須先找到這塊石頭,踩穩(wěn)后才能跨出發(fā)現(xiàn)的一步。
二
教學評估,成績,欺騙
對目標的日益迷戀會給社會造成怎樣的危害?是否有明確的案例表明,確立一個社會總體目標弊大于利?事實上,已有大量的科學證據(jù)表明這種情況經(jīng)常發(fā)生。例如,下面的引言就呼應了社會科學中眾所周知的坎貝爾定律(Campbell’s law):任何量化的社會指標,越是被用于社會決策,社會腐敗的壓力便越大,也就越容易扭曲和腐蝕它所要監(jiān)測的社會進程。
為了證明美國正在進步,你可以展示各種各樣的證據(jù):學校的考試成績、犯罪統(tǒng)計率、逮捕報告,或其他可能讓政治家順利當選、讓普通職員獲得晉升的任何東西。在制定了此類統(tǒng)計標準之后,機構中的許多人就會絞盡腦汁地想辦法讓它看起來有進步,哪怕實際上根本沒有。
——大衛(wèi)·西蒙(David Simon)
換句話說,類似學業(yè)成績測試這樣的社會指標,當其目標是“讓成績更上一層樓”時,效果往往是最差的。原因在于,單一的指標很難把握人們真正關注的是什么。例如,以學生的考試成績?yōu)闃藴蕘碓u估教師,會直接迫使教師開展應試型教學,而最終的結果,不是培養(yǎng)出具備豐富知識和實用技能的學生,而是產(chǎn)出擅長記憶和考試的應試型學生。以考試成績?yōu)槟繕藭r,學生的成績可能會提高,但同時也意味著他們真正掌握的實用知識反而變少了。
任何“高大上”的社會追求,最終都會面臨同樣令人沮喪的悖論。當社會對進步的追求被打包為一種措施進行衡量時,就會產(chǎn)生目標驅動效應。如果目標十分“高大上”,那么提升目標表現(xiàn)的驅動力很可能產(chǎn)生欺騙性,反而阻礙了人們發(fā)現(xiàn)最佳結果的能力。以國內(nèi)生產(chǎn)總值(GDP)為例,這是衡量國家生產(chǎn)力的一項國際通用標準。每個國家都希望最大限度地提升GDP,因而“GDP最大化”就成了國家層面的一個目標。但GDP的增加,并不意味著保持當前的經(jīng)濟政策一定能夠繼續(xù)提升GDP。因此,經(jīng)濟發(fā)展可能會陷入一個“中國指銬”式陷阱——需要來一招“以退為進”才能夠獲得更大的增長。事實上,經(jīng)濟學家們已經(jīng)意識到,過度依賴GDP沒有意義,即使它是全球各國廣泛采用的經(jīng)濟指標。這種悖論也被稱為“GDP崇拜主義”。
就像考試成績一樣,GDP這類指標越是“金玉其外”,反而越會變得“敗絮其中”。究其原因,GDP是如此單一的衡量標準,它并不能真正反映健康經(jīng)濟體的真正內(nèi)涵。一名善于玩弄權術的政客為了尋求連任可能會制定一些政策來在短期內(nèi)大幅提高GDP,但從長遠來看,這些政策對經(jīng)濟是有害無利的。這類問題恰恰說明了通過單一指標來制定國家政策的危險性——它們很容易導致欺騙。
但是,在談論教育這樣重要的社會支柱時,要求人們承認目標導向型思維的不足之處可能十分困難。但如果提升與特定目標相關的表現(xiàn)不是取得成功的正確途徑,那么我們要怎么做才能夠確?!白约簩ψ约贺撠煛蹦??我們希望這些簡單的、基于目標進展的衡量標準能夠告訴我們,一位教師或一所學校是否做得很好,這樣我們就可以獎勵那些成績提高者,懲罰那些成績下滑者。但不幸的是,問題越復雜,目標導向的思維就會越乏力,而教育無疑是一個非常復雜的社會問題。
盡管這聽起來有違常理,但一個班級的學生在某次考試中的分數(shù)高于去年,可能并不會比他們的分數(shù)低于去年更好——尤其是在考慮到學校未來的光明前景時。這是因為通向真正的、近乎完美的全班表現(xiàn)的踏腳石,很可能與任何常見的教育衡量指標毫無關聯(lián)。各種測試驅使每個學生取得更好的成績,這些成績代表了人們期望的理想結果(即目標)。但我們已經(jīng)看到,這幾乎是一條注定行不通的死胡同。換句話說,試圖通過衡量成績來實現(xiàn)任何遠大的教育目標,都是自欺欺人。這也就是說整個偉大教育事業(yè)的追求過程,完全基于對目標的盲目崇拜。這就是為什么我們需要意識到,在由目標驅動的成功中,隱藏著欺騙性的暗流。這種欺騙性甚至會影響到整個社會層面的努力,并且人們可能在很長一段時間內(nèi)都意識不到它造成的傷害。
比如,在軟件工程領域(開發(fā)新軟件的行業(yè))發(fā)展的早期階段,也曾出現(xiàn)過類似“一切皆可測量”的風潮。許多人尤為關注具體測量標準帶來的前景,期望以此提高生產(chǎn)力和軟件質量。湯姆·狄馬克(Tom DeMarco)在1982年寫了一本頗具影響力的書,描述了這一風潮的特點,其中最有名的一句話是“無法測量的東西,就是不可控的東西”。35年后,狄馬克又發(fā)表了一篇文章,表示自己的觀點已經(jīng)隨著時間的推移發(fā)生了轉變?!澳潜緯胍磉_的言外之意其實是,‘衡量標準是好的,更多就更好,越多就越好’;但最終事實證明,‘它們的使用,反而應該謹慎而節(jié)制’。”因為,對由數(shù)百萬行代碼和無數(shù)相互作用的部分組成的更復雜的軟件而言,“一刀切”的簡單衡量標準將變得毫無價值。在同一篇文章中,狄馬克寫道:“盡管衡量標準使我們能夠對進程施加控制,但嚴格的控制只適用于那些沒有潛力產(chǎn)生重大影響的項目?!睋Q句話說,只有在目標相對平凡的情況下,衡量標準才是有用的。如果我們將其應用到宏偉事業(yè)上,就會使其失去其價值。在軟件開發(fā)領域,對衡量標準的盲目推崇,導致工程師們被迫不斷抬高衡量標準,哪怕他們知道這些衡量標準已經(jīng)日益與現(xiàn)實脫節(jié)——這種盲目追逐目標的主導性風潮,在持續(xù)多年之后才開始消退。目前,美國的教育系統(tǒng)可能正在上演同樣的、盲目推崇“一刀切”目標衡量標準的錯誤。但這一次,受到自欺欺人式成就衡量標準束縛的對象,從軟件工程師變成了兒童和教師。
三
“一刀切”,統(tǒng)一標準,多樣性探索
除了對精準測量的錯誤信任外,基于目標導向型思維給教育領域帶來的另一個長期傷害,是對“一刀切”的統(tǒng)一標準的追求。其背后的邏輯是,無論身處何處,每個學生都應該有機會獲得相同類型和同等質量的教育。其背后的驅動邏輯是確保教育的公平性,即生活在美國東北地區(qū)的學生,應該接受與生活在西部或南部的學生同等的教育。換句話說,各地的學校應該在教給學生什么樣的知識上,遵循統(tǒng)一的標準。這樣一來,無論住在哪里,所有的學生都能學到相同的知識,并且能在高中畢業(yè)后,為進入職場或下一階段的高等教育做好同等的準備。
全國各地的學校以不同的方式執(zhí)行同一個教育理念,可以定期對學生的表現(xiàn)進行統(tǒng)一評估。這樣一來,我們就有了適用于不同地區(qū)的國家統(tǒng)一標準,以及許多具體的衡量標準,用以反映學生個人和他們的教師在其學業(yè)或職業(yè)生涯中的具體進展。因此,如果某個地區(qū)的學生接受的教育質量較差,或者某所學校的教師表現(xiàn)不佳,人們就很容易發(fā)現(xiàn)問題。這一舉措背后的邏輯是,全國統(tǒng)一的評估,可以幫助確保教育平等,更清晰的橫向比較也可以提高評估的嚴格程度。
推動全國教育統(tǒng)一標準的一個例子,就是美國“共同核心州立標準”(CCSS)。該標準由全美州長協(xié)會(包括其他機構)發(fā)起,與華盛頓成就公司(Achieve, Inc)合作制定。CCSS的主要目標,是建立一套統(tǒng)一的國家教學標準,以及一套與之匹配的定期和統(tǒng)一的評估體系。盡管仍存在爭議,但美國絕大多數(shù)州已經(jīng)采用了CCSS,問責制、標準量化和統(tǒng)一性等方面均得以進一步強化。雖然這種統(tǒng)一性表面看起來可能是有益的,但隱藏在光鮮表象之下的,就是我們熟悉的目標神話的謬誤。
事實上,CCSS的一個明確功能是設定各種教育目標,正如CCSS網(wǎng)站上的常見問題板塊表明的那樣,“通過為學生的學習提供明確的目標,教育標準旨在幫助教師們確保學生擁有通向成功所需的技能和知識。”當然,如果我們不能時常準確地衡量各項目標的進展來使之保持統(tǒng)一,以便于進行普遍性的橫向比較,那目標又有什么用呢?出于這個原因,CCSS也幫助“開發(fā)和實施共同的綜合評估系統(tǒng),用于每年衡量學生的表現(xiàn),以取代各州現(xiàn)有的、不統(tǒng)一的測試系統(tǒng)”。
盡管我們可以輕易地理解推動統(tǒng)一教育標準背后的良好意圖,但在這一點上,我們也能看到,目標的誤導性是如何破壞這件“美事”的。統(tǒng)一標準很像前文提及的準確性問題,它是評估和測量的一個好幫手,但卻是教育領域“尋寶者”的勁敵。
一個徹底統(tǒng)一的教育系統(tǒng),能從細枝末節(jié)之處確保每個學生擁有平等的經(jīng)歷,但其意義不大。學生們的課程、學業(yè)目標和測試都是一模一樣的,這種“一刀切”的統(tǒng)一性,盡管可能通過增強的目標感和科學性給人帶來安全感,但與提升孩子們的教育質量沒有必然的聯(lián)系。無論選擇什么樣的統(tǒng)一標準,都有可能帶來好的或壞的結果。當然,制定一套劣質的統(tǒng)一標準,必然會讓情況變得更糟。
強加的教育統(tǒng)一性可能會造成更多不易察覺的“內(nèi)傷”,因為除了沒有任何內(nèi)在的益處之外,統(tǒng)一性還會損害孩子們在未來探索和發(fā)現(xiàn)的能力。執(zhí)行統(tǒng)一的標準意味著向一個單一的標準聚合,同時也消滅了個別學?;騻€別州目前可能正在探索的其他標準的多樣性。因此,未來的標準和測試,可能只是對強制實施的現(xiàn)有標準的調(diào)整,因為這是教師們在課堂上可以應用和探索的唯一標準。
教育問題如此復雜,以至于人們幾十年來都沒有找到一種“一勞永逸”的解決方案。為此,我們必然要思考一個問題——非目標思維對教育意味著什么?到目前為止,本章就教育領域的論述,遵循的是一種熟悉的模式,即目標導向的方法成為目標欺騙性的犧牲品,使關于“如何取得進步”的傳統(tǒng)設想變得岌岌可危。但我們同樣熟悉的是,如果我們能夠設法擺脫只考慮目標的做法,教育事業(yè)就能再次獲得一線生機。有時也許應該允許廣大教師和學校系統(tǒng)遵循其本能和直覺,哪怕他們在評估中的得分連年下跌。但是,隨著“應試教育”的流行和“力爭高分”等目標壓力的增加,對這種“直覺”的依賴顯然受到了壓制,其結果是教師們大部分的自主權、直覺和創(chuàng)造力被剝奪,教師們對教學的熱情和初心也被慢慢耗盡。
或許,我們最好將投入評估方面的精力轉移至嘗試不同的想法,而不要過分強調(diào)衡量標準的精確度。這將使教師們能夠充分利用其多年來在與學生的互動中磨煉和積累的創(chuàng)造力和近乎直覺化的專業(yè)知識,讓他們?nèi)プ杂傻靥剿鞲袧摿Φ穆窂健?/strong>就像在圖片孵化器網(wǎng)站上一樣,多樣性探索產(chǎn)生的一些想法可能注定要失敗,但另一些則可能帶來有價值的發(fā)現(xiàn),而整個體系(就教育而言,是整個社會)將會同時從不同的路徑和嘗試中受益。那些看起來有趣或有前途的方法,會成為通向成功的踏腳石,其他人可以在此基礎上繼續(xù)探索和發(fā)現(xiàn)。通過這個方法,整個社會就能成為教學方法的“尋寶者”。但是這種對不同可能性的有益探索,可能會受到當前僵化的、以目標為導向的主流文化的排斥,至少在美國會這樣。(以芬蘭的小學教育系統(tǒng)為例,它為芬蘭的教師們提供了更大的個人自主權,并且不會要求學生參與標準化的測試。在這個意義上,芬蘭的教育系統(tǒng),更多遵循了非目標的探索精神。所以,芬蘭在教育方面也處于世界領先地位,遠遠超過了美國。)
四
經(jīng)費申請中的分歧與共識,砸錢與出成果
要了解目標對科學進步可能產(chǎn)生的影響,就得了解科學在實踐中是如何運作的??茖W進步最基本的驅動力,來自科學家們的實驗,但這樣的實驗往往成本很高。因此,資金往往成為限制科學發(fā)展的因素——尤其是考慮到知識的進步并不總是能夠在短期內(nèi)帶來回報這個事實,這就意味著,尋求新探索和新發(fā)現(xiàn)的科學家們,首先要為實驗的項目籌募資金。
科研項目申請經(jīng)費的大致流程是:科學家們向資助機構提交申請,并提供闡釋了科研想法的提案;提案隨即被送到一個由專家同行評審員組成的評審小組,這些評審員通常是提案所涉領域,如生物學或計算機科學領域的資深科學家;評審專家隨后給出評級,包括從差到優(yōu)的不同等級。一般來說,獲得最高平均評級的提案,最有可能獲得資助。
乍看之下,這是一個十分合理的篩選過程。理想情況下,某個領域中最優(yōu)秀的想法,就應該能夠說服一個由專業(yè)科學家組成的小組,并將其評定為優(yōu)秀。然而,這種表面合理的常識背后,同樣隱藏著麻煩,因為這個評審體系的主要作用是支持共識。換句話說,評審員群體越是認同提案的優(yōu)秀性,機構提供資助的概率就越大。然而問題在于,共識往往是通往成功的踏腳石的最大障礙。
尋求共識將阻止人們沿著有趣的踏腳石前進,因為不同的人對什么是最有趣的踏腳石的看法或許并不一致。解決不同人群在喜好上的分歧,往往會導致相互對立的踏腳石之間彼此妥協(xié),就好像將對比鮮明的黑白兩色混合到一起,最終只會產(chǎn)生了寡淡的灰色。這種妥協(xié)的產(chǎn)物,最終往往只會沖淡兩個原始理念的色彩。對于撰寫提案的科學家來說,贏得資助的最佳方式是提出完美的妥協(xié)方案,即最柔和的灰色——足以滿足所有人的眼光,但不太可能帶來高度的新奇性或趣味性。因此,當人們嘗試在探索中尋求共識時,其結果只能是“清湯寡水,無甚滋味”。整個系統(tǒng)不是讓每個人去發(fā)現(xiàn)自己的踏腳石鏈,而是將各種不同的意見壓縮成一個四平八穩(wěn)的平均值。
也許有時候支持最大限度的分歧,而不是一致的意見,會更有意義。如果你跟風去做熱門的研究,并且鸚鵡學舌似的隨大流,或許能夠得到廣泛的認可和支持;相反,一個真正有趣的想法,或許會引發(fā)爭議。在我們目前已知和未知的邊界,仍存在一些尚不確定答案的問題,這就是為什么在科學的未知領域,專家們的意見應該保持分歧和發(fā)散狀態(tài),正是在這片位于已知和未知之間的“蠻荒”邊界地帶,我們應該讓人類最偉大的頭腦進行探索,而不是在最大共識的舒適區(qū)“沉迷享樂”。試想一下,哪個項目可能更具有革命性:是評分“喜憂參半”的項目,還是“全體好評”的項目?意見分歧的專家們,或許比總是達成一致意見的專家們更有推動偉大成就的能力。
除了推動人們達成共識之外,基于目標的思維還可能從其他方面影響科研投資的決策。例如,假設你是目標論的信徒,可能會認為科學進步的框架是可預測的。換句話說,根據(jù)“有志者,事竟成”的目標性思維,通往重大發(fā)現(xiàn)的踏腳石,將以一種有序、可預測的方式排列。在這種思維導向下,治愈癌癥的關鍵創(chuàng)新,似乎應該是對已經(jīng)存在的癌癥治療方法的改進或完善,或至少應該來自與癌癥直接相關的研究領域。然而,在本書中,我們一次又一次地看到,通向卓越成果的踏腳石是不可預測的。因此,如果我們想要治愈癌癥,只專注于癌癥領域可能無法使我們實現(xiàn)這個宏偉目標。但是,即使一項研究未能實現(xiàn)其原始目標,其副產(chǎn)品也可能會在看似不相關的領域實現(xiàn)意外的突破性發(fā)現(xiàn)。
事實上,各國政府已經(jīng)投入巨額研究資金,開展了眾多諸如此類的重點研究項目,以期解決某些特定的科學問題。例如,日本通商產(chǎn)業(yè)省在1982年啟動了一個長達10年的大規(guī)模研究項目,即“第五代計算機系統(tǒng)項目”,旨在推動日本的計算機技術躋身世界領先地位。雖然日本政府投入了大量資金用于定向研發(fā),但人們普遍認為這個項目沒有實現(xiàn)其目標——開發(fā)出具備商業(yè)成功潛力的產(chǎn)品,盡管這個項目的確為日本培養(yǎng)了新一代有潛力的日本計算機研究人員。同樣,美國總統(tǒng)尼克松于1971年發(fā)起的“抗癌戰(zhàn)爭”(旨在消滅癌癥這一高死亡率的疾?。┮采形慈〉贸晒?,盡管這個項目在研發(fā)更有效的癌癥治療方法方面進行了針對性研究,并加深了人們對腫瘤生物學的理解。事實上,類似人類基因組計劃等看似不相關的科學研究項目,更有希望發(fā)現(xiàn)更好的癌癥治療方法。
當然,有時雄心勃勃的科學探索計劃也能獲得成功,比如20世紀60年代的美蘇登月競賽就是由肯尼迪總統(tǒng)發(fā)起的,他在國會演講中承諾,“我相信這個國家能夠齊聚一心,全力以赴達成這個目標,十年之后,人類將乘坐宇宙飛船登陸月球并且安全返回?!钡@份充滿不確定性的宣言后來之所以能夠實現(xiàn),是因為它當時正好處于技術可能性的邊緣(也就是說,這個宏偉的目標彼時離實現(xiàn)只有一步之遙)。于航天飛機之前出現(xiàn),并促使航天飛機的問世成為可能的一連串發(fā)明,并不是太空計劃本身的目標,但航天飛機的發(fā)明必須依賴于它們的出現(xiàn)。假如登月目標在19世紀60年代提出,則必然會以失敗告終。
然而,從這些成功案例中得出的關于目標力量的潛在誤導性結論,往往助長了天真的目標樂觀主義——認為只要有足夠的資源支持,任何目標都可以在歷史上任何時期堅定地成立并一定能夠實現(xiàn)。例如,美國癌癥協(xié)會的一位前任主席曾經(jīng)說過:“我們離治愈癌癥的目標已經(jīng)非常近了,只是缺少將人送上月球的那種意愿、資金和全面規(guī)劃。”最后,即使在這些宏偉的科學事業(yè)的成功案例中,最終給人類社會帶來最深遠影響的技術,往往是未曾預料到的。例如,太空競賽給我們帶來了人工耳蝸、記憶海綿床墊、凍干食品和改進后的急救毯等創(chuàng)新產(chǎn)品。
五
應該投資給誰?
一個類似的思路是,科學項目如何影響世界同樣存在著可預測的框架。也就是說,我們也許能持續(xù)地靠投資來不斷優(yōu)化那些目前看起來最有可能產(chǎn)生影響的科研項目,最終會催生出一些具備突破性影響的科研項目。背后的邏輯是,具有適度影響力的科研項目將帶來更多更具影響力的科研項目,最終使科學的探索和發(fā)現(xiàn)給世界帶來顛覆性變革。
事實上,類似美國國家科學基金會等資助機構評估科研經(jīng)費申請的一個主要標準是擬議研究項目的影響力范圍。因此,被認為影響潛力較小的科研項目,獲得資金的可能性也低。而政客們傾向于嘲笑那些目標看似異想天開的科研項目,即顯然不會帶來任何重要成果的研究,認為它們純粹就是浪費錢,這種態(tài)度的背后也體現(xiàn)了同樣的邏輯。例如,美國參議員湯姆·科伯恩(Tom Coburn)在2010年的一份報告中,將一項實驗稱為“一群對科學上癮的猴子”,他在2011年的另一份報告中,則將另一項實驗諷刺為“跑步機上的蝦”。美國參議員威廉·普羅克斯邁(William Proxmire)在1975—1988年期間,每月給科研項目頒發(fā)的“金羊毛”獎,也秉持了類似的邏輯,用于嘲弄在他看來顯然浪費了政府經(jīng)費的科研項目,獲獎者包括一些有著嘩眾取寵主題的科學研究,如“螺旋蠅的性行為”“素食主義的行為決定因素”“駕駛員對大型卡車的態(tài)度”,等等。
這些例子背后,存在一個非常具有誘惑性的推理過程,即在研究項目開展之前,我們有可能根據(jù)研究項目及其成果是否具備廣泛的社會影響,而將其劃分為重要或不重要的項目。讀到此處,諸位或許已經(jīng)能夠看出,這種想法過于武斷——因為許多重要的發(fā)現(xiàn),都是偶然獲得或意料之外的。
問題的關鍵在于,用更適合評判整個系統(tǒng)的標準來評判單一的踏腳石,可能是短視的做法。歸根結底,科學作為一個整體,其目標是發(fā)現(xiàn)具備深刻性和變革性的真理。但在這個過程中,任何特定的科研項目是否具有變革性,可能根本不重要。事實上,一個科研項目很有趣,并能夠進一步生成更有趣或更意外的實驗結果,或許比其自身具備重要性更值得關注。
在科學領域,決定是否支持重大項目,或根據(jù)預估的影響力判斷項目是否值得投資的另一個思路,是將科學研究項目符合特定利益的程度作為投資的評判標準。在不涉及太多政治因素的情況下,這就意味著政府只希望資助它當時認為重要的研究議程,或能夠為國家提供明確的短期利益的研究項目。
例如,根據(jù)美國眾議員拉馬爾·史密斯(Lamar Smith)在2013年提出的《高質量研究法案》(High Quality Research Act)中稱,在決定資助任何科研項目之前,美國國家科學基金會的主席必須發(fā)表一份聲明,證明該項目“(1)符合美國的國家根本利益,通過促進科學進步,推動國家健康、繁榮或福利,并確保國防安全;(2)具備最高的質量,具有突破性,能夠回答或解決對整個社會而言最重要的問題;(3)與基金會或其他聯(lián)邦科學機構正在資助的其他研究項目不重復”。第二點規(guī)定背后的設想是,根據(jù)科研項目的重要性來判斷其是否值得資助,是可能的或可取的,而第一點規(guī)定設想的是,科學研究只能沿著對國家有直接利益的方向狹義地展開,而不進行更廣泛的搜索。
當然,“只要大量地投入資金,就能可靠地產(chǎn)出特定重要研究領域的根本性突破”的想法非常具有吸引力,但狹隘地框定重點研究領域和宏大目標驅動的科研項目其實并不可取。因為,不管其基本設想是否足夠吸引人,科學探索的結構其實并不是這樣運作的。誰能確定下一個偉大的、可商業(yè)化的技術會從哪里來?所以癥結是,無目標性的探索貌似讓前景聽起來很悲觀,但它能使科學的世界變得更有趣。還有許多有趣又重要的發(fā)現(xiàn)等待我們?nèi)ヌ剿鳎l(fā)掘它們需要持續(xù)不斷的智慧投入和開放的心態(tài),而不是簡單的目標式蠻力。
你可能會一如既往地提出疑問:我們怎能如此自鳴得意而一味地推崇踏腳石的作用,卻不知道它們通向何方?這種想法不過是目標思維的負隅頑抗。正如前文所述,我們有充分的理由相信“但行前路,無問西東”,此舉實際上能夠引導我們通往一個更加光明的未來。因此,“不知去往何處”恰恰是信息收集器的運行方式、尋寶者的探寶方式、收集踏腳石的方式、通往任何地方的正確道路,是通往未來的途徑。“不知前路通往何方”,才是人類能創(chuàng)造偉大事物的原因。共識、可預測的重要性、與國家利益的一致性——這些都是目標思維的衍生物,只會導致我們在朝未知世界邁進的過程中,離我們想要的越來越遠。
作者簡介
[美]肯尼斯·斯坦利(Kenneth Stanley),全球創(chuàng)新思維和前沿科技領域的代表性專家、人工智能科學家,OpenAI研究員。曾任中佛羅里達大學教授,深耕機器學習領域,發(fā)表了80多篇專業(yè)論文,其中數(shù)10篇獲得了最佳論文獎,并經(jīng)常受邀在世界各地發(fā)表演講。他還曾是Uber人工智能實驗室的創(chuàng)始成員,在行業(yè)內(nèi)具有卓著的影響力。
[美]喬爾·雷曼(Joel Lehman),全球知名人工智能科學家,OpenAI研究員。他也曾是Uber人工智能實驗室的創(chuàng)始成員,目前在OpenAI做“大型語言模型(大模型)+演進算法”方面的研究,聚焦的領域包括人工智能安全、強化學習和開放式搜索算法。