【中譯】默里·沙納漢《技術(shù)奇點(diǎn)》(第三章)
譯者:李浚弘
第三章【工程人工智能】
第三章【第一節(jié)】;智能的暗示
到目前為止,我們已經(jīng)投入了大量的討論,以大腦為靈感,實(shí)現(xiàn)人類級(jí)別的AI,特別是全腦模擬。但是,可能的人工智能的空間可能是非常多樣化的,生物形式可能只占據(jù)其中的一小部分。剩下的可能性空間是什么樣的呢?這是一個(gè)非常重要的問(wèn)題,因?yàn)槿斯ぶ悄艿臉?gòu)建方式將塑造它的行為,并將決定我們預(yù)測(cè)或控制它的能力。 想象可能的人工智能空間充滿了像我們一樣的生物,它們的目標(biāo)和動(dòng)機(jī)與人類的目標(biāo)和動(dòng)機(jī)相似,這將是一個(gè)嚴(yán)重的錯(cuò)誤,也許是一個(gè)危險(xiǎn)的錯(cuò)誤。此外,取決于人工智能的構(gòu)建方式,一個(gè)人工智能或一個(gè)人工智能群體實(shí)現(xiàn)其目標(biāo)的方式(就這個(gè)概念的意義而言)可能是完全不可思議的,就像卡斯帕羅夫在棋盤上看到的外星智能的運(yùn)作方式一樣。如果人工智能是另一個(gè)人工智能的產(chǎn)物,或者是自我修改或人工進(jìn)化的結(jié)果,那么其潛在的不可知性將會(huì)更大。 那么,哪些設(shè)計(jì)和建造方法或多或少會(huì)導(dǎo)致不可預(yù)測(cè)且難以控制的人工智能?我們?cè)搅私饪赡苄缘目臻g,我們就越能更好地解決這個(gè)問(wèn)題,并減輕建立和失去對(duì)“錯(cuò)誤類型”人工智能的控制的風(fēng)險(xiǎn)。讓我們先來(lái)看一些當(dāng)代(2010年代中期)人工智能技術(shù)的例子。我們能在這些系統(tǒng)中發(fā)現(xiàn)通用人工智能的開端嗎?僅僅通過(guò)改進(jìn)和擴(kuò)展這些系統(tǒng)就能實(shí)現(xiàn)通用智能嗎?還是缺少了一些基本的東西,在人工智能技術(shù)真正起飛之前必須添加一個(gè)至關(guān)重要的因素? 我們將從一個(gè)無(wú)實(shí)體人工智能應(yīng)用程序的例子開始,即個(gè)人助理。在前一章中強(qiáng)調(diào)了具體化的重要性。但我們文化中熟悉的許多虛構(gòu)的人工智能例子都是沒(méi)有實(shí)體的。想想《2001太空漫游》里的電腦HAL吧。從某種意義上說(shuō),2001年的宇宙飛船可以被認(rèn)為是HAL的身體。它有一個(gè)明確的空間位置,它有傳感器和執(zhí)行器,通過(guò)這些傳感器和執(zhí)行器,它可以在連續(xù)的時(shí)間內(nèi)與環(huán)境相互作用。但在電影的某一點(diǎn)上,我們看到了HAL在地球?qū)嶒?yàn)室的早期“生活”場(chǎng)景,觀眾不知何故被說(shuō)服了,他的智慧是獨(dú)立于宇宙飛船的。我們?cè)敢鈺簳r(shí)放棄懷疑,這表明無(wú)實(shí)體的人工智能在概念上是可能的。但這在實(shí)踐中可能嗎?我們離實(shí)現(xiàn)它還有多遠(yuǎn)? 蘋果(Apple)的Siri和谷歌的Now等個(gè)人助理展示了幾十年來(lái)語(yǔ)音識(shí)別技術(shù)的逐步進(jìn)步。在沒(méi)有對(duì)個(gè)人用戶進(jìn)行事先培訓(xùn)的情況下,即使存在背景噪音,即使音色和口音有很大變化,它們也能夠?qū)⑵胀ǖ恼Z(yǔ)音轉(zhuǎn)換為文本。有趣的是,語(yǔ)音識(shí)別任務(wù)通常不是在用戶的設(shè)備上執(zhí)行的。原始聲音文件通過(guò)互聯(lián)網(wǎng)傳輸?shù)焦咎幚碇行模谀抢镞M(jìn)行語(yǔ)音識(shí)別并生成相應(yīng)的文本文件。因此,這些應(yīng)用程序不僅是脫離實(shí)體的,因?yàn)樗鼈儧](méi)有通過(guò)感覺運(yùn)動(dòng)互動(dòng)與環(huán)境互動(dòng),甚至它們的處理和記憶都分散在云端。這是否會(huì)讓他們?cè)谀撤N程度上“更加”脫離實(shí)體?不。我們可以想象一個(gè)完全具體化的機(jī)器人系統(tǒng),所有的處理都是在云端完成的。但這一點(diǎn)值得注意。 在將原始聲音數(shù)據(jù)轉(zhuǎn)換為文本的同時(shí),個(gè)人助理必須嘗試“理解”用戶要求它查找或指示它做什么。這本身就是一個(gè)相當(dāng)大的挑戰(zhàn),即使將聲音文件完美地轉(zhuǎn)錄為文本。然而,有了一個(gè)統(tǒng)計(jì)模型的幫助,這項(xiàng)任務(wù)變得更容易了,這個(gè)模型是由一個(gè)龐大的例子數(shù)據(jù)庫(kù)構(gòu)建的,它可以記錄人們所說(shuō)的各種話。給定一個(gè)問(wèn)題或命令的開頭,這使系統(tǒng)能夠預(yù)測(cè)它最有可能如何繼續(xù)。此外,這種預(yù)測(cè)也可以反饋到語(yǔ)音識(shí)別階段,以提高其性能,使其能夠填補(bǔ)存在噪聲或歧義的空白。 在正確解析用戶的話語(yǔ)后,系統(tǒng)可以決定如何回應(yīng)它。它是信息請(qǐng)求還是命令?假設(shè)這是對(duì)信息的請(qǐng)求。這些信息是特定于用戶的,比如會(huì)議時(shí)間或朋友的電話號(hào)碼,還是一項(xiàng)一般知識(shí)?如果這是一個(gè)常識(shí)問(wèn)題,那么系統(tǒng)可以調(diào)用互聯(lián)網(wǎng)上的所有資源來(lái)找到答案。然后,系統(tǒng)可以使用語(yǔ)音合成技術(shù)(語(yǔ)音合成比語(yǔ)音識(shí)別容易得多)將答案的文本轉(zhuǎn)換為聲音文件,并通過(guò)設(shè)備的揚(yáng)聲器發(fā)出口頭回應(yīng)。 這一切都令人印象深刻。誠(chéng)然,2010年代中期的數(shù)字個(gè)人助理的會(huì)話技能相當(dāng)有限。你不會(huì)邀請(qǐng)一個(gè)人參加晚宴。但在一代人之前,這種技術(shù)可能會(huì)讓na?ve的用戶相信,我們正在實(shí)現(xiàn)科幻小說(shuō)中關(guān)于人工智能的夢(mèng)想。而今天,即使知道它們是如何工作的,私人助理的能力還是有一些不可思議的地方,一種真正智慧的暗示。那么缺少什么呢?怎樣才能把這種離奇的感覺,這種智慧的暗示,轉(zhuǎn)化為有根據(jù)的信念呢? 第三章【第二節(jié)】;認(rèn)知世界
這些數(shù)字個(gè)人助理的一個(gè)主要缺點(diǎn)是,盡管它們有回答問(wèn)題的能力,但它們對(duì)世界并沒(méi)有真正的了解。例如,他們?nèi)狈?duì)固體物體和空間關(guān)系的常識(shí)性理解。因此,它們可能會(huì)被一些簡(jiǎn)單但意想不到的問(wèn)題所拋出,而這些問(wèn)題的直接答案在互聯(lián)網(wǎng)上是找不到的,盡管互聯(lián)網(wǎng)的知識(shí)庫(kù)非常龐大。例如,考慮一下這個(gè)問(wèn)題:“如果你吊著一只老鼠的尾巴,它的鼻子和耳朵哪個(gè)更靠近地面?”即使是小孩子也能輕松地解出這個(gè)小謎語(yǔ)。她可能從來(lái)沒(méi)有把老鼠的尾巴吊起來(lái),也沒(méi)有見過(guò)老鼠被尾巴吊起來(lái)的照片。然而,人類具有可視化情景和預(yù)測(cè)行動(dòng)后果的通用能力,這種能力可以處理他們以前從未遇到過(guò)的情況。 日常物理學(xué)是人類(和其他一些動(dòng)物)已經(jīng)掌握的一個(gè)領(lǐng)域,在這個(gè)領(lǐng)域,我們對(duì)基本原理的掌握使我們能夠解決我們以前從未見過(guò)的問(wèn)題。日常心理是另一回事。其他人的行為不像無(wú)生命的物體。他們有信仰、欲望和意圖。人類理解這一切,并利用這種理解來(lái)制定計(jì)劃、交流,有時(shí)也會(huì)欺騙。對(duì)于這兩個(gè)領(lǐng)域——日常的物理學(xué)和日常的心理學(xué)——人類理解的深度依賴于對(duì)一組基本抽象概念的掌握,比如對(duì)一個(gè)固體物體或另一個(gè)心靈的概念。 盡管人類這些能力背后的神經(jīng)機(jī)制還沒(méi)有被完全理解,但可以肯定的是,它們部分是天生的,是一種進(jìn)化的天賦。顯然,固體物體和其他人在原始人的生活中總是顯得很重要。將選擇用于處理這些問(wèn)題的通用機(jī)制。因此,即使固體物體的概念在出生時(shí)并不明顯,如果新生兒的大腦沒(méi)有傾向于獲得它,那將是令人驚訝的。然而,值得注意的是,人類也能夠獲得全新的概念,這些概念至少與固體物體或另一個(gè)心靈的概念一樣抽象,而且在我們的進(jìn)化歷史中沒(méi)有先例,比如整數(shù)或金錢的概念。 一臺(tái)機(jī)器如何被賦予同樣的通用能力——掌握重要的常識(shí)領(lǐng)域,如日常物理學(xué)和日常心理學(xué),以及獲得全新抽象概念的能力?當(dāng)然,一個(gè)答案是復(fù)制生物大腦。但是我們已經(jīng)詳細(xì)地討論過(guò)了。還有其他幾種可能性。就日常物理而言,一種可能性是使用計(jì)算機(jī)游戲中使用的那種物理引擎,并且已經(jīng)在虛擬體現(xiàn)的背景下進(jìn)行了簡(jiǎn)要討論。物理引擎可以模擬物體的任何給定配置(例如,老鼠的各個(gè)部分)并模擬它們的動(dòng)力學(xué)。 另一種方法是建立一個(gè)系統(tǒng),根據(jù)一套用形式語(yǔ)言表達(dá)的常識(shí)性物理定律,對(duì)日常事物進(jìn)行邏輯推理。例如,系統(tǒng)可能包含一個(gè)句子,表示不受支撐的物體通常會(huì)掉下來(lái)的規(guī)則,以及另一個(gè)句子,表示易碎的物體在碰到地面時(shí)通常會(huì)破碎。這些可以用來(lái)得出這樣的結(jié)論:一個(gè)倒在地上的酒杯如果滾下桌子就會(huì)破碎。同樣的基于邏輯的方法也可以應(yīng)用于其他領(lǐng)域,比如日常心理學(xué),而且與物理引擎相比,它還有一個(gè)額外的優(yōu)勢(shì),那就是更能容忍不完整的信息——比如桌子和酒杯的確切形狀。 然而,物理引擎和基于邏輯的方法都依賴于人類設(shè)計(jì)師提供的概念框架。關(guān)于機(jī)器人環(huán)境的信息——它周圍物體的表面——可以通過(guò)四處移動(dòng)、積累傳感器數(shù)據(jù)(來(lái)自相機(jī)、觸覺傳感器等)并將數(shù)據(jù)轉(zhuǎn)換成適合后續(xù)處理的形式來(lái)獲取。但是,對(duì)于任何一種系統(tǒng)的預(yù)測(cè)能力都至關(guān)重要的實(shí)體概念,并不是通過(guò)與世界的互動(dòng)而發(fā)現(xiàn)的。它是事先給定的,從一開始就內(nèi)置在系統(tǒng)中。對(duì)于某些普遍重要的專業(yè)領(lǐng)域(如日常物理學(xué))來(lái)說(shuō),這可能是可以接受的,但如果要應(yīng)對(duì)一個(gè)無(wú)法預(yù)先知道的世界,真正的通用智能也需要能夠?yàn)樽约喊l(fā)現(xiàn)(或發(fā)明)抽象概念。 第三章【第三節(jié)】;機(jī)器學(xué)習(xí)方法
這就引出了機(jī)器學(xué)習(xí)的話題。機(jī)器學(xué)習(xí)從一開始就是人工智能的一個(gè)活躍的子領(lǐng)域。但這門學(xué)科在2000年代取得了相當(dāng)大的進(jìn)步,部分原因是計(jì)算能力和存儲(chǔ)能力的提高,部分原因是理論的進(jìn)步和新的學(xué)習(xí)算法。這導(dǎo)致了新的商業(yè)應(yīng)用,例如在線營(yíng)銷,它可以有效地描述客戶,以便更有效地針對(duì)他們進(jìn)行產(chǎn)品推薦和廣告。 機(jī)器學(xué)習(xí)系統(tǒng)可以通過(guò)建立基于購(gòu)買和瀏覽習(xí)慣的客戶行為的大型數(shù)據(jù)庫(kù)。在這種模型的幫助下,系統(tǒng)可以預(yù)測(cè),僅基于幾次購(gòu)買和網(wǎng)站訪問(wèn)的客戶偏好。 一般來(lái)說(shuō),機(jī)器學(xué)習(xí)涉及到一個(gè)模型的構(gòu)建,這個(gè)模型可以解釋給定的數(shù)據(jù)集合,并可以用來(lái)預(yù)測(cè)進(jìn)一步的數(shù)據(jù)。例如,假設(shè)我向您展示序列5、10、15、20,并讓您猜接下來(lái)是什么。很有可能你會(huì)形成這樣的假設(shè),即數(shù)列以5為間隔增加,并預(yù)測(cè)下一個(gè)數(shù)字是25,然后是30、35,以此類推。如果數(shù)據(jù)來(lái)源于現(xiàn)實(shí)世界,那么數(shù)據(jù)很可能是有噪聲的。 所以機(jī)器學(xué)習(xí)算法必須能夠處理不確定性。假設(shè)一個(gè)移動(dòng)機(jī)器人是靜止的,但正被一個(gè)大物體接近。它獲得一系列傳感器讀數(shù),顯示物體的距離:24.9厘米,20.1厘米,15.1厘米,9.9厘米。它可能會(huì)形成一個(gè)假設(shè),即每次傳感器讀數(shù)到物體的距離減少大約5厘米,并預(yù)測(cè)下一次傳感器讀數(shù)將是5.0厘米±10%。是時(shí)候采取規(guī)避行動(dòng)了! 在這些簡(jiǎn)單的示例中,發(fā)現(xiàn)底層模式很容易。但是,假設(shè)每個(gè)數(shù)據(jù)項(xiàng)不是一個(gè)數(shù)字,而是包含一千個(gè)數(shù)字。在這樣的高維數(shù)據(jù)下,尋找模式、建立模型和做出預(yù)測(cè)將會(huì)困難得多。事實(shí)上,這比困難一千倍還要糟糕得多。這就是眾所周知的維度詛咒。值得慶幸的是,維度的詛咒可以被解除,數(shù)據(jù)顯示出已知的統(tǒng)計(jì)規(guī)律。例如,假設(shè)所討論的數(shù)據(jù)是來(lái)自視頻的一系列幀。在這種情況下,有一種統(tǒng)計(jì)趨勢(shì):(1)在任何給定幀中的一個(gè)像素具有與其相鄰像素接近的值,(2)同一像素在連續(xù)幀中具有相似的值。 像這樣的統(tǒng)計(jì)規(guī)律通常是世界基本結(jié)構(gòu)的一種表現(xiàn),從這些結(jié)構(gòu)中提取數(shù)據(jù)。對(duì)于帶攝像頭的移動(dòng)機(jī)器人來(lái)說(shuō),世界呈現(xiàn)出一種“平滑”。它充滿了固體物體,其表面呈現(xiàn)出許多均勻顏色的連續(xù)斑塊,相對(duì)較少的不連續(xù)邊緣。盡管有些,關(guān)于世界結(jié)構(gòu)的假設(shè)在設(shè)計(jì)時(shí)可能會(huì)被構(gòu)建成一種學(xué)習(xí)系統(tǒng),如其3D空間特征和普遍性在固體物體的內(nèi)部,世界的大部分結(jié)構(gòu)方式。它所包含的事物及其表現(xiàn)出的行為,都必須被發(fā)現(xiàn)。 因此,通過(guò)建立世界模型來(lái)學(xué)習(xí)預(yù)測(cè)傳入數(shù)據(jù)的任務(wù)包含了尋找壓縮數(shù)據(jù)以降低其維度的方法的挑戰(zhàn),例如,通過(guò)根據(jù)“動(dòng)物”,“樹”和“人”等概念和類別重新描述數(shù)據(jù)(這也是語(yǔ)言交流的有用基礎(chǔ))。然而,高維感官數(shù)據(jù)不能直接簡(jiǎn)化為這樣的高級(jí)類別。需要一種分層方法,其中首先提取底層特征。在編制了重復(fù)出現(xiàn)的低級(jí)視覺特征表之后,算法可以學(xué)習(xí)如何將這些特征組合成更高級(jí)的特征。這種多層次的方法是所謂深度學(xué)習(xí)的標(biāo)志。 例如,假設(shè)學(xué)習(xí)算法被設(shè)置為在一個(gè)大型圖像數(shù)據(jù)庫(kù)上工作,其中許多包含人臉。一張臉的存在可能是由形狀獨(dú)特的淺色和深色斑塊的特定模式發(fā)出的信號(hào)。這些可能與我們稱之為眼睛、鼻子和嘴的特征大致對(duì)應(yīng)。但他們可能不會(huì)。機(jī)器不受人類語(yǔ)言類別的限制。它挑選出的低層次、統(tǒng)計(jì)上顯著的視覺特征可能不適合直接的語(yǔ)言描述。(事實(shí)上,生物大腦的視覺感知也是如此,盡管人類的視覺感知受到語(yǔ)言自上而下的影響。) 學(xué)習(xí)算法掌握了數(shù)據(jù)的低級(jí)統(tǒng)計(jì)信息——反復(fù)出現(xiàn)的小尺度視覺圖案——就能知道這些圖案的某些組合經(jīng)常出現(xiàn)。其中一個(gè)這樣的組合對(duì)應(yīng)于我們所說(shuō)的臉。另一種組合(胡須、皮毛、尖尖的耳朵等)可能與我們所說(shuō)的貓相對(duì)應(yīng)?;蛘?,由于貓經(jīng)常被小個(gè)子人類抱著,算法可能會(huì)挑選出孩子和貓的配對(duì)。同樣,機(jī)器不受人類概念和類別的限制,只受數(shù)據(jù)統(tǒng)計(jì)的限制。 到目前為止,一切順利。我們已經(jīng)看到了機(jī)器學(xué)習(xí)算法如何處理靜態(tài)數(shù)據(jù)。但我們最終感興趣的是世界的動(dòng)態(tài)。我們一直在假設(shè)一個(gè)系統(tǒng)可以在靜態(tài)圖像數(shù)據(jù)庫(kù)中發(fā)現(xiàn)物體的類別。但視頻檔案又如何呢?總而言之,具體化的學(xué)習(xí)系統(tǒng)需要處理運(yùn)動(dòng)圖像,隨著源源不斷的感官數(shù)據(jù)的流入獲得預(yù)測(cè)能力。-如果是這樣的話,此外,對(duì)于具有滿足欲望和目標(biāo)的AI來(lái)說(shuō),只有在貓表現(xiàn)出獨(dú)特行為的情況下才值得在世界其他地方挑選貓,特別是當(dāng)這種行為與AI的欲望和目標(biāo)相關(guān)時(shí)(就像老鼠一樣)。 例如,如果我們的學(xué)習(xí)算法已經(jīng)獲得了類別“字符串”和類別“貓”,那么學(xué)習(xí)到貓經(jīng)常追逐繩子就成功了一半。再說(shuō)一次,我們不應(yīng)該被誤導(dǎo),認(rèn)為機(jī)器學(xué)習(xí)算法表示這條規(guī)則的方式就像人類語(yǔ)言中的句子一樣。相反,它將是數(shù)據(jù)結(jié)構(gòu)中參數(shù)值的集合,該數(shù)據(jù)結(jié)構(gòu)捕獲某些頻繁出現(xiàn)的視覺特征的運(yùn)動(dòng)統(tǒng)計(jì)數(shù)據(jù),這些特征本身將以類似的數(shù)學(xué)方式表示。但是,對(duì)于一個(gè)構(gòu)造合適的機(jī)器來(lái)說(shuō),結(jié)果是一樣的,對(duì)于一個(gè)了解這一事實(shí)的人來(lái)說(shuō)也是如此。例如,它將使人工智能處于一個(gè)有利的位置,以制定計(jì)劃,將一只貓引誘到一個(gè)籃子里,然后送到獸醫(yī)那里。 第三章【第四節(jié)】;大數(shù)據(jù)人工智能
讓我們來(lái)盤點(diǎn)一下。我們一直在討論可以學(xué)習(xí)世界統(tǒng)計(jì)數(shù)據(jù)的算法,可以在未標(biāo)記的多模態(tài)數(shù)據(jù)流中發(fā)現(xiàn)對(duì)象和行為的分層類別,并且可以使用這些類別將數(shù)據(jù)壓縮成可以用來(lái)進(jìn)行預(yù)測(cè)的數(shù)學(xué)描述。很容易看出,這種機(jī)器學(xué)習(xí)算法構(gòu)成了一種有用的技術(shù)。但它們能讓我們?cè)谕ㄓ萌斯ぶ悄芊矫孀叨噙h(yuǎn)? 想象一個(gè)AI按照下面的思路構(gòu)建。假設(shè)一種剛剛描述的學(xué)習(xí)算法被允許在互聯(lián)網(wǎng)上爬行,就像搜索引擎一樣,從它找到的數(shù)十億張圖片和數(shù)千萬(wàn)個(gè)視頻中吸取數(shù)據(jù)。人類已經(jīng)從日常生活中收集了海量的多媒體數(shù)據(jù),任何人(或任何東西)都可以通過(guò)網(wǎng)絡(luò)連接訪問(wèn)這些數(shù)據(jù)。網(wǎng)絡(luò)上的某個(gè)地方可以找到長(zhǎng)頸鹿做愛的電影片段,飛機(jī)繞圈飛行的電影片段、印度男人種土豆的電影片段和中國(guó)女孩修自行車的電影片段以及戰(zhàn)斗、董事會(huì)會(huì)議、建筑工地的電影片段。你能說(shuō)出它的名字,是因?yàn)橛腥伺牧艘欢我曨l放在網(wǎng)上。 由于社交網(wǎng)絡(luò)的眾包力量,這個(gè)已經(jīng)很大的公共數(shù)據(jù)存儲(chǔ)庫(kù)正在迅速增長(zhǎng)。此外,其中很多不僅僅是原始的感官數(shù)據(jù)。圖像和影片剪輯通常伴隨著位置、時(shí)間和日期信息,并且越來(lái)越多地伴隨著標(biāo)記對(duì)象和事件的標(biāo)簽。隨著越來(lái)越多的日常物品(垃圾桶、冰箱、鑰匙扣等)連接到互聯(lián)網(wǎng),收集更多關(guān)于日常世界的信息以及居住在其中的人類和其他動(dòng)物的行為信息將成為可能。 通過(guò)將強(qiáng)大的機(jī)器學(xué)習(xí)算法應(yīng)用于這個(gè)龐大的數(shù)據(jù)庫(kù),一個(gè)系統(tǒng)的預(yù)測(cè)能力能有多好?為什么系統(tǒng)需要具體化?既然有一個(gè)龐大的多媒體數(shù)據(jù)庫(kù),記錄著他人的具體活動(dòng),為什么它還需要直接與世界互動(dòng)呢?回想一下,長(zhǎng)期以來(lái),賦予計(jì)算機(jī)對(duì)日常世界的常識(shí)性理解的困難一直被認(rèn)為是實(shí)現(xiàn)人工通用智能的主要障礙。也許一個(gè)沒(méi)有實(shí)體的人工智能可以替代地獲得常識(shí)。這樣的系統(tǒng)能多接近人類水平的人工智能? 那么,語(yǔ)言呢?語(yǔ)言是人類行為的一個(gè)非常重要的方面,如果它不能與人類的語(yǔ)言能力相匹配,就不能算作達(dá)到人類水平的人工智能。2010年代中期的數(shù)字個(gè)人助理已經(jīng)非常擅長(zhǎng)預(yù)測(cè)用戶要說(shuō)什么。但很容易爭(zhēng)辯說(shuō),這些系統(tǒng)并不真正理解它們識(shí)別的單詞,它們解析的句子,或者它們提供的答案。他們使用的符號(hào)不是基于與世界的互動(dòng),當(dāng)他們被問(wèn)到需要想象力和常識(shí)相結(jié)合的新穎問(wèn)題時(shí),這個(gè)缺點(diǎn)就顯現(xiàn)出來(lái)了:“如果你用尾巴晃老鼠,它的尾巴更靠近地面,它的鼻子還是耳朵?” 機(jī)器學(xué)習(xí),無(wú)論多么強(qiáng)大,肯定不能幫助我們克服這種限制嗎?然而,語(yǔ)言只是另一種形式的行為。為什么它不容易受到暴力、統(tǒng)計(jì)機(jī)器學(xué)習(xí)的影響,而不是人群中的運(yùn)動(dòng)模式或花園中的植被模式?在這個(gè)問(wèn)題上投入足夠的數(shù)據(jù)和足夠的計(jì)算,機(jī)器學(xué)習(xí)將能夠很好地模擬相關(guān)的統(tǒng)計(jì)數(shù)據(jù),從而做出可靠的預(yù)測(cè)。這個(gè)人離開售貨亭后可能會(huì)去哪里?那棵樹的左邊可能會(huì)出現(xiàn)什么形狀的葉子?這個(gè)人會(huì)怎么回應(yīng)那個(gè)人說(shuō)的話呢?我們不能忘記,與今天的數(shù)字個(gè)人助理相比,我們的學(xué)習(xí)系統(tǒng)正在設(shè)想將利用一個(gè)更大的數(shù)據(jù)集,一個(gè)有效的數(shù)據(jù)集,經(jīng)驗(yàn)中的基本詞匯,與世界的具體互動(dòng),盡管像是一種有點(diǎn)二手的寄生種類。 那懸空老鼠的例子呢?我們的人工智能需要能夠處理假設(shè)、反事實(shí)和想象。這是一個(gè)基本的功能。但是,給定一個(gè)足夠的世界模型,一個(gè)具有足夠預(yù)測(cè)能力的模型,滿足這一要求所需要的只是一種用假設(shè)場(chǎng)景初始化模型的方法,一種用想象對(duì)象填充模型的方法。該模型的預(yù)測(cè)能力將完成剩下的工作,從數(shù)百萬(wàn)個(gè)懸掛物體的視頻、數(shù)千萬(wàn)個(gè)以無(wú)數(shù)姿勢(shì)做無(wú)數(shù)事情的老鼠的圖像和視頻,以及數(shù)十億個(gè)從每個(gè)可以想象的角度拍攝的耳朵和鼻子的例子中進(jìn)行歸納。 比如說(shuō),數(shù)學(xué)怎么樣?當(dāng)然不僅僅是統(tǒng)計(jì)學(xué)習(xí)系統(tǒng)能獲得數(shù)學(xué)能力嗎?(哲學(xué)專業(yè)的學(xué)生會(huì)在這里可以聽到經(jīng)驗(yàn)主義和理性主義之間爭(zhēng)論的回聲。)好,我們不排除為該系統(tǒng)提供各種固有類別和諸如實(shí)體對(duì)象或3D空間的概念。這些可能包括數(shù)字的概念。但我們甚至不清楚這是否必要。也許,對(duì)于學(xué)習(xí)算法來(lái)說(shuō),處理大量的小學(xué)數(shù)學(xué)課堂教學(xué)記錄,就足以讓它自己發(fā)現(xiàn)數(shù)字的概念。我們很難想象學(xué)習(xí)算法處理的大量原始數(shù)據(jù)會(huì)帶來(lái)什么影響,以及該系統(tǒng)可能會(huì)以何種方式讓我們感到驚訝。 2009年,谷歌的三位計(jì)算機(jī)科學(xué)家寫了一篇題為《數(shù)據(jù)的不合理有效性》的論文。這個(gè)標(biāo)題暗指機(jī)器學(xué)習(xí)中一個(gè)意想不到的現(xiàn)象。事實(shí)證明,使用具有一萬(wàn)億項(xiàng)的混亂數(shù)據(jù)集的機(jī)器學(xué)習(xí)可以在任務(wù)(例如機(jī)器翻譯)中非常有效,而使用僅具有百萬(wàn)項(xiàng)的干凈數(shù)據(jù)集的機(jī)器學(xué)習(xí)則完全無(wú)用。這是出乎意料的,因?yàn)橐话偃f(wàn)看起來(lái)是一個(gè)很大的數(shù)字。如果一個(gè)學(xué)習(xí)算法在包含一百萬(wàn)個(gè)樣本的訓(xùn)練集上不起作用,那么直觀的結(jié)論就是它根本不起作用。然而,事實(shí)證明,通常需要的是一個(gè)更大的訓(xùn)練集,只有當(dāng)計(jì)算機(jī)變得足夠強(qiáng)大,可以存儲(chǔ)和處理如此多的數(shù)據(jù)時(shí),這一點(diǎn)才會(huì)浮出水面。 這里的教訓(xùn)是,當(dāng)面對(duì)從零開始設(shè)計(jì)的人工智能時(shí),人工智能的運(yùn)作原理與生物大腦截然不同,我們應(yīng)該期待驚訝。特別是,如果一個(gè)人工智能系統(tǒng)依賴于如此龐大的數(shù)據(jù)量或如此快的處理速度,以至于它們很難直觀地掌握,那么它可能會(huì)以我們無(wú)法完全理解的方式解決我們不期望它解決的問(wèn)題。簡(jiǎn)而言之,人類級(jí)別的AI不一定要像人類。如果連人類水平的人工智能都是不可思議的,我們?cè)趺茨芟MA(yù)測(cè)和控制一個(gè)超級(jí)智能的人工智能呢?一個(gè)不僅在智力事務(wù)的各個(gè)領(lǐng)域都能與人類匹敵,而且在每一個(gè)轉(zhuǎn)折點(diǎn)都能智勝我們的系統(tǒng)? 第三章【第五節(jié)】;優(yōu)化與不確定性
當(dāng)然,預(yù)測(cè)能力并不能單獨(dú)構(gòu)成人工智能。相反,建立世界模型并利用這些模型進(jìn)行預(yù)測(cè)的能力,是達(dá)到其他目的的一種手段。動(dòng)物的智力表現(xiàn)在它的行為上。它展示了一種使命感。它有動(dòng)力,比如饑餓和恐懼,它可以形成目標(biāo)來(lái)支持這些動(dòng)力,比如獲得食物或回家。它通過(guò)對(duì)世界的行動(dòng)來(lái)實(shí)現(xiàn)它的目標(biāo),如果它很聰明,它會(huì)做出預(yù)測(cè)來(lái)幫助它實(shí)現(xiàn)這些目標(biāo)。當(dāng)我們的貓看到一只老鼠消失在樹樁后面時(shí),它期待著它的再次出現(xiàn),并耐心地等待。我們期望一個(gè)具體的人工通用智能的預(yù)測(cè)能力同樣能夠?yàn)槟繕?biāo)和驅(qū)動(dòng)力服務(wù)。它應(yīng)該表現(xiàn)出自己的使命感。無(wú)論是送包裹、做飯還是做手術(shù),只有當(dāng)它有目標(biāo)并有能力實(shí)現(xiàn)時(shí),我們才會(huì)認(rèn)為機(jī)器人具有一般智能。 沒(méi)有實(shí)體的人工智能呢?好吧,即使它的目的只是回答問(wèn)題和提供建議,要想成為人工通用智能,一個(gè)系統(tǒng)必須做的不僅僅是做出預(yù)測(cè)。雖然它本身不能直接對(duì)世界采取行動(dòng),但它應(yīng)該善于找出如何采取行動(dòng)以實(shí)現(xiàn)各種既定目標(biāo)。它可能被要求構(gòu)建一個(gè)有利可圖的投資組合,或計(jì)劃一個(gè)大型土木工程項(xiàng)目,或設(shè)計(jì)一種更好的藥物,更大的飛機(jī),或更快的計(jì)算機(jī)。如果它的智能真的是通用的,那么就有可能訓(xùn)練它做這些事情中的任何一件(或全部),以及許多其他事情,就像一個(gè)聰明的人一樣。 那么,除了預(yù)測(cè)能力之外,我們還需要什么來(lái)讓機(jī)器(無(wú)論是否具有實(shí)體)執(zhí)行這些具有挑戰(zhàn)性的任務(wù)呢?AI需要能夠規(guī)劃行動(dòng)路線,而擅長(zhǎng)規(guī)劃就是擅長(zhǎng)某種類型的優(yōu)化。事實(shí)上,優(yōu)化的主題是當(dāng)代從零開始設(shè)計(jì)通用人工智能的核心方法。規(guī)劃不僅可以被視為一種優(yōu)化形式,某些類型的機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺的各個(gè)方面以及與人工智能相關(guān)的許多其他問(wèn)題也可以被視為一種優(yōu)化形式。因此,有必要詳細(xì)研究一下這個(gè)概念,我們將使用一個(gè)具體的例子,即旅行銷售人員問(wèn)題。 假設(shè)一個(gè)旅行者(或銷售人員)面臨著依次訪問(wèn)多個(gè)城市然后返回家鄉(xiāng)的挑戰(zhàn)。她必須訪問(wèn)每個(gè)城市一次,最后回到她開始的地方。但是她選擇的順序會(huì)影響她的整體旅行時(shí)間,她不想在路上花更多的時(shí)間。假設(shè)她住在舊金山,必須訪問(wèn)紐約、波士頓和圣何塞。因?yàn)榕f金山和圣何塞相距很近,但離紐約和波士頓很遠(yuǎn),所以從舊金山到紐約,再到圣何塞,再到波士頓,再回到舊金山是不合理的。這是次優(yōu)解。如果她在紐約之后馬上去波士頓,旅途時(shí)間會(huì)短一些。我們面臨的挑戰(zhàn)是找到最優(yōu)的解決方案,即游覽城市的最佳順序,也就是說(shuō),使整體旅行時(shí)間最短的順序。 旅行推銷員問(wèn)題只是優(yōu)化問(wèn)題的一個(gè)例子。一般來(lái)說(shuō),任務(wù)是找到一些數(shù)學(xué)上定義良好的結(jié)構(gòu),使某些成本函數(shù)最小化(或者,等價(jià)地,使所謂的效用函數(shù)或獎(jiǎng)勵(lì)函數(shù)最大化)。在這種情況下,數(shù)學(xué)結(jié)構(gòu)是城市的排序,成本函數(shù)是總行程時(shí)間。只要去幾個(gè)城市看看,這個(gè)問(wèn)題看起來(lái)并不難。但是,像許多優(yōu)化問(wèn)題一樣,旅行銷售人員問(wèn)題不能很好地?cái)U(kuò)展。在特定的數(shù)學(xué)意義上(我們不會(huì)深入討論細(xì)節(jié)),這個(gè)問(wèn)題的難度隨著城市數(shù)量的增加呈指數(shù)增長(zhǎng)。 實(shí)際上,這意味著,對(duì)于大量的城市,即使是最快的傳統(tǒng)計(jì)算機(jī)上最快的算法也可能難以在合理的時(shí)間內(nèi)找到最佳解決方案。然而,有些算法可以為大量的城市找到一個(gè)好的解決方案,盡管它們可能找不到最好的解決方案。這是幸運(yùn)的,因?yàn)槁眯型其N員的問(wèn)題不僅僅是一種求知欲。它有許多實(shí)際應(yīng)用,通常找到一個(gè)好的解決方案就足夠了。 在我們回到通用人工智能之前,讓我們考慮另一個(gè)優(yōu)化問(wèn)題,在這個(gè)問(wèn)題中,找到一個(gè)好的解決方案就足夠了。假設(shè)我們面對(duì)的不是旅行推銷員,而是我們的貓Tooty。當(dāng)Tooty從瞌睡中醒來(lái)時(shí),他的任務(wù)不是參觀城市,而是參觀一些當(dāng)?shù)氐囊捠车攸c(diǎn),他經(jīng)常在那里找到食物(例如,鄰居的廚房)。當(dāng)然,從一個(gè)這樣的地點(diǎn)移動(dòng)到另一個(gè)這樣的地點(diǎn)需要消耗能量,他希望盡量減少他使用的能量。他還想最大限度地增加他的食物攝入量。但令人惱火的是,當(dāng)它到達(dá)覓食地點(diǎn)時(shí),并不能保證它能找到食物。(鄰居的貓可能先到的。)然而,根據(jù)他過(guò)去的經(jīng)驗(yàn),Tooty“知道”在任何給定地點(diǎn)找到食物的可能性。 現(xiàn)在,Tooty的任務(wù)是計(jì)劃一次當(dāng)?shù)匾捠车攸c(diǎn)的旅行,以最大化他的預(yù)期獎(jiǎng)勵(lì),他每次旅行獲得的獎(jiǎng)勵(lì)是他總食物攝入量和消耗能量的函數(shù)。與旅行銷售人員的問(wèn)題不同,旅游不需要走遍每一個(gè)地點(diǎn)。因此,一個(gè)好的策略可能是放棄遙遠(yuǎn)的、沒(méi)有希望的地點(diǎn)。否則,此優(yōu)化任務(wù)與旅行銷售人員問(wèn)題非常相似,并且至少在計(jì)算上同樣困難。主要的額外因素是不確定性。無(wú)論Tooty想出多么好的計(jì)劃,都不能保證他能得到多少食物。在糟糕的一天,他甚至可能什么都得不到。 但不確定性是生活的現(xiàn)實(shí)。因此,無(wú)論機(jī)器學(xué)習(xí)算法多么聰明,它都無(wú)法建立一個(gè)每次都能正確的預(yù)測(cè)模型。相反,鑒于有限的、不完整的數(shù)據(jù),我們所能期望的最好結(jié)果是一個(gè)概率模型,一個(gè)能夠預(yù)測(cè)最可能結(jié)果的模型。給定一個(gè)概率模型,根據(jù)該模型,選擇的最佳行動(dòng)方案將使預(yù)期回報(bào)最大化。然而,我們?nèi)匀辉谔幚硪粋€(gè)明確的優(yōu)化任務(wù)。不確定性并沒(méi)有讓我們超越數(shù)學(xué)和計(jì)算的范圍。它只是把我們帶入了概率論的數(shù)學(xué)領(lǐng)域。 第三章【第六節(jié)】;通用人工智能
當(dāng)然,一只真正的貓不會(huì)像這幅漫畫中的貓那樣。真正的Tooty不會(huì)在建立食物供應(yīng)的概率模型時(shí)四處閑逛,不吃東西,然后回到籃子里,找出一條最佳路線。像任何適應(yīng)能力強(qiáng)的動(dòng)物一樣,貓會(huì)在覓食時(shí)學(xué)習(xí),在學(xué)習(xí)時(shí)覓食。探索世界的事業(yè)和開發(fā)世界資源的事業(yè)合二為一。這是正確的策略,理性的策略。正如我們將看到的,一個(gè)類似的策略,一個(gè)交織機(jī)器學(xué)習(xí)和優(yōu)化的策略,是人工通用智能的一個(gè)很好的基礎(chǔ)。 對(duì)于人工智能研究人員來(lái)說(shuō),在不同情況下嘗試不同的行動(dòng),看看哪種行動(dòng)最有效,從而最大化預(yù)期回報(bào)的任務(wù)被稱為強(qiáng)化學(xué)習(xí)。旅行推銷員問(wèn)題和覓食貓問(wèn)題是優(yōu)化的非常具體的例子。任何只能解決旅行銷售人員問(wèn)題的算法,無(wú)論速度有多快,都不能構(gòu)成人工通用智能。相比之下,強(qiáng)化學(xué)習(xí)的概念,以及其核心的最大化預(yù)期獎(jiǎng)勵(lì)的概念,并不局限于特定的問(wèn)題。事實(shí)上,我們可以在這個(gè)想法的基礎(chǔ)上,指定一種形式的通用人工智能。 通用人工智能的理論概念,最早是由馬庫(kù)斯·哈特(Marcus Hutter)提出的,類似于通用計(jì)算,這是艾倫·圖靈(Alan Turing)對(duì)計(jì)算機(jī)科學(xué)最重要的貢獻(xiàn)之一。通用計(jì)算機(jī)是一種可以計(jì)算任何給定正確程序所能計(jì)算的東西的計(jì)算機(jī)。圖靈的成就在于用數(shù)學(xué)方法確定了這種計(jì)算機(jī)的概念。與圖靈的抽象計(jì)算設(shè)備(我們現(xiàn)在稱之為圖靈機(jī))不同,真正的計(jì)算機(jī)受到有限內(nèi)存的限制。然而,從理論上講,每一臺(tái)已經(jīng)建成的數(shù)字計(jì)算機(jī)都可以計(jì)算任何可能計(jì)算的東西。它們都繼承了圖靈數(shù)學(xué)公式的通用性。 類似地,一個(gè)通用的人工智能總是根據(jù)它所獲得的信息選擇一個(gè)最大限度地提高預(yù)期回報(bào)的行動(dòng),無(wú)論它發(fā)現(xiàn)自己處于什么樣的世界??梢哉f(shuō),它是一個(gè)完美的人工智能,它的決策保證會(huì)充分利用輸入的數(shù)據(jù)。就像圖靈的通用計(jì)算概念一樣,這個(gè)想法可以在數(shù)學(xué)上精確地表達(dá)出來(lái)。(這里我們就不詳述了。)和圖靈的概念一樣,這個(gè)數(shù)學(xué)理想在實(shí)踐中是無(wú)法實(shí)現(xiàn)的。相反,它是對(duì)人工智能概念的理論限制,就像圖靈的概念是對(duì)計(jì)算概念的理論限制一樣。 盡管它不切實(shí)際,但通用人工智能的正式概念不僅僅是數(shù)學(xué)家的玩物。首先,有一些近似的方法可以在實(shí)踐中實(shí)現(xiàn)。但與當(dāng)前討論更相關(guān)的觀察是,Hutter的數(shù)學(xué)特征意味著人工通用智能符合一個(gè)簡(jiǎn)單的通用架構(gòu)。這種架構(gòu)交織了兩個(gè)過(guò)程:機(jī)器學(xué)習(xí),構(gòu)建世界的概率預(yù)測(cè)模型,以及優(yōu)化,根據(jù)這些模型找到最大化預(yù)期回報(bào)的行動(dòng)。 這種雙組件架構(gòu)藍(lán)圖具有非常廣泛的應(yīng)用。事實(shí)上,任何智能體,無(wú)論是人工的還是生物的,都可以根據(jù)其結(jié)構(gòu)進(jìn)行分析。需要問(wèn)三個(gè)問(wèn)題(或三組問(wèn)題)。首先,agent的獎(jiǎng)勵(lì)函數(shù)是什么?回答這個(gè)問(wèn)題將告訴我們很多關(guān)于它可能如何表現(xiàn)的信息。第二,它是如何學(xué)習(xí)的?它使用的是什么數(shù)據(jù),使用的是什么學(xué)習(xí)技術(shù),對(duì)世界的先驗(yàn)知識(shí)是什么?第三,它如何最大化自己的預(yù)期回報(bào)?它所使用的優(yōu)化技術(shù)有多強(qiáng)大?他們擅長(zhǎng)解決什么樣的問(wèn)題,他們的弱點(diǎn)和局限是什么? 考慮一種非人類的動(dòng)物,比如烏鴉,它能夠通過(guò)嘗試和錯(cuò)誤學(xué)習(xí)復(fù)雜的行為,也具有一定程度的創(chuàng)新解決問(wèn)題的能力。它的獎(jiǎng)勵(lì)功能是什么?像任何動(dòng)物一樣,烏鴉的獎(jiǎng)勵(lì)功能有利于獲得食物和水等東西,同時(shí)避免危險(xiǎn)和不適。這些看似簡(jiǎn)單的需求。但是,在獲取食物的障礙的幌子下,可以出現(xiàn)任意復(fù)雜的問(wèn)題。 例如,為了測(cè)試烏鴉的認(rèn)知能力,研究人員可能會(huì)把一只蠕蟲放在一個(gè)盒子里,盒子的蓋子只有通過(guò)解決一個(gè)難題才能打開。烏鴉是一種特別聰明的動(dòng)物,可以用這種方式解決簡(jiǎn)單的規(guī)劃問(wèn)題。但更棘手的問(wèn)題也可以用同樣的形式。例如,一只不太幸運(yùn)的烏鴉可能不得不贏得一盤國(guó)際象棋才能打開蓋子。這只烏鴉肯定會(huì)挨餓的。但關(guān)鍵是,獲得食物等資源的必要性可以被認(rèn)為是一種普遍的獎(jiǎng)勵(lì)功能。在復(fù)雜的環(huán)境中,可以轉(zhuǎn)化為獲取簡(jiǎn)單資源的挑戰(zhàn)的問(wèn)題類別是無(wú)限的。 第一個(gè)問(wèn)題就講到這里,獎(jiǎng)勵(lì)函數(shù)的問(wèn)題。下一個(gè)問(wèn)題是烏鴉是如何學(xué)習(xí)的。烏鴉從通過(guò)感官涌入的數(shù)據(jù)中學(xué)習(xí),這要?dú)w功于它與物理世界的具體互動(dòng),這個(gè)世界體現(xiàn)了許多物體,有生命的和無(wú)生命的,具有豐富多樣的形狀和動(dòng)態(tài)。烏鴉學(xué)會(huì)了這些物體在被推、戳、啄、叫或被單獨(dú)留下時(shí)的行為。它是如何做到這一點(diǎn)的,這個(gè)過(guò)程的神經(jīng)基礎(chǔ)是什么,是一個(gè)我們還沒(méi)有回答的科學(xué)問(wèn)題。但是動(dòng)物認(rèn)知研究人員已經(jīng)讓我們很好地了解了像烏鴉這樣的動(dòng)物可以形成的各種聯(lián)想,它們可以做出的各種感官區(qū)分,等等。 烏鴉在尋找能最大化預(yù)期回報(bào)的行動(dòng)方面有多擅長(zhǎng)?以烏鴉為例,答案比大多數(shù)動(dòng)物都要好。它具有豐富的潛在操作表,其中包括工具使用。這些構(gòu)成了許多先天刺激反應(yīng)行為的基礎(chǔ),這些行為是進(jìn)化對(duì)世界有用的先驗(yàn)假設(shè)對(duì)烏鴉獎(jiǎng)勵(lì)最大化能力的貢獻(xiàn)。但是烏鴉不僅僅是簡(jiǎn)單地依賴于一個(gè)查找表來(lái)映射刺激到反應(yīng)(這甚至對(duì)于工具使用來(lái)說(shuō)也足夠了)。它可以找到新的行動(dòng)序列來(lái)解決以前看不見的問(wèn)題,有時(shí)還會(huì)創(chuàng)新出新的行為類型(例如,制造一種新的工具)。同樣,這種能力的神經(jīng)基礎(chǔ)尚未被揭示。但烏鴉的優(yōu)化方法,不管它是什么,似乎是非常普遍的,非常強(qiáng)大的,至少與其他非人類動(dòng)物相比。 所有這些都告訴我們?yōu)貘f的能力和局限性,并幫助我們預(yù)測(cè)它們的行為。例如,我們知道,烏鴉可能會(huì)掀翻垃圾箱來(lái)獲取食物殘?jiān)?。但我們不必?fù)?dān)心它會(huì)侵入我們的銀行賬戶,偷走我們的錢。為了更好地理解不同種類的人工智能的能力和局限性,我們可以問(wèn)同樣的問(wèn)題。不同類型的獎(jiǎng)勵(lì)功能的含義是什么?人工智能可能配備什么樣的機(jī)器學(xué)習(xí)技術(shù)?他們將使用什么數(shù)據(jù)?為了最大化AI的預(yù)期獎(jiǎng)勵(lì),可以使用哪種優(yōu)化算法? 第三章【第七節(jié)】人類水平和類人智能
烏鴉,像黑猩猩、狗、大象和許多其他非人類動(dòng)物一樣,聰明得令人印象深刻。但它們遠(yuǎn)不如人類聰明。動(dòng)物級(jí)別的AI會(huì)很有用。比如,一個(gè)擁有狗智力的機(jī)器人可以完成一系列有價(jià)值的任務(wù)。但我們真正關(guān)心的是人類水平的人工智能。我們想知道如何構(gòu)建一個(gè)人工智能,使其在幾乎所有智力活動(dòng)領(lǐng)域都能與典型的人類相媲美,甚至在某些方面超過(guò)典型的人類?;蛘咧辽傥覀兿M麑?duì)這樣的人工智能如何工作形成一個(gè)充分的概念,以想象如果它包含這樣的機(jī)器,未來(lái)會(huì)是什么樣子。然后,我們可以開始考慮超級(jí)智能人工智能的可能性,人工智能能夠在智力活動(dòng)的各個(gè)領(lǐng)域勝過(guò)人類。 無(wú)論我們考慮的是人類級(jí)別的AI還是超級(jí)智能AI,我們都需要問(wèn)與之前相同的三個(gè)問(wèn)題:它的獎(jiǎng)勵(lì)功能是什么?它是如何學(xué)習(xí)的?學(xué)到了什么?它如何優(yōu)化預(yù)期獎(jiǎng)勵(lì)?但在我們開始這個(gè)想象的練習(xí)之前,對(duì)智人提出同樣的問(wèn)題是有益的。首先,什么是人類的獎(jiǎng)勵(lì)功能?當(dāng)然,我們和其他動(dòng)物有著大致相同的潛在獎(jiǎng)勵(lì)功能。人類需要食物和水,不喜歡痛苦,享受性愛,等等。此外,人類的獎(jiǎng)勵(lì)功能是“普遍的”,就像烏鴉一樣:理論上,任何智力挑戰(zhàn)都可以以獲得食物或性的名義呈現(xiàn)給人類。然而,值得注意的是,人類似乎能夠從根本上改變他們的獎(jiǎng)勵(lì)功能。 許多動(dòng)物物種會(huì)學(xué)會(huì)將物體或事件與獎(jiǎng)勵(lì)聯(lián)系起來(lái),就像巴甫洛夫的狗這個(gè)著名的例子一樣,它在反復(fù)地同時(shí)受到兩種刺激后,學(xué)會(huì)了將鈴聲和食物的到來(lái)聯(lián)系起來(lái)。最后,即使在沒(méi)有食物的情況下,狗也會(huì)在聽到鈴聲時(shí)開始流口水。這種條件反射對(duì)于最大化預(yù)期獎(jiǎng)勵(lì)很有用。在競(jìng)爭(zhēng)環(huán)境中,當(dāng)聽到鈴聲時(shí)跑向碗的狗會(huì)比不知道這種相關(guān)性的狗得到更多的食物。但在這種情況下,潛在的獎(jiǎng)勵(lì)功能并沒(méi)有真正改變。它仍然牢牢地建立在生物學(xué)基礎(chǔ)之上。 相比之下,在人類中,從童年開始,由復(fù)雜的社會(huì)線索和期望介導(dǎo)的層層關(guān)聯(lián)可能導(dǎo)致獎(jiǎng)勵(lì)功能與生物學(xué)之間的明顯脫節(jié)。事實(shí)上,甚至可以說(shuō),我們?nèi)诵缘囊徊糠直举|(zhì)是超越生物學(xué)偶然性的能力。人類演奏音樂(lè)、寫詩(shī)、設(shè)計(jì)花園等等。毫無(wú)疑問(wèn),從事這種活動(dòng)往往是為了經(jīng)濟(jì)利益或社會(huì)地位,其動(dòng)機(jī)可以用生物學(xué)的必要性來(lái)解釋。但有時(shí)它們確實(shí)是對(duì)美好生活構(gòu)成的反思的結(jié)果,因此它們本身就成為目的,而不僅僅是獲取食物或避免危險(xiǎn)或其他具有明顯進(jìn)化價(jià)值的東西的替代品。 這就引出了人類如何認(rèn)識(shí)世界的問(wèn)題,以及與其他動(dòng)物相比,人類的認(rèn)識(shí)是否有什么獨(dú)特之處。答案是顯而易見的。人類獎(jiǎng)勵(lì)功能的開放性之所以成為可能,要?dú)w功于社會(huì)、文化,但首先是語(yǔ)言。正是由于語(yǔ)言,我們才能像在哲學(xué)、藝術(shù)和文學(xué)中那樣反思人類的狀況。如果沒(méi)有這樣的反思,我們很難看到我們?nèi)绾文軌蚩朔锏谋匾?,我們似乎做到了。也正因?yàn)橛辛苏Z(yǔ)言,人類才能夠在技術(shù)發(fā)展中進(jìn)行合作,一代技術(shù)勞動(dòng)的成果才能夠如此容易地傳遞給下一代。所以,除了學(xué)習(xí)日常的物理、自然和社會(huì)世界之外,人類還必須能夠?qū)W習(xí)語(yǔ)言。從他人的信仰、欲望、情緒狀態(tài)等方面理解他人思想的傾向,有助于讓學(xué)習(xí)變得容易處理。 最后,人類如何最大化預(yù)期獎(jiǎng)勵(lì)?再一次,社會(huì)、文化和語(yǔ)言在這里是突出的。人類的智慧是集體的。人類技術(shù)不僅是許多個(gè)人及其勞動(dòng)的產(chǎn)物,而且是許多代人的產(chǎn)物。知識(shí)、專業(yè)技能和基礎(chǔ)設(shè)施一層一層地積累,每一代人都建立在上一代人的成就之上。因此,個(gè)人的優(yōu)化能力是專門用于在社會(huì)中最大化回報(bào)的。一個(gè)人的獎(jiǎng)賞功能是令人欽佩的還是可鄙的,一個(gè)人是圣人還是罪人,都沒(méi)有區(qū)別。一個(gè)人必須想辦法從別人那里得到她想要的東西,考慮到她所處的社會(huì),并利用這個(gè)社會(huì)的語(yǔ)言資源來(lái)做到這一點(diǎn)。 無(wú)論是集體行動(dòng)還是單獨(dú)行動(dòng),創(chuàng)新能力都是人類優(yōu)化獎(jiǎng)勵(lì)策略的另一個(gè)關(guān)鍵要素。(回想一下,在第一章中,賦予計(jì)算機(jī)創(chuàng)造力被認(rèn)為是實(shí)現(xiàn)人工通用智能的主要障礙。)農(nóng)業(yè)、寫作、印刷術(shù)、蒸汽機(jī)、計(jì)算機(jī)等發(fā)明,都對(duì)人類健康、預(yù)期壽命和總體福祉做出了巨大貢獻(xiàn),從而有助于在很長(zhǎng)一段時(shí)間內(nèi)實(shí)現(xiàn)回報(bào)最大化。除了追求健康長(zhǎng)壽之外,人類的獎(jiǎng)勵(lì)功能還受到性選擇、社會(huì)地位競(jìng)爭(zhēng)和其他特殊生物因素的影響。其結(jié)果是不那么明顯的功利形式的創(chuàng)造力,如舞蹈、儀式、時(shí)尚、藝術(shù)、音樂(lè)和文學(xué)。 現(xiàn)在,從頭開始設(shè)計(jì)的人類級(jí)別的人工智能會(huì)是什么樣子?在多大程度上,這三個(gè)關(guān)鍵問(wèn)題——獎(jiǎng)勵(lì)功能、學(xué)習(xí)和優(yōu)化——對(duì)這種人工智能的答案應(yīng)該與對(duì)人類的答案相似?好吧,如果一個(gè)人工智能是類似人類的,它應(yīng)該大致符合上述模式,即使它的設(shè)計(jì)和結(jié)構(gòu)與人類的大腦沒(méi)有任何相似之處。然而,正如我們?cè)凇皵?shù)據(jù)的不合理有效性”的背景下所指出的那樣,人類水平的人工智能沒(méi)有理由像人類一樣。只要人工智能能夠在大多數(shù)智力活動(dòng)領(lǐng)域與典型的人類相匹配,甚至在少數(shù)領(lǐng)域超過(guò)典型的人類,它的智力就有資格達(dá)到人類的水平。 這給變異留下了很大的空間,就像我們?cè)谌祟惾后w中發(fā)現(xiàn)的大量變異一樣。有些人擅長(zhǎng)數(shù)字,有些人擅長(zhǎng)文字。有些人善于交際,有些人則更擅長(zhǎng)科技。同樣,人類水平的人工智能可能擁有非常大的工作記憶容量,或者在數(shù)據(jù)中搜索模式方面非常熟練,但卻無(wú)法寫出一部有價(jià)值的小說(shuō)或設(shè)計(jì)一種新的音樂(lè)形式(就像大多數(shù)人類一樣)。但是,如果人工智能具有某種能力,不僅能與人類匹敵,而且在智力活動(dòng)的各個(gè)領(lǐng)域都能智勝人類,那會(huì)怎么樣呢?這樣的超級(jí)智能機(jī)器可能存在嗎?創(chuàng)造它的后果是什么?這些都是下一章要討論的問(wèn)題。