認知心理學 (中文) 1 - 什么是智能?誰能夠思考?

新坑!復雜認知/認知心理學系列文集將是中文版!我們如何變得如此聰明?我們是如何感知周圍的世界、學習語言、制定決策、記得過去、并預測未來的?大量的神經(jīng)組織如何思考?怎么樣產(chǎn)生想法?這些都是本系列專欄將嘗試回答或啟發(fā)思考的問題。
本系列可以配套與《思考,快與慢》系列文集一起閱讀,本系列的正文也將會出現(xiàn)《思考,快與慢》的書評。
首先,我們來考慮幾個問題:
自動駕駛車是否可以“思考”?自動駕駛車是否是“智能”的?
可以配套觀看自動駕駛車的視頻:[TED-Ed] 中文字幕 自動駕駛車是如何"看到"的?Sajan Saini: How do self-driving cars "see"?_嗶哩嗶哩 (゜-゜)つロ 干杯~-bilibili
?
圖靈測試
你聽說過圖靈測試嗎?你認為機器可以思考嗎?為什么?
圖靈測試(The Turing test)一詞源自人工智能之父艾倫·麥席森·圖靈所寫于1950年的一篇論文《計算機器與智能》(Computing Machinery and Intelligence)。該論文預言了能夠創(chuàng)造出具有真正“智能(intelligence)”的機器的可能性。
由于“智能”這個詞難以定義,圖靈提出了著名的圖靈測試:若一臺機器能夠通過電傳設備(不是聲音)與人類展開對話,而不能被人類辨別出其機器的身份,那么則稱這臺機器具有“智能”。
1952年,圖靈在一次BBC廣播中提出了讓計算機來冒充人的想法:如果不足70%的人判斷出機器的身份,即大于三成的回答者誤以為在和自己說話的是人而非機器,那么就算作這臺機器具有“智能”。
這一具體想法使得創(chuàng)造出“思考的機器”是有可能的。進行多次測試后,如果機器能夠讓平均每個參與者做出超過三成的誤判,那么就稱這臺機器通過了圖靈測試,并被認為具有人類智能。
論文《計算機器與智能》還回答了對圖靈的這一假說的各種常見質疑。圖靈測試是人工智能哲學方面的第一個嚴肅的提案,具有重大意義。
?
圖靈采用“問”與“答”模式,即觀察者C通過打字機向兩個測試對象通話,其中一個是人B,另一個是機器A。要求觀察者C不斷提出各種問題,從而辨別回答者是人B還是機器A。

圖靈的幾個示范性問題:
- 問: 請給我寫出有關“第四號橋”主題的十四行詩。
- 答:不要問我這道題,我從來不會寫詩。
- 問:34957加70764等于多少?
- 答:(停30秒后)105721。
- 問:你會下國際象棋嗎?
- 答:是的。
- 問:我在我的K1處有棋子K;你僅在K6處有棋子K,在R1處有棋子R。輪到你走,你應該下哪步棋?
- 答:(停15秒鐘后)棋子R走到R8處,將軍!
圖靈指出:“如果機器在某些現(xiàn)實的條件下,能夠非常好地模仿人回答問題,以至提問者在相當長時間里誤認它不是機器,那么機器就可以被認為是能夠思維的。”
?
人機測試舉例:
- 問:你會下國際象棋嗎?
- 答:是的。
- 問:你會下國際象棋嗎?
- 答:是的。
- 問:請再次回答,你會下國際象棋嗎?
- 答:是的。
這樣的呆板回答,你面前的這位應該是一部笨蛋機器。
?
如果是這樣的狀態(tài):
- 問:你會下國際象棋嗎?
- 答:是的。
- 問:你會下國際象棋嗎?
- 答:是的,我不是已經(jīng)說過了嗎?
- 問:請再次回答,你會下國際象棋嗎?
- 答:你(TMD)煩不煩啊,換個問題行不行?
那么你面前的這位,大概是人而不是機器。
上述兩種對話的區(qū)別在于,第一種明顯是從知識庫里提取的答案,而第二種則具有綜合分析的能力,回答的人知道觀察者C在反復提出同樣的問題。
?
中文房間 Chinese Room
中文房間是由美國哲學教授約翰·希爾勒提出的一個思想實驗,來反駁強人工智能的觀點。
實驗過程:一個完全不懂中文(比如只說英語)的人關在一間只有一個通道的封閉房間中。房間里有一本用英文寫成的說明書,指示此人該如何處理收到的中文信息并以中文回復。房外的人不斷向房間內遞進用中文寫成的問題。房內的人便根據(jù)說明書的指示,將相應的中文字符組合成回答遞出房間。
約翰·希爾勒認為,盡管房里的人可以假裝讓房外的人以為他確實會說中文,但事實上他完全不懂中文。在上述過程中,房外人相當于程序員,房內人相當于計算機,而說明書則相當于計算機程序:每當房外人給出一個“輸入”,房內的人便依照說明書“程序”給出一個“輸出”。而正如房內人不能通過說明書理解中文一樣,計算機也不能通過程序來獲得理解能力。既然計算機沒有理解能力,所謂“計算機于是便有智能”便更無從談起了。
論文《計算機器與智能》
“我們的目光所及,只是不遠的前方,但是可以看到,那里有大量需要去做的工作?!?
“We can only see a short distance ahead, but we can see plenty there that needs to be done.”?
我將把《計算機器與智能》的全文翻譯放在下一期專欄。這一期專欄將截取一些片段以供大家思考。
片段:
1. 模仿游戲(Imitation Game)
我建議考慮這樣一個問題∶“機器能夠思考么?”要回答這個問題,我們需要先給出“機器”和“思考”的定義。我們可以用盡可能接近它們普通用法的方式定義這些詞語。但是這種方式是危險的。如果使用這種方式,我們很可能會用蓋勒普調查那樣的統(tǒng)計方式來得出“機器能夠思考么”這個問題的結論及其意義。顯然,這是荒謬的。因此,我沒有嘗試給出一個定義,而是提出了另外一個問題。這個問題和原問題緊密相關,而且通過并不含糊的詞語給出。
這個新的問題可以通過一個游戲來描述,不妨稱之為“模仿游戲”。需要三個人來玩這個游戲。一個男人(A),一個女人(B)和一個詢問人(C)男女皆可。詢問人呆在一個與另外兩人隔離的屋子里。游戲的目標是詢問人判斷出外面的人哪個是男人,哪個是女人。詢問人用標簽X,Y代表外面的兩個人,游戲結束時,他要說出“X是A,Y是B”或者“X是B,Y是 A”。詢問人C允許向 A和B提出下面這樣的問題∶
C∶ X,請告訴我你頭發(fā)的長度。
現(xiàn)在假如X實際是A,那么A必須回答。A在游戲中的目標是努力使C做出錯誤的判斷。他的回答可以是∶
“我的頭發(fā)烏黑發(fā)亮,最長的一縷大概九英寸(約23厘米)長?!?/span>
為了排除聲音幫助詢問者得出結論,問題的答案可以寫出來,打出來更好。理想的安排是使得兩個屋子有遠程打印通訊。也可以通過中間人傳遞答案。而 B在這個游戲中的任務是努力幫助詢問者獲得正確的答案。她的最優(yōu)策略可能就是給出正確答案。她可以在她的答案中加入“我是女的,別聽他的。”這樣的詞語。但是男人A同樣也能做出相似的評論。所以這并不能提供更多的幫助。
現(xiàn)在我們提出這樣一個問題,“如果用一個機器擔當A的角色”,將會發(fā)生什么情況?同與兩個人玩這個游戲相比,詢問者判斷錯誤的頻率是否發(fā)生變化?這個問題取代了原先的“機器能夠思考么?”這個問題。
?
2. 對新問題的評析
你可能會問∶“新問題的答案是什么?”。同樣也可能問∶“這個新問題真的有研究價值么?”我們先解決第二個問題,因此不會進入一個無限的循環(huán)。
這個新問題的優(yōu)勢在于它把一個人的體力和智力完全區(qū)分開來。沒有任何工程師或化學家宣稱能夠生產(chǎn)出和人的皮膚完全相同的物質。在未來的某天,這可能成為現(xiàn)實。但是盡管這樣的發(fā)明是可能的,對于將人的皮膚賦給一個“思維機器”來讓它更像人這件事來說,并不能提供更大的幫助。我們設置問題的方式考慮到了這個問題。因為我們讓詢問者無法看到,接觸到或聽到其它的游戲者。新的評判標準的其它優(yōu)勢在下面的樣例問題和回答中顯示了出來。
?
樣例問題:
問∶請寫一首以 Forth Brige(1890年建成于英國,開創(chuàng)現(xiàn)代橋梁建造的先河)為主題的詩。
A∶我無能為力,我從來都不能寫詩。
問∶ 34957 加 70764 等于多少?
A∶(停了三十秒鐘后給出答案)105621。
問:你玩國際象棋么?
A∶玩。
問∶我的王在 K1,沒有別的棋子了,你只有王在K6,車在R1。該你走,你走哪步?
答∶(十五秒鐘的停頓后)車移動到 R8,將軍。
這種問答形式幾乎適用于我們想要包括的人類行為的一切形式。我們不希望因為一個機器不能在選美比賽中勝出就認為它無能;正如我們不能因為一個人不能在和飛機賽跑的比賽中勝出就認為他無能一樣。我們的游戲設定讓這些無能變得無關緊要。只要參與者認為合適,他們可以吹牛??梢园炎约好枋龀慎攘o限,強壯無比,英勇無畏。而詢問人無法要求他們做實際的展示。
對這個游戲的批評可能是∶機器在游戲的成敗中占有了過多的比重。如果一個人試圖假裝成一個機器的話,他肯定是一個整腳的演員。他會由于算術方面的緩慢和不準確立即暴露。機器會不會解決了一些應該是思考的問題,其解決方式卻和人的方式相差甚遠?這個反對意見確實很棘手。但是,至少我們可以說,盡管如此,機器可以被設計得可以很好的玩這個模仿者游戲。我們不需要對這個問題過分擔心。
有一種情況是機器在玩模仿者游戲時的最佳策略是做別的事而不是模仿人的行為。這種情況是可能的。但是我認為這樣的情況并沒有付出多大的努力。不管怎樣,本文并不試圖研究這個游戲的理論。我們假定機器的最優(yōu)策略是努力提供和人一樣的答案。
3. 游戲中的機器
目前已經(jīng)有許多數(shù)字計算機在工作,人們可能要問:“為什么不拿一臺直接作實驗?很容易就能滿足游戲的要求。同時用許多的詢問者參加游戲,然后統(tǒng)計出判斷正確的概率”。對這個問題的簡要回答就是∶我們并不是要問是不是所有的數(shù)字計算機都能在游戲中表現(xiàn)良好,也不是要問現(xiàn)在的計算機中有沒有機器能夠通過實驗。而是要問∶是否存在一臺想象中的機器能夠通過游戲。
4.數(shù)字計算機
數(shù)字計算機可以被解釋成能夠執(zhí)行一切計算人員能夠進行的操作。一個計算人員應該嚴格遵守規(guī)則;在一切細節(jié)上,都沒有一絲偏離的權力。我們可以假設這些規(guī)則寫在一本書上。每次被分配新的任務的時候,將會改變執(zhí)行步驟。他有無限的紙進行計算,他可以用“算盤”進行乘法和加法運算,這并不重要。
隨著您的閱讀,請思考:
????- 您在圖靈的文章中觀察到了什么? 有什么讓你感到驚訝的地方?思考圖靈的一些想法和主張是什么?
????- 您對圖靈的觀點有何反應?它有趣,令人困惑,令人興奮,愚蠢嗎?
????- 您認為計算機可以通過測試嗎?什么會使計算機無法通過呢?
????- 該方法有哪些優(yōu)點和局限性?圖靈測試是否遺漏了我們認為對“思考”或“智能”的定義非常重要的內容?
欲知文章內容如何,請關注下期內容:論文《計算機器與智能》的全文翻譯。
【閱讀本文集但并不想閱讀論文原文的朋友可以跳過下期專欄,繼續(xù)前往后面內容?!?/strong>