人工智能的未來(中)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 強人工智能
????????強人工智能觀點認為有可能制造出真正能推理(Reasoning)和解決問題(Problem_solving)的智能機器,并且,這樣的機器能將被認為是有知覺的,有自我意識的??梢元毩⑺伎紗栴}并制定解決問題的最優(yōu)方案,有自己的價值觀和世界觀體系。有和生物一樣的各種本能,比如生存和安全需求。在某種意義上可以看作一種新的文明。
? ? ? ? ?歷史
????????"強人工智能"一詞最初是約翰·羅杰斯·希爾勒針對計算機和其它信息處理機器創(chuàng)造的,其定義為:
????????"強人工智能觀點認為計算機不僅是用來研究人的思維的一種工具;相反,只要運行適當?shù)某绦?,計算機本身就是有思維的。"(J Searle in Minds Brains and Programs. The Behavioral and Brain Sciences, vol. 3, 1980。但事實上,Searle本人根本不相信計算機能夠像人一樣思考, 在這個論文中他不斷想證明這一點。他在這里所提出的定義只是他認為的"強人工智能群體"是這么想的,并不是研究強人工智能的人們真正的想法。因此反駁他的人也不少??蓞⒖?《 A Chinese room that Understands》- herbert A. Simon & Stuart A . Eisenstadt)。
????????擁有"強人工智能"的機器不僅是一種工具,而且本身擁有思維。"強人工智能"有真正推理和解決問題的能力,這樣的機器將被認為是有知覺,有自我意識。
????????強人工智能可以有兩類:
????????類人的人工智能,即機器的思考和推理就像人的思維一樣。
????????非類人的人工智能,即機器產(chǎn)生了和人完全不一樣的知覺和意識,使用和人完全不一樣的推理方式。
????????"強人工智能"引發(fā)起一連串哲學爭論,例如如果一臺機器能完全理解語言并回答問題的機器是不是有思維。哲學家希爾勒認為不可能。
????????也有哲學家持不同的觀點,認為人也不過是一臺有靈魂的機器而已,為什么人可以有智能,而普通機器就不能呢?
????????關于強人工智能的爭論,不同于更廣義的一元論和二元論的爭論。其爭論要點是:如果一臺機器的唯一工作原理就是轉(zhuǎn)換編碼數(shù)據(jù),那么這臺機器是不是有思維的?希爾勒認為這是不可能的。他舉了個中文房間的例子來說明,如果機器僅僅是轉(zhuǎn)換數(shù)據(jù),而數(shù)據(jù)本身是對某些事情的一種編碼表現(xiàn),那么在不理解這一編碼和這實際事情之間的對應關系的前提下,機器不可能對其處理的數(shù)據(jù)有任何理解?;谶@一論點,希爾勒認為即使有機器通過了圖靈測試,也不一定說明機器就真的像人一樣有思維和意識。
????????也有哲學家持不同的觀點。Daniel C. Dennett 在其著作 Consciousness Explained 里認為,人也不過是一臺有靈魂的機器而已,為什么我們認為:"人可以有智能,而普通機器就不能"呢?他認為像上述的數(shù)據(jù)轉(zhuǎn)換機器是有可能有思維和意識的。
?人工智能現(xiàn)在的發(fā)展前景如何?
????????據(jù)傳說,一門新技術的產(chǎn)生與成熟,會經(jīng)歷下面一條叫做“Gartner曲線”的過山車式發(fā)展軌跡,如下圖所示。不過,人工智能的發(fā)展軌跡,卻比這個要銷魂地多,到目前可以說是三起三落,當然,這個第三落還沒有到來,也未必一定會到來。
????????我進入這個行業(yè)已經(jīng)有十多年了:博士期間,我做的是語音是別的研究,畢業(yè)開始又到MSRA接著干這個。雖然我們的兩任院長——李開復老師和洪小文老師都是語音研究出身,卻絲毫不能改變當年這一項目在全院最雞肋的地位。因為在當年,各種各樣的人工智能應用能真刀真槍上陣的并不多。更別提要是向互聯(lián)網(wǎng)界提起自己是做“人工智能”的,那簡直就像在兩會會場上上偷看了毛片那樣無地自容。實際上,那個時期,正是人工智能發(fā)展的第二落。
????????以史為鑒,可以知興衰。為了探討人工智能的發(fā)展前景,我們簡單回顧一下人工智能前面發(fā)展的三起兩落。
????????一、六十多年前的達特茅斯會議,提出了“Artifitial Intelligence”的課題,目的是讓逐漸成熟的計算機能夠代替人類解決一些感知、認知乃至決策的問題。這樣一個課題是如此令人神往,也迅速吸引了大量學者的眼球,相關的研究也如火如荼地開展了起來。是為第一起。
????????二、初,學者們解決人工智能問題的思路,是以人為師,通過專家編制規(guī)則的方法,教機器下棋、認字乃至語音識別。在今天看來,這樣的方法是完全南轅北轍的——人類的視聽器官雖然很發(fā)達,卻并沒有能力總結提煉其中的規(guī)律。于是,人工智能的美好憧憬中迎來了殘酷的現(xiàn)實,學者們發(fā)現(xiàn)解決問題是如此遙遠,圍觀群眾也一度認為人工智能的學者都是騙子。是為第一落。
????????三、既然靠人指導不行,那就要祭出“實事求是”的法寶,從數(shù)據(jù)里統(tǒng)計規(guī)律。在這樣數(shù)據(jù)+統(tǒng)計的方法論下,諸如人臉識別、手寫識別等一些較為簡單的問題取得了重大進展,而在當時最困難的問題——大詞表連續(xù)語音識別上,統(tǒng)計方法也是史無前例地造就了實驗室中“基本可用”的系統(tǒng)。到此時,我們感覺找到了解決人工智能問題的基本思路。是為第二起。
????????四、數(shù)據(jù)+統(tǒng)計模型的方法盛行以后,也很快遇到了瓶頸:數(shù)據(jù)量的提升并不總能帶來識別率的提高。當然,我們很早就知道“深度模型”比“淺層模型”學習數(shù)據(jù)的能力強,無奈這種模型的計算代價極高,只能望洋興嘆。拿語音識別為例,在“基本可用”到“實用”之間的鴻溝,十幾年都沒有跨過去,于是大家又轉(zhuǎn)向悲觀,覺得人工智能還只是個夢。是為第二落。
????????五、第二落以來,繼續(xù)堅持在“深度神經(jīng)網(wǎng)絡”這條戰(zhàn)線上的學者很少,因為做這個是拿不到funding的。其中有一位老前輩Jeffrey Hinton,和他的學生Alex一起,發(fā)現(xiàn)用GPU算神經(jīng)網(wǎng)絡,能大幅提高速度,于是這種模型居然可能實用了。一旦實用,深度模型可以瘋狂吸收數(shù)據(jù)的優(yōu)勢就發(fā)揮出來了,于是在語音識別、圖像識別等領域帶來了飛躍式的進展。是為第三起。
????????當然,工業(yè)界的看到的這第三起,比我們上面輕描淡寫提到的內(nèi)容要波瀾壯闊得多。不過,不要太在意,因為各路大佬不論過去是做黑產(chǎn)、賣假貨還搞劫持的,都搖身一變成了人工智能的忠實擁躉和業(yè)界先驅(qū)——雖然他們的數(shù)學也就是初中肄業(yè)水平。去年,當我聽到某此類上市公司老板歇斯底里地在財報中喊出要投入數(shù)千萬美元搞人工智能時,不由心生感慨:修腳的可以掛妙手回春的錦旗,但千萬別說自己是做精準醫(yī)療的!
????????雖然人工智能的第三起確實有了質(zhì)的發(fā)展,但考慮到這些沉渣泛起的為人工智能從業(yè)者,我覺得第三落還是會來到,只不過并非對行業(yè)本身的懷疑,而是自我凈化罷了。
????????而人工智能的行業(yè)發(fā)展趨勢,由于大規(guī)模數(shù)據(jù)+大規(guī)模算力的基本方法論已經(jīng)成熟,今后的發(fā)展路徑是十分清楚的:在那些數(shù)據(jù)儲備充分、商業(yè)價值清晰的場景,人工智能會迅猛發(fā)展,投身于這樣的行業(yè)中期發(fā)展會非常好;而醫(yī)療、教育這類領域,由于電子化數(shù)據(jù)的整理與積累尚需時日,可以需要一個較為漫長的發(fā)展過程。
????????至于人工智能非常核心的問題,也就是關于“認知”的問題,我認為到目前為止還沒有任何方法論上的突破,也更談不上解決,不過扯到這個話題就太大了,我們找其他機會再聊。
????????這個問題太大了,分成兩段討論吧。事先聲明,由于問題太大太大,我寫的這份總結既不保證完整,也不保證客觀。
????????1. ===功能===
????????人工智能現(xiàn)在已經(jīng)能實現(xiàn)很多功能了,比如
????????語音識別——李開復博士當年做的工作奠定了很多當今識別系統(tǒng)的基礎。這里忍不住說一下,Siri本身的技術并沒有特別大的亮點,真正nb的是它的模式(語音識別直接與搜索引擎結合在一起,產(chǎn)品體驗做得好。而且關鍵是這樣的模式能采集到更多數(shù)據(jù),使得系統(tǒng)的精度越來越高)
????????自然語言理解——目前看到的最強的結果應該是IBM Watson。但其實我們現(xiàn)在用的搜索引擎、中文輸入法、機器翻譯(雖然其實還不怎么work)都和自然語言理解相關。這塊兒不是我的專業(yè),請 @段維斯 同學補充。
????????數(shù)據(jù)挖掘——隨著近年數(shù)據(jù)量的瘋狂增長,數(shù)據(jù)挖掘也有了長足進步。最具有代表性的是前幾年著名的Netflix challenge(Netflix公司公開了自己的用戶評分數(shù)據(jù),讓研究者根據(jù)這些數(shù)據(jù)對用戶沒看過的電影預測評分,誰先比現(xiàn)有系統(tǒng)好10%,誰就能贏100萬美元)最后這一比賽成績較好的隊伍,并非是單一的某個特別nb的算法能給出精確的結果,而是把大量刻畫了不同方面的模型混合在一起,進行最終的預測。
????????計算機視覺——目前越來越多的領域跟視覺有關。大家可能一開始想到的都是自動駕駛。雖然大家都在說googleX的無人車, 但實際上現(xiàn)在無論是商業(yè)上,還是技術整合上最成功的算法是Mobile Eye的輔助駕駛系統(tǒng)。這個公司也是目前computer vision領域最掙錢的公司。
????????從實現(xiàn)新功能方面說,視覺的發(fā)展的趨勢主要有兩方面,A) 集成更多的模塊,從問題的各種不同方面,解決同一個問題(比如Mobile Eye,就同時使用了數(shù)十種方法,放到一起最終作出決策) ?B) 使用新的信息,解決一個原來很難的問題。這方面最好的例子是M$的Kinect,這個產(chǎn)品最讓人拍案叫絕的就是那個紅外pattern投影儀。
????????2. ===理論基礎===
????????這里說的是數(shù)學理論,是為實現(xiàn)功能解決問題而存在的。與人類的智能的聯(lián)系在下一節(jié)說。從這個角度,我們已經(jīng)有了很多強有力的數(shù)學工具,從高斯時代的最小二乘法,到現(xiàn)在比較火的凸優(yōu)化,其實我們解決絕大多數(shù)智能問題的套路,都可以從某種意義上轉(zhuǎn)換成一個優(yōu)化問題。
????????真正限制我們解這個優(yōu)化問題的困難有以下三個:
????????計算復雜度——能保證完美解的算法大都是NP-hard的。如何能讓一個系統(tǒng)在當前的硬件下“跑起來”,就需要在很多細節(jié)取巧,這是很多l(xiāng)earning paper的核心沖突。
????????模型假設——所有模型都要基于一些假設,比如說,無人車會假設周圍的汽車加速度有一個上限(至少不會瞬間移動吧,否則怎么閃避)絕大多數(shù)假設都不能保證絕對正確,我們只是制定那些在大多數(shù)時候合理的假設,然后基于這些假設建模(比如,在語音識別里,我們是否要假設存在背景噪聲呢?如果有背景噪聲,這個噪聲應該符合什么特點呢?這時候無論你怎么定標準,總能找出“反例”)
????????數(shù)據(jù)基礎——任何學習過程都需要數(shù)據(jù)的支持,無論是人類學說話學寫字,還是計算機學習汽車駕駛。但是就數(shù)據(jù)采集本身來說,成功的案例并不多。大概這個世界上最強的數(shù)據(jù)采集就是google了吧。每次你搜索一個關鍵詞,然后點進去,google就自動記錄了你的行為,然后以此數(shù)據(jù)來訓練自己的算法。
????????這個問題太大了,分成兩段討論吧。事先聲明,由于問題太大太大,我寫的這份總結既不保證完整,也不保證客觀。
“人工智能”這一術語自1956年被提出,到電子計算機作為一種可以模擬人類思維的工具出現(xiàn),使人工智能這一技術有了一個展現(xiàn)的平臺,開始了探索與發(fā)展。1997年,IBM公司的“深藍Ⅱ”超級計算機,擊敗了國際象棋衛(wèi)冕冠軍Gary·Kasparov,這一現(xiàn)象,標志了人工智能技術的一個完美表現(xiàn),再到近些年的Alpha Go,人工智能的發(fā)展似乎已經(jīng)到了一個比較高端的程度。
????????人工智能的發(fā)展歷程中,慢慢引起了人們對于人工智能的一些恐懼,艾薩克·阿西莫夫(Isaac Asimov)曾在自己科幻小說中描繪出的一些擔憂,隨著如今科技的神速進步,好像真的會在不遠的未來變成真實。
????????但那些都太遙遠了,在現(xiàn)如今的世界背景之下,各國都把人工智能列為一項備受重視的技術,我們國家也不例外。
????????最近京東就舉辦了一場人工智能創(chuàng)新峰會,現(xiàn)任我國科技部創(chuàng)新發(fā)展司副司長的余建在峰會上提到了當今世界各國對于人工智能技術的重視以及發(fā)展狀況,并明確表示國家對于人工智能發(fā)展的高度重視,為此說明了我國在發(fā)展人工智能技術上確立了一個“三步走”的戰(zhàn)略。
????????同時他還代表國家的立場表示了:人工智能技術是引領未來的創(chuàng)新性技術,且在國家經(jīng)濟以及互聯(lián)網(wǎng)、大數(shù)據(jù)及超級計算機的發(fā)展之下,AI技術的發(fā)展也進入了具有深度學習,跨界融合,人機協(xié)同,群智開發(fā)自主操控等特性的新階段。這些具有新特性的AI技術將對人類的生產(chǎn)、生活乃至思維模式都產(chǎn)生重大的影響。
????????國內(nèi)現(xiàn)有的以BAT為首,外加科大訊飛四所公司所構筑的的人工智能平臺,基本成為了我國人工智能領域的四大支撐,此外,國家還鼓勵企業(yè)作為人工智能發(fā)展的主體,并堅持以市場作為發(fā)展的主導。
????????由此足可以想見,人工智能領域的發(fā)展在國家策略的支持下,擁有著相當光明的前景。
????????此外,人工智能領域的知名科學家,原IBM WostonGroup的首席科學家周伯文博士,現(xiàn)在在京東作為副總裁并主管人工智能研究與相關平臺的業(yè)務。不太了解的人大概也會對IBM這個詞有點印象,我在前文中也有提過,就是1997年擊敗國際象棋大師的“深藍Ⅱ”所屬的那家公司。
????????周伯文在這次峰會上也發(fā)表了相當精彩的演講,他借用當初開發(fā)C語言的科學家在第一行代碼中所用的“Hello World”表明了這次京東AI技術所懷揣的抱負。接著提出了今后人工智能的發(fā)展擁有三個階段,而現(xiàn)在我們僅處于最初級的階段,如果將人工智能做好做完全,其規(guī)模將比現(xiàn)在要大十倍甚至百倍。
????????他所認為的人工智能發(fā)展的三個階段分別為:
????????1,目前我們所處的階段,人工智能依然依賴于專家設置的體系結構,學習性也依賴于人工設計的算法。
????????2,廣義性的人工智能,廣義性的人工智能可以選擇性的通過不同的來源,而不是像現(xiàn)在一樣依賴于標準的數(shù)據(jù)學習,并且由此它可以進行長久性的終身學習,因為它的特性給了它一個適應環(huán)境的能力,擁有自適應的構架來進行終身學習。
????????3,就是現(xiàn)在大部分公司所說自己在做的通用人工智能,在他的研究中認為所謂的通用人工智能是一個長期目標,這個長期還用了非常兩個字形容,并需要長期的努力才能去實現(xiàn)。所以通用人工智能在目前是沒有一個具體嚴格的定義的,他給通用人工智能的定義是具有高度且極其強大的自主性。
????????因為第三階段是一個無法具體嚴格去定義的龐大概念,所以周伯文博士著重講了對于廣義性人工智能的七個研究課題,畢竟廣義性人工智能是人工智能領域發(fā)展的下一個關鍵階段。這七個課題分別為:
????????1,針對這方面的發(fā)展,首先要解決的問題是讓人工智能的學習從現(xiàn)有的單任務學習變成廣泛的終身學習。
????????2,要去研究相對于單任務學習的多任務學習。
????????3,拋開如今所依賴的大量被標注的數(shù)據(jù)學習,需要讓人工智能的學習保證一個無間隔且不受“信號”影響的學習狀態(tài)。
????????4,要讓人工智能擺脫如今依然需要人工構架的現(xiàn)狀,逐步實現(xiàn)其自適應的構架。
????????5,讓人工智能可以去運用一些已學習過的去解決一些其它可以解決的問題。
????????6,讓目前的人工智能,尤其是基于深度學習的人工智能在針對某些工作時可以避免黑盒子理論
????????7,優(yōu)化人工智能的算法問題。
????????他在演講中已經(jīng)把對于國內(nèi)人工智能研究的現(xiàn)狀與研究方向描述的相當清楚了,而當清楚了研究現(xiàn)狀與方向,下一步需要解決的問題,在周志華教授的演講中也有了清晰的描述。
????????周志華教授是南京大學計算機系的知名教授,在人工智能業(yè)界更是享有盛譽。前段時間南京大學計算機系成立了國內(nèi)首個人工智能學院,相信周志華教授在其中給予的助力不容小視,因為他認為,目前制約了國內(nèi)人工智能技術發(fā)展的一項重要因素,是相關領域高精尖人才的匱乏。
????????他在演講中還就深度學習對深度神經(jīng)網(wǎng)絡進行了闡述,并表明自己的團隊由此思考出了一個”深度森林模型“,用于探求深度神經(jīng)網(wǎng)絡之外的模型。
????????相信此舉將對于國內(nèi)人工智能領域的發(fā)展起到至關重要的作用,我們知道,深度神經(jīng)網(wǎng)絡是目前我們對于深度學習的一個解釋,幾乎可以在兩者之間畫個等號,現(xiàn)如今的科技發(fā)展水平,我們擁有了大數(shù)據(jù),還有著超強性能的計算機,以及在長久的發(fā)展中我們掌握了更大量更優(yōu)秀的訓練方法,導致我們更能利用深度神經(jīng)網(wǎng)絡以發(fā)展人工智能,但深度神經(jīng)網(wǎng)絡依然有著很多缺陷,需要對相應的參數(shù)進行耗費大量精力的調(diào)整,可這些調(diào)整的經(jīng)驗很難共享,就導致了結果的可重復性大大降低,于是需要一個深度神經(jīng)網(wǎng)絡之外的模型來優(yōu)化這些已經(jīng)發(fā)現(xiàn)的問題。
????????雖然周志華教授提出了人才匱乏制約了人工智能技術的發(fā)展,但是既然已經(jīng)在高校中擁有了第一個人工智能學院,我相信,我們國家將會在不久的未來有越來越多的人才出現(xiàn),再加之國家對于人工智能技術的重視,相信也能吸引到大量的技術人員以及企業(yè)投身于此。就以此次舉辦峰會的京東為例吧,不論是之前挖角IBM得到了周伯文,還是現(xiàn)有團隊中專門AI研究部門里的何曉東博士,梅濤博士,郭進博士以及黃靜博士,在更細化的領域內(nèi)都是佼佼者,并且在周志華教授的演講中我們也可以知曉,京東已經(jīng)和南京大學成立的人工智能學院達成了合作,即是說京東在未來可能會擁有大量的專業(yè)人才繼續(xù)對人工智能研究部門進行填充。
????????而針對周伯文所提出的問題,他也給出了一個人工智能是一種思維方式的解讀,并將探索企業(yè)將如何利用AI去適應新的環(huán)境、新的社會、與新的規(guī)劃,以及如何將AI應用于物流、金融、電商及公共事業(yè),又或者是探索更為立體的將AI應用于城市到農(nóng)村。
????????在這樣的觀點之下人工智能將影響到深入社會各界、各階層和各領域,由此他提出了京東有著一個“從0到1,從1到N,從N到無窮”的技術發(fā)展方向。
????????“0到1”是指他想要做一個人工智能創(chuàng)造者,去做一個從無到有的研究。
????????“1到N”是指將這個從無到有的研究更新、升級、深化、完善。
????????“N到無窮”希望能夠獲得更多的人才,一起完成把人工智能,更完美更完善的應用于各個領域的野望。
????????這次的人工智能創(chuàng)新峰會其實也是京東Neuhub人工智能平臺的揭幕式,這個人工智能平臺也是京東希望能夠利用它的功能,吸引到更多的人才幫助京東完成它對于人工智能技術的野心。
????????北京大學信息學院的孫進博士在峰會上提到了這樣一句話,說京東不僅進行了人工智能產(chǎn)業(yè)的研發(fā),也在進行著人工智能領域的基礎研究。
????????周伯文在演講中所表達的對于人工智能領域的思考,從大環(huán)境下的發(fā)展趨勢,到具體環(huán)節(jié)所要解決的問題,都在印證著孫進博士的這句話。余健副司長在發(fā)言中說到希望企業(yè)作為人工智能發(fā)展的主體,但若企業(yè)僅僅只去研發(fā)具體的人工智能產(chǎn)業(yè),而忽略了對其基本問題的探索,人工智能的發(fā)展也許并不能夠達到一個足夠的高度。
????????余健副司長在會上的發(fā)言代表了國家政策的扶持,孫進博士的這句點評更是代表學術界,表示了對京東在人工智能領域上態(tài)度的肯定。
總體而言,人工智能領域的發(fā)展在我看來是有著相當?shù)那熬暗摹?/strong>
世界各國爭相發(fā)展相關產(chǎn)業(yè)的大環(huán)境之下,整個產(chǎn)業(yè)都得到了國家的重視與支持,這是天時;從峰會上可以看出人工智能學術界思想碰撞的氛圍,這是地利;未來可見的,將會出現(xiàn)的大量相關專業(yè)人才,這是人和。
天時地利人和都已具備,人工智能的發(fā)展壯大也許只是時間的問題了吧。
?現(xiàn)在離強人工智能出現(xiàn),還有多長時間?
????????人工智能目前水平怎么樣?有沒有可能在未來幾年實現(xiàn)質(zhì)的突破?目前各大公司投入力度有多大?還有哪些難題須要解決?
????????目前人工智能依然處在“弱人工智能時代”,從目前人工智能的研發(fā)出發(fā)點來看,要想把智能體帶入到所謂的“強人工智能時代”,目前整個人工智能技術體系將面臨一定程度的重構。
????????當前的人工智能領域研究以“合理地思考”和“合理地行動”這兩個出發(fā)點來進行人工智能技術的研發(fā),而要想走向強人工智能時代,人工智能的技術研發(fā)將不可避免地面對“像人一樣思考”和“像人一樣行動”這樣復雜的局面。
????????實際上,目前基于神經(jīng)網(wǎng)絡的研究,以及深度學習的相關研究就是在一定程度上模仿人類的思維方式和決策方式,但是人類的思維方式和決策方式目前也并沒有一個確切的答案,所以強人工智能的研究其實并沒有一個明確的“標準”,所謂強人工智能的概念也并不明確。
????????從人工智能自身的發(fā)展前景和應用前景來看,人工智能產(chǎn)品在大部分情況下并不需要所謂人類的“智慧”,實際上智能體未來無論發(fā)展到何種階段,都不應該來代替人類的思考。
????????目前科技領域?qū)τ谌斯ぶ悄艿慕缍ㄟ€是比較清晰的,對于目前的智能體可以總結為“智商偏科,情商為零”,智能體目前的應用場景多集中在數(shù)據(jù)復雜度比較高的領域,這樣能夠充分發(fā)揮智能體在處理數(shù)據(jù)方面的優(yōu)勢,當然這個過程也需要大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等相關技術的配合。
????????當前人工智能技術的研發(fā)基礎是數(shù)據(jù)、算力和算法,以算法為基礎的智能體研發(fā)要想走向強人工智能時代對于當前的技術體系有太大的挑戰(zhàn),或者說這幾乎是一個很難完成的任務。
????????我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計算機專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領域,我會陸續(xù)寫一些關于互聯(lián)網(wǎng)技術方面的文章,感興趣的朋友可以關注我,相信一定會有所收獲。
????????如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區(qū)留言,或者私信我!
????????我覺得未來五到十年不會有強人工智能??梢远⒅敿墪h期刊年年看,也可以盯著大神的個人主頁天天看,如果有質(zhì)的突破,社交網(wǎng)絡會傳開的。
????????企業(yè)方面,谷歌、Facebook、微軟、百度等都蠻有看頭的。這個年代,產(chǎn)業(yè)在這些領域是走得比較前線的,跟過去有很大的不同。因為產(chǎn)業(yè)有數(shù)據(jù),數(shù)據(jù)是研究的核心資產(chǎn)。所以近年來學術大神們紛紛擁抱產(chǎn)業(yè)的最大原因是數(shù)據(jù)和工程能力,而不是錢。產(chǎn)業(yè)也是有投入熱情的,因為轉(zhuǎn)化率高了。
????????數(shù)據(jù)方面的難題:
????????1. 數(shù)據(jù)的流通太差,一個個數(shù)據(jù)孤島,不流通就難以實現(xiàn)數(shù)據(jù)的全部價值。
????????2. 數(shù)據(jù)雖然大得多了,還是不夠,不僅僅是量的不夠,維度也不夠,而且數(shù)據(jù)的斷層是更大的問題。比如說你用一下PC看淘寶的鞋,再用一下手機買了淘寶的電器,中間這些邏輯就斷掉了,可能真實的場景是你在用PC看鞋的時候被老板叫去開一個無聊的會,然后開會的時候玩手機就買了電器。量不夠、維度不夠、斷層等等這些問題都造成了還原真實情況的困難。
????????理論層面,也沒有足夠深刻的突破。怎樣叫做智能,這個問題還沒有理清,還沒有一個完整的問題框架,所以更談不上解決問題。
????????現(xiàn)在的水平是基于對特定問題(容易劃定定義域和值域),設定相應的模型(認知框架),通過統(tǒng)計的方法(認知方式),實現(xiàn)專門的功能。
????????人類存在的意義是什么?繁殖?作為傳遞基因信息的一種載體?
????????機器要獲得智能,恐怕首先要有一種底層的目的,這個目的誰來設定?機器倫理又該誰定?機器會成為一個遠超人類的物種,我們有能力設計他們的倫理嗎?
????????我們還沒有足夠的條件去討論和研究那些問題。日拱一卒,把我們世界里那些可以摳出來的問題一個一個解決掉才是我們的現(xiàn)實。也許哪天他們就醒了,不是我們有意設計的生命,而是一切物理條件成熟了的時候自然誕生的物種。
專家的預言:50年內(nèi)世界將實現(xiàn)超人工智能?
????????【一、人工智能的三個階段】
????????我們所說的人工智能(AI),是一個廣義定義。雖然眾說紛紜,大部分專家認為,人工智能發(fā)展有三個水準:
????????>>>>弱人工智能(ANI)
????????第一類智能水準:能夠?qū)W⒂谝粋€領域,例如能戰(zhàn)勝世界圍棋冠軍的AI,但是也只能下圍棋。
????????>>>>強人工智能(AGI)
????????第二類智能水準:達到和超過人類水準的人工智能,以Gottfredson博士的定義,有能力“推理、計劃、解決問題、抽象思維、理解復雜概念、快速學習、從經(jīng)驗中學習?!?/p>
????????>>>>超人工智能(ASI)
????????第三類智能水準:超過所有人類智能總和的AI——用Tim Urban的話說,“從比人聰明一點點……到聰明一千萬倍?!?/p>
????????那我們現(xiàn)在在哪個階段呢?我們現(xiàn)在達到了第一個水準——弱人工智能——在很多方面,它已經(jīng)進入了我們的生活中:
????????汽車里到處都是ANI,從可以在緊急情況下剎車的電腦,到可以調(diào)配汽車加油參數(shù)的系統(tǒng)。
????????谷歌搜索是一個很大的ANI,有很多非常復雜的方法將網(wǎng)頁排序,知道給你顯示什么。同樣的,F(xiàn)acebook Newsfeed也是。
????????谷歌正在測試中的無人駕駛汽車,有一個很強的ANI系統(tǒng),讓它可以感知世界并做出反應。
????????電子郵件垃圾郵箱過濾器,知道什么是垃圾郵件、什么不是,并且學會按照你的偏好來過濾郵件。
????????你的電話就是一個小型ANI工廠……你用地圖APP導航,收到定制化的音樂推薦,和Siri聊天等等。
????????例子不勝枚舉。弱人工智能系統(tǒng)不怎么驚悚。失控的ANI會帶來危害,但通常是獨立事件。雖然ANI不會造成人類的生存性恐慌,相對人畜無害ANI應被視為一個先兆。每一次弱人工智能的創(chuàng)新進步,都在往強人工智能和超人工智能更近一步。
????????【二、下一步是強人工智能面臨的挑戰(zhàn)】
????????沒有什么比試圖創(chuàng)造像人類一樣聰明的計算機,更能讓人體會到人類有多聰明了。造一個可以進行兩位數(shù)計算的計算機很簡單,但是造一個看到狗貓能回答這是什么的計算機——特別困難。造一個可以下圍棋的計算機?搞定。但造一個計算機能夠讀6歲小孩的圖畫書、不只能識別文字、還能理解含義?谷歌正在努力,投入了幾百萬美元。
????????一些對我們來說簡單的事情,其實非常復雜。之所以對我們簡單,是因為我們(和大部分動物)在千百萬年的進化中已經(jīng)優(yōu)化了。然而,要做大數(shù)字運算、或者下圍棋,對生物來說還是新游戲,還沒有進化出相應的熟練度。所以,計算機在圍棋上打敗我們不算特別困難。
????????一個有趣的例子:
????????圖A:你和計算機都能知道,這是一個由兩種顏色構成的長方形。第一回合平手。
????????圖B:你能輕松描述出各種模糊和透明的圓柱體、長板和3D轉(zhuǎn)角,但是電腦會輸?shù)煤軕K。電腦會說,這兒有各種二維形狀和灰度——圖畫里實際的內(nèi)容。人腦可以自己腦補很多,理解深度等圖片想表現(xiàn)的東西。
????????圖C:電腦看到二維的黑白灰混合物。要達到人類級別的智能,電腦得理解面部表情之間的微妙區(qū)別,愉快、輕松和滿足之間的區(qū)別。
????????【三、如何實現(xiàn)強人工智能?】
????????要達到人類大腦的智能水平,AI需要達到人類大腦的計算容量。而目前,只有很少的大腦區(qū)域已經(jīng)精確測量。Kurzweil說開發(fā)了一種估算人腦總體運算速度的方法。根據(jù)摩爾定律的估計,計算機硬件進步會以驚人的速度指數(shù)發(fā)展。比開發(fā)硬件更難的是軟件。“真相是,沒人真正知道如何讓機器更加聰明。我們還沒教會計算機認識貓狗,判斷一個手寫的B是不是難看,或者一部電影是不是爛片。”Tim Urban在網(wǎng)站W(wǎng)ait But Why說。但普遍來說,有三種策略最為常見。
????????>>>>向大腦學習
????????最簡單粗暴的辦法就是抄襲大腦,按照大腦結構設計計算機架構。人工神經(jīng)網(wǎng)絡就是一個例子。更極端的方式是模擬整個大腦,不過截止現(xiàn)在,我們只能模擬一毫米厚大小的大腦,大約有302個完整神經(jīng)元。為了讓大家有個概念:大腦有八百六十億個神經(jīng)元,由幾萬億個神經(jīng)突觸連接。
????????>>>>讓計算機學會進化
????????即便我們模擬出了大腦也不一定成功,就好像完全模擬鳥兒翅膀運動來建造飛機一樣。也許最好還是以建造機器的方式建造機器。被稱為“遺傳算法”的方法是,讓一群電腦一起完成任務,成功的電腦們互相“結合”,不成功的電腦們則被淘汰。
????????>>>>讓計算機自己想去,我們不管了…
????????最后一種辦法最簡單,也最驚悚。我們先建造一個計算機,只有兩個功能:研究AI,和給自己寫代碼。我們教計算機成為計算機科學家,自己進化成長。這被認為是我們最有希望的一條路徑。
????????【四、計算機何時擁有與人腦相等能力?】
????????密歇根湖的容量大約與我們的大腦容量相同(以每秒計算)。根據(jù)摩爾定律,計算機處理能力每18個月翻倍。如果以這個速度用水填滿密歇根湖,你會很長時間都看不到什么進展,然后忽然間,湖就裝滿了。
????????可以非常現(xiàn)實地說,某一個時間點,我們就會實現(xiàn)強人工智能(AGI)——到達人腦級別智能的計算機。這是不是意味著,從這一刻起,計算機會和人類具有同等能力?實際上,并不是——計算機會比人類高效多了。因為計算機是電子的,還會有以下優(yōu)勢:
????????>>>>速度
????????“大腦神經(jīng)元的極限在大約300赫茲,而今天的微處理器……運行速度大約是2千兆赫茲,或者說,一千萬倍?!癟im Urban說。
????????>>>>記憶
????????遺忘或混淆對于計算機來說是不存在的。計算機在一秒鐘內(nèi)能記住的內(nèi)容超過人類在十年內(nèi)能記住的。電腦記憶更加精確,有更大的內(nèi)存。
????????>>>>運行
????????“電腦晶體管比生物神經(jīng)元更加精準,老化的可能更低(即使老化了,也可以修理或者替換)。人類大腦容易疲倦,而計算機可以不停歇地運轉(zhuǎn),用最高速不停歇?!盩im Urban說。
????????>>>>集體能力
????????在人類中,團隊合作非常困難,因為費時間的溝通和復雜的社會層級。團隊越大,每個人輸出的速度越慢。而計算機不受困于某一個生物體,沒有自我,可以同步,可以更新自己的操作系統(tǒng)。
????????想一想人類級別的AGI能有多大好處,很明顯,到時候人們最多只會停個片刻,然后繼續(xù)向前,奔向超過人類智能的新世界。人類與超人工智能的差異不會是速度,而是“質(zhì)量——與速度完全不同。人和大猩猩的區(qū)別,絕對不是思考速度——而是人類大腦有一些復雜的認知模塊,能夠讓人實現(xiàn)復雜語言表征、長期規(guī)劃或者抽象推理等活動。讓大猩猩的大腦加快幾千倍也不會把大猩猩變成人?!?/p>
????????有一個比我們更高質(zhì)量的物種存在,為了體會這是多大件事,我們來想象一下,AI在智能階梯上,比我們高兩個臺階。Tim Urban說:”它增強的認知能力和我們的差別,會像大猩猩和人類之間的鴻溝一樣巨大。大猩猩永遠無法明白,一個門把手之中包含了多少魔法……這就是兩步臺階的區(qū)別?!?/p>
????????“機器越聰明,越能夠快速提升自己的智能?!皬奈浵伒揭粋€普通人類也許要7很多年,但是從普通人到愛因斯坦,也許只要40天。“到了愛因斯坦的階段,機器可以更輕松地進行更大幅度的跨越……當我們聽到新聞,說已經(jīng)有第一臺機器達到強人工智能后,也許很快我們就會看見地球上出現(xiàn)一種位于這個位置的智能:
????????你覺得這個預言有可能嗎?來看看現(xiàn)在的人工智能專家們,在兩份調(diào)查問卷中怎么說。
????????【五、超人工智能哪天會來?】
????????Vernor Vinge教授、科學家Ben Goertzel、升陽電腦聯(lián)合創(chuàng)始人Bill Joy還有,最出名的,發(fā)明家和未來學家Ray Kurzweil——他們和許多人一樣,都同意機器學習專家Jeremy Howard的觀點,他在一場TED演講中給出了下面這個圖表:
????????(Jeremy Howard在Ted演講“能學習的計算機,多么美好與駭人”中給出的圖表)
????????一些人相信這很快就會到來——指數(shù)級的增長正在發(fā)生。其他人,例如微軟的聯(lián)合創(chuàng)始人保羅·艾倫、心理學家Gary Marcus、紐約大學計算機科學家Ernest Davis和科技創(chuàng)業(yè)家Mitch Kapor,都相信Kurzweil等思想家都大大低估了這項挑戰(zhàn)。而Kurzweil陣營會反駁說,我們都低估了指數(shù)增長,他們會將懷疑論者比作與1985年那些看見慢慢發(fā)芽的因特網(wǎng)說“這在短期未來內(nèi)不可能成什么氣候”的人。對此懷疑論者會反駁說,人工智能的每一步新技術進步的難度,同樣在以指數(shù)增長,抵消了科技的發(fā)展。
????????然后還有包括Nick Bostrom在內(nèi)的第三陣營,相信誰也沒法確定未來人工智能的發(fā)展路線,認為第一,這絕對可能在不遠的未來發(fā)生,第二,但這也沒有保證,這也可能需要更長的時間。
????????還有其他人,例如哲學家Hubert Dreyfus,相信以上三個陣營都太天真了,竟然相信未來可能會有超級人工智能——具有超過所有人類智能的人工智能。他認為,這永遠都不太可能。
????????所以,當你看著所有這些觀點的時候,你會得出什么結論呢?
????????【六、強人工智能時間表】
????????2013年,Vincent C. Muller和Nick Bostrom對幾百名人工智能專家進行了以下問卷:“僅為回答問題起見,假設人類科研活動會繼續(xù)發(fā)展,不發(fā)生重大負面干擾。你認為到哪一年,會有(10%、50%、90%)可能出現(xiàn)達到人類水平的機器智能(或我們所稱的AGI)?”該問卷讓專家們寫下一個比較樂觀的時間預測(有10%可能性我們實現(xiàn)AGI的年份)、一個比較實際的猜測(有50%可能性我們實現(xiàn)AGI的年份)和一個保險的猜測(有50%可能性我們實現(xiàn)AGI的最早年份)。數(shù)據(jù)最終放在一起的結果如下:
????????樂觀預計年份中位數(shù)(10%可能性):2022年;
????????現(xiàn)實預計年份中位數(shù)(50%可能性):2040年;
????????保險猜測年份中位數(shù)(90%可能性):2075年。
????????所以,參與問卷的人就中位數(shù)來說,認為我們可能在25年后實現(xiàn)AGI。90%可能性的回答表示,如果你現(xiàn)在是青少年,中位數(shù)的回答以及其他超過一半的AI專家都認為,AGI會在你的有生之年實現(xiàn)。
????????【七、超人工智能時間表】
????????Muller和Bostrom還問了這些專家,他們對以下可能性的判斷:1)在2年內(nèi)實現(xiàn)超人工智能(也就是,幾乎馬上會到來的智能爆炸),2)在30年內(nèi)實現(xiàn)超人工智能?;卮鹫咝柙诿恳粋€選項現(xiàn)在一個概率。結果如下:
????????2年內(nèi)實現(xiàn)AGI-ASI轉(zhuǎn)化:10%可能性;
????????30年內(nèi)實現(xiàn)AGI-ASI轉(zhuǎn)化:75%可能性。
????????位于中位數(shù)的回答認為快速的(2年)AGI到ASI的轉(zhuǎn)化只有10%的可能性,而長一些時間(30年內(nèi))的轉(zhuǎn)化為75%可能性。我們不知道這個數(shù)據(jù)庫中,大家認為50%的可能性會位于多長的時間長度,但是為了大致估計,我們可以猜測也許大家會說20年。
????????所以,位于中位數(shù)的觀點——那些位于AI領域中心的專家們——相信最現(xiàn)實的預測是,超人工智能會在……實現(xiàn)強人工智能的2040年,加上轉(zhuǎn)化到超人工智能的20年,在2060年超人工智能會到來。
????????當然了,所有以上的數(shù)據(jù)都是猜測的,而且它們只代表AI專家圈中的中位數(shù)觀點,但是它們告訴我們一點,很多對這個話題了解深入的人會同意,關于可能改變世界的超人工智能的誕生時間,2060年是一個非常合理的預測時間。也就是,距今45年。
?強人工智能是遲早的事情嗎?
????????一定是這樣的,沒有什么理論上的壁壘可以阻止真正的人工智能的出現(xiàn),畢竟人腦的體量和復雜度都是人類技術可實現(xiàn)的范圍內(nèi)。
????????嚴格意義上講,強智能早具存在了,因為人就是強智能產(chǎn)物。可能唯一的差別是,人是生出來的強智能,而人工智能是造出來的強智能。落在出身上,兩者采用“人工”二字都沒有什么不妥。
????????強人工智能是可以實現(xiàn)的,和什么時光機蟲洞這些YY不一樣。我們只是用另一個系統(tǒng)復現(xiàn)人類的智能而已,人類智能是實打?qū)嵉拇嬖诘?。實現(xiàn)存在的東西和連存在都無法證明的東西完全不一樣,存在的東西復現(xiàn)出來只是時間問題。
預言者說,2045年人工智能的摩爾定律將被打破,那么我們的世界又會形成怎樣全新的秩序?
????????當我在桌面上揮動胳膊,就可以修改文本信息流的方向。
????????當我專心閱讀的時候,屏幕就會出現(xiàn)提醒,而新聞也會顯示出更多的章節(jié)。
????????整個房間所有的物體都如同眼睛一樣盯著我的各種行為,主動為我送上我想要的資訊。
????????在高速公路上,沿途經(jīng)過的建筑,往往只顯示針對我的廣告,因為他們認識我的車。
????????……
????????美國硅谷互聯(lián)網(wǎng)科技界的預言帝凱文.凱利,在他的新著作《必然》里用整整一個章節(jié)的內(nèi)容來闡述當人工智能與媒體融合而可能產(chǎn)生的場景,簡直如同做夢一般。在凱文.凱利看來,這將是塑造未來30年的趨勢必然之一。
????????人工智能先驅(qū)、未來學家雷·科茲威爾也有類似的預言:到了2020年,我們將成功通過逆向工程制造出人腦。2030年末,計算機智能將趕上人類。2045年,人工智能會掌管全球科技發(fā)展。至此之后,人工智能的摩爾定律被打破,科技將呈現(xiàn)爆炸式發(fā)展。
????????曾經(jīng)奇點被看成空間時間的邊緣或邊界,只有給定了奇點處的邊界條件,才能由愛因斯坦方程得到宇宙的演化。就在人工智能奇點來臨之前,那些站在浪潮之巔的先鋒者,如何審視這場史無前例的“大變局”?我們的世界又會形成怎樣全然的新秩序?