John Hopcroft、Bart Selman與張宏江展望“AI未來(lái)10年”

經(jīng)典人工智能方法在未來(lái)會(huì)得到關(guān)注嗎?經(jīng)典方法和深度學(xué)習(xí)的關(guān)系將如何發(fā)展?新的突破點(diǎn)又在哪里?
針對(duì)上述話題,在2020北京智源大會(huì)6月21日晚間的全體大會(huì)上,北京智源人工智能研究院理事長(zhǎng)張宏江和圖靈獎(jiǎng)獲得者、智源研究院學(xué)術(shù)顧問(wèn)委員會(huì)委員John Hopcroft、AAAI候任主席Bart Selman共論AI,探討“AI的過(guò)去和未來(lái)10年”。在具體討論過(guò)程中,采用了張宏江發(fā)問(wèn),John Hopcroft、Bart Selman回答的形式進(jìn)行。在論壇最后,兩位教授還向中國(guó)的學(xué)者們就如何開展AI研究提出了中肯的建議。
一、艱難的50年和騰飛的10年:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 經(jīng)典AI和深度學(xué)習(xí)的不同境遇張宏江:今天我們非常幸運(yùn)請(qǐng)到了圖靈獎(jiǎng)的獲得者John Hopcroft教授,美國(guó)康奈爾大學(xué)的計(jì)算機(jī)科學(xué)教授Bart Selman。今天我希望跟兩位教授一起回顧人工智能過(guò)去幾十年的發(fā)展,并且介紹他們對(duì)于人工智能未來(lái)十年發(fā)展的方向和途徑的看法。今天的主題叫“人工智能新的10年”,在談新的十年之前,請(qǐng)兩位先談一下對(duì)過(guò)去60年,尤其是過(guò)去10年的回顧。
?Bart Selman:這個(gè)領(lǐng)域的最初工作主要是由對(duì)理解人腦的思維和認(rèn)知感興趣的研究人員完成的,在人工智能的早期有很多樂(lè)觀主義者,但在實(shí)際研究過(guò)程中遇到了很多意想不到的困難。這個(gè)領(lǐng)域在近幾十年來(lái)純粹是一門學(xué)術(shù)學(xué)科,因?yàn)槲覀儫o(wú)法在任何可以與人類相比的地方獲得很好的成果,第一個(gè)轉(zhuǎn)折點(diǎn)是IBM在1997年開發(fā)出國(guó)際象棋AI深藍(lán)的時(shí)候。深藍(lán)在國(guó)際象棋中打敗人類,這是當(dāng)時(shí)的一個(gè)突破。大約在2012年,多層神經(jīng)網(wǎng)絡(luò)即深度學(xué)習(xí)幾乎都改變了整個(gè)領(lǐng)域,使得我們可以實(shí)現(xiàn)視覺(jué)識(shí)別和語(yǔ)音識(shí)別等任務(wù)。人們發(fā)現(xiàn),深度學(xué)習(xí)算法幾乎超越了所有類型的機(jī)器學(xué)習(xí)模型,算力的發(fā)展是這段時(shí)期改變?nèi)斯ぶ悄茴I(lǐng)域的原因。2012年,我們讓AI實(shí)現(xiàn)了感知。我不會(huì)說(shuō)感知問(wèn)題已經(jīng)解決,但我們離解決更近了一步。此外,這些技術(shù)還能和經(jīng)典人工智能的技術(shù)結(jié)合,例如決策、規(guī)劃、推理等。? ??

John Hopcroft教授,您能基于Bart Selman教授的觀點(diǎn)分享一下您的看法嗎?
John Hopcroft:上世紀(jì)60年代初,人工智能剛起步。當(dāng)時(shí)約翰·麥卡錫創(chuàng)造了斯坦福大學(xué)的人工智能實(shí)驗(yàn)室,有大量高素質(zhì)的研究人員在研究符號(hào)邏輯。1964年,人工智能的研究者只能訓(xùn)練單一的權(quán)重,原因是根本沒(méi)有算力,缺乏大型數(shù)據(jù)集,連手寫字符數(shù)據(jù)集都沒(méi)有。事實(shí)上我拿到博士學(xué)位時(shí),才做出了一個(gè)包含1000個(gè)10x10像素手寫字符的數(shù)據(jù)集,這和今天的數(shù)據(jù)集相比是很小的,但是在那時(shí)已經(jīng)是很大的了。2012年AlexNet出現(xiàn)了,直到那時(shí)圖像識(shí)別錯(cuò)誤率才開始顯著下降。AlexNet將圖像識(shí)別錯(cuò)誤率從25%降到了15%,這是一個(gè)巨大的進(jìn)步。AlexNet有大約8個(gè)層級(jí),在2015年圖像識(shí)別大賽的冠軍ResNet則有1000個(gè)層級(jí),并且它只有3.6%的錯(cuò)誤率,而人類識(shí)別這些圖像時(shí)有5%的錯(cuò)誤率。這些技術(shù)已經(jīng)被應(yīng)用到了非常多的領(lǐng)域,如醫(yī)學(xué)、金融等。?

張宏江:在上世紀(jì)90年代,我們發(fā)現(xiàn)經(jīng)典人工智能方法不管用,現(xiàn)在我們知道是因?yàn)闆](méi)有足夠的算力,在過(guò)去這幾年,由于算力的發(fā)展,我們獲得了極大進(jìn)展。那么現(xiàn)在,我們?cè)谕评淼冉?jīng)典人工智能方法的探索上處于什么階段呢?? ??
Bart Selman:我覺(jué)得現(xiàn)在人們經(jīng)常把AI等同于深度學(xué)習(xí),或者把深度學(xué)習(xí)等同于AI。過(guò)去十年來(lái)我們?cè)谕评淼人惴ǖ难芯可蠈?shí)際上已經(jīng)有很大的進(jìn)步,并且已經(jīng)有了實(shí)踐應(yīng)用,例如英特爾、微軟等企業(yè),只是并不廣為人知。在社區(qū)中,這些技術(shù)也被廣泛應(yīng)用。AlphaGo是深度學(xué)習(xí)成功的范例,但實(shí)際上AlphaGo使用了樹搜索算法,這也是一種符號(hào)推理算法。這也是AI領(lǐng)域出現(xiàn)的巨大進(jìn)步,我們可以組合不同的算法,例如推理、規(guī)劃和深度學(xué)習(xí)方法等。自動(dòng)駕駛汽車領(lǐng)域在組合不同的人工智能方法的探索上更加開放。當(dāng)然你也可以嘗試用端到端的方法來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng),但這太困難了。深度學(xué)習(xí)一般作為自駕系統(tǒng)的視覺(jué)系統(tǒng),但是控制系統(tǒng)和路徑規(guī)劃系統(tǒng)等則需要更多的經(jīng)典人工智能方法。?相比較而言,深度學(xué)習(xí)確實(shí)是非常數(shù)據(jù)驅(qū)動(dòng)的方法,這跟經(jīng)典人工智能中我們稱之為知識(shí)的方法不同。知識(shí)就像牛頓定律或萬(wàn)有引力定律,人類的認(rèn)知需要很多真實(shí)的知識(shí)。而深度學(xué)習(xí)要獲取知識(shí)并不容易,深度學(xué)習(xí)目前如此有效,是因?yàn)槲覀冇写罅康臄?shù)據(jù)。我認(rèn)為深度學(xué)習(xí)下一步需要學(xué)會(huì)獲取知識(shí),這是個(gè)巨大的挑戰(zhàn)。
張宏江:人工智能是一個(gè)非常寬泛的領(lǐng)域,深度學(xué)習(xí)僅僅是一部分。Hopcroft教授,您在過(guò)去的50年里,在計(jì)算理論上做了很多工作,您愿意和我們分享一下,從理論和算法的角度如何看待人工智能的進(jìn)展嗎?
John Hopcroft:我首先再談?wù)撘幌律疃葘W(xué)習(xí),深度學(xué)習(xí)真正的意義是在高維空間中更好地識(shí)別。比如你在看自行車的圖像,深度學(xué)習(xí)不會(huì)告訴你自行車的函數(shù)是什么。如果你展示的東西看起來(lái)像自行車,但不能讓你騎著它去地鐵站,它仍然會(huì)把它歸類為自行車。為了解決這個(gè)問(wèn)題,我們需要將邏輯加入深度學(xué)習(xí)。深度學(xué)習(xí)可以將自行車進(jìn)行分解,它會(huì)告訴你自行車有輪子、鏈子、座椅、踏板等等。對(duì)這些部件,你可以添加邏輯,說(shuō)踏板帶動(dòng)了鏈子然后帶動(dòng)輪子,從而自行車可以移動(dòng),車頭可以讓你把控方向和轉(zhuǎn)彎,座椅可以讓自行車有運(yùn)輸功能。通過(guò)添加邏輯,或許就可以構(gòu)建關(guān)于自行車的函數(shù),這個(gè)函數(shù)的意義是將一個(gè)人從一個(gè)地點(diǎn)運(yùn)輸?shù)搅硪粋€(gè)地點(diǎn)。關(guān)于人工智能理論,單閾值邏輯單元可以用一個(gè)非常簡(jiǎn)單的算法來(lái)訓(xùn)練。如果圖像集合是線性可分的,那么閾值邏輯可以實(shí)現(xiàn)分類。如果圖像集合不是線性可分的,應(yīng)該將集合映射到更高維的空間中,使得集合是線性可分的。關(guān)于訓(xùn)練閾值邏輯單元的方式,你也可以不將數(shù)據(jù)映射到高維空間中,而在原始空間中運(yùn)行算法,這就是構(gòu)建支持向量機(jī)的技術(shù)。直到深度學(xué)習(xí)發(fā)展之前,這是人工智能領(lǐng)域的主要技術(shù)。還有關(guān)于過(guò)擬合的問(wèn)題,假設(shè)你有一個(gè)大型數(shù)據(jù)集,該數(shù)據(jù)集告訴我中國(guó)所有人的年齡和薪資。我想要問(wèn)在某個(gè)確定的年齡和薪資上有多少人,但是不想保存整個(gè)數(shù)據(jù)集,因?yàn)槲蚁氚褦?shù)據(jù)集放到手機(jī)上。因此我取數(shù)據(jù)集的一小部分,并且在適當(dāng)?shù)財(cái)U(kuò)展之后,相信答案會(huì)非常接近真值。答案的真假取決于我們要問(wèn)的問(wèn)題的范圍,并且需要多大規(guī)模的樣本的數(shù)學(xué)取決于問(wèn)題的復(fù)雜性。如果大家對(duì)這些數(shù)學(xué)感興趣的話,可以看看我所寫的書。在這本書的第五章,包含了所需要的數(shù)學(xué)知識(shí)。在我的照片下面寫著劍橋(Cambridge)的地方,可以得到PDF的鏈接。

John Hopcroft主頁(yè):https://www.cs.cornell.edu/jeh/
二、未來(lái)10年:數(shù)據(jù)和知識(shí)的相遇?
張宏江:Selman教授,我們知道您之前發(fā)表過(guò)美國(guó)人工智能研究未來(lái)20年的白皮書,可以分享您對(duì)AI未來(lái)發(fā)展趨勢(shì)以及重點(diǎn)的看法?白皮書地址:https://arxiv.org/abs/1908.02624
Bart Selman:我認(rèn)為人工智能研究的未來(lái)趨勢(shì)是社區(qū)化,在業(yè)界有很多大型的研究團(tuán)隊(duì)在快速組建。美國(guó)正在構(gòu)建國(guó)家AI基礎(chǔ)設(shè)施,為不同的學(xué)術(shù)研究團(tuán)隊(duì)提供試驗(yàn)臺(tái)。大多數(shù)研究項(xiàng)目無(wú)論是人力還是財(cái)力對(duì)于個(gè)人都是無(wú)法承受的,需要大量資金用于基礎(chǔ)設(shè)施軟件和機(jī)器開發(fā),所以必須共享資源,允許協(xié)作。除了仍然要強(qiáng)調(diào)知識(shí)和深度學(xué)習(xí)的結(jié)合以外,我認(rèn)為自我意識(shí)學(xué)習(xí)是未來(lái)人工智能發(fā)展的重點(diǎn)。
張宏江:您所說(shuō)的自我意識(shí)學(xué)習(xí)到底是什么意思?為什么您認(rèn)為這是未來(lái)20年人工智能發(fā)展的首要任務(wù)???
?Bart Selman:這是一個(gè)我們還沒(méi)有解決的問(wèn)題。人類能以不同的方式學(xué)習(xí),例如我們?nèi)W(xué)校學(xué)習(xí)新技能,這相比于數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)而言是非常不同的類型的學(xué)習(xí)。人類不需要學(xué)習(xí)上百個(gè)例子就可以掌握新技能。自我意識(shí)學(xué)習(xí)就是指,AI會(huì)反省自己的學(xué)習(xí)方式,然后調(diào)整它的學(xué)習(xí)行為。?例如,AI會(huì)反思:我不太明白學(xué)習(xí)的微積分的知識(shí),我想問(wèn)一些問(wèn)題,我想做一些微積分的練習(xí)來(lái)提高。這個(gè)過(guò)程中使用的學(xué)習(xí)例子很少,不需要數(shù)以百萬(wàn)計(jì)的例子。這些學(xué)習(xí)風(fēng)格是人類獨(dú)有的,而當(dāng)前的人工智能并沒(méi)有掌握。
張宏江:當(dāng)我們回顧過(guò)去50多年的歷史,人工智能有一個(gè)非常緩慢的發(fā)展過(guò)程,然后10年前深度學(xué)習(xí)的出現(xiàn)使領(lǐng)域飛速發(fā)展?,F(xiàn)在要發(fā)展自我意識(shí)學(xué)習(xí),您認(rèn)為我們還要再花費(fèi)50年時(shí)間嗎?您認(rèn)為自我意識(shí)學(xué)習(xí)中,算力仍然是最重要的因素嗎?
Bart Selman:我認(rèn)為可能要再花費(fèi)10年到20年的時(shí)間,這很難預(yù)測(cè),畢竟一些研究需要基礎(chǔ)層面的突破?,F(xiàn)在和過(guò)去50年非常不同的是,我們已經(jīng)有了數(shù)據(jù),所以我對(duì)未來(lái)還是非常樂(lè)觀的。我覺(jué)得算力還是必要的組成。我認(rèn)為自我意識(shí)學(xué)習(xí),也就是說(shuō)將深度學(xué)習(xí)和知識(shí)、推理結(jié)合起來(lái),還需要很多新的idea。在機(jī)器翻譯領(lǐng)域,深度學(xué)習(xí)做的非常好,可以達(dá)到90%以上的準(zhǔn)確率。問(wèn)題是最后的10%的提升,可能需要相當(dāng)不同的方法。在自動(dòng)駕駛系統(tǒng)中,機(jī)器做出的決策必須是非常準(zhǔn)確的,容不得一絲馬虎,這樣才能確保乘客的安全。所以對(duì)于最后的10%的提升,我們還需要做額外的工作。

張宏江:數(shù)據(jù)和知識(shí)之間是有差別的,這我很贊同。Hopcroft教授,您可以就人工智能的未來(lái)談?wù)勀愕目捶▎幔?/p>
John Hopcroft:農(nóng)業(yè)發(fā)展需要很長(zhǎng)時(shí)間,而制造業(yè)發(fā)展只需要幾百年,人工智能只用了50年的時(shí)間就發(fā)展到了今天的地步。所以我認(rèn)為接下來(lái)的發(fā)展會(huì)非常快,就像你建立工具來(lái)支持更有效的工作。?在未來(lái),我們需要解決可解釋性問(wèn)題、偏見(jiàn)問(wèn)題、常識(shí)問(wèn)題、責(zé)任問(wèn)題、持續(xù)學(xué)習(xí)問(wèn)題,此外還包括AI取代人類工作后出現(xiàn)的各種社會(huì)問(wèn)題。
張宏江:Selman教授,您對(duì)于我們何時(shí)能實(shí)現(xiàn)通用人工智能有什么見(jiàn)解呢???
??Bart Selman:未來(lái)10年,我們將更加注重專業(yè)能力。但到未來(lái)20年,我們會(huì)集中發(fā)展常識(shí)、知識(shí)、真正的語(yǔ)言理解等領(lǐng)域。真正的語(yǔ)言理解,即機(jī)器會(huì)像人一樣閱讀。一旦這個(gè)問(wèn)題解決了,人類就能實(shí)現(xiàn)下一次人工智能發(fā)展的飛躍。機(jī)器一旦掌握如何理解語(yǔ)言,對(duì)我而言,就相當(dāng)于實(shí)現(xiàn)了通用人工智能。?
張宏江:Hopcroft教授,您有什么要補(bǔ)充的嗎?
John Hopcroft:在接下來(lái)的10年里,人們可能會(huì)聚焦于如何利用工程技術(shù)的最新成果解決特定問(wèn)題。但我們也需要基礎(chǔ)研究,甚至是人工智能領(lǐng)域外的基礎(chǔ)研究。在過(guò)去的25年里,基于人類大腦發(fā)育的研究也是很重要的?,F(xiàn)在人們知道在兒童生命的頭兩年,大腦會(huì)學(xué)習(xí)如何學(xué)習(xí)。在未來(lái),真正的進(jìn)步可能來(lái)源于生物學(xué),但真實(shí)情況仍然是不確定的。

張宏江:Selman教授,您能否談?wù)劊绹?guó)近期在人工智能的政策上做出了哪些正確的決定?? ?
?Bart Selman:我認(rèn)為美國(guó)做對(duì)的決定是,對(duì)人工智能領(lǐng)域的研究堅(jiān)持投資60年,即使什么成果也沒(méi)有,這是一件非常困難的事情,我們不一定知道下一步的發(fā)展方向。如果我們繼續(xù)投資于各種各樣的研究項(xiàng)目,會(huì)得到下一個(gè)突破。而如果只是投資到某些喜歡的領(lǐng)域,特別是目前最喜歡的領(lǐng)域,可能不會(huì)實(shí)現(xiàn)突破。研究突破是革命性的,不是進(jìn)化性的。我相信這就是人工智能的未來(lái),更大的規(guī)模,以及更加協(xié)作的人工智能研究項(xiàng)目。
?張宏江:您能否也說(shuō)說(shuō)中國(guó)在人工智能支持政策上有哪些做對(duì)的地方??
Bart Selman:我認(rèn)為中國(guó)在人工智能支持方面做得很好,如果要提建議的話就是,不要局限于一個(gè)領(lǐng)域??纯慈斯ぶ悄艿臍v史,有很多非常困難的問(wèn)題是從人工智能的歷史中就提出的,實(shí)際上還沒(méi)有解決。所以我鼓勵(lì)新一代研究者熟悉歷史,走向比數(shù)據(jù)驅(qū)動(dòng)更廣泛的領(lǐng)域,例如類腦學(xué)習(xí)、one-shot learning等等。除了深度學(xué)習(xí),還有一些非常重要的領(lǐng)域,即使你專注于深度學(xué)習(xí),也不要太狹隘。
三、給中國(guó)研究者的建議?
張宏江:您建議允許人們探索不同的領(lǐng)域,即使可能會(huì)失敗,也可以從這些失敗中學(xué)習(xí)。最后一個(gè)問(wèn)題,你們會(huì)給中國(guó)的人工智能研究人員提什么建議呢??
John Hopcroft:我的建議就是遠(yuǎn)離指標(biāo),中國(guó)的研究人員非常感興趣于發(fā)表的論文數(shù)量和得到的研究資金數(shù)量。遠(yuǎn)離這些指標(biāo),并關(guān)注其它的一些更有價(jià)值的層面。? ??
張宏江:非常好的建議,所以不要只追求數(shù)字。那Selman教授,您有什么建議呢?
Bart Selman:我會(huì)建議中國(guó)的研究人員多關(guān)注有創(chuàng)造意義的研究,并愿意考慮其他人沒(méi)有考慮到的問(wèn)題,我也同意Hopcroft所提的建議??纯茨切](méi)有解決的問(wèn)題,看看那些最難解決的問(wèn)題,下一個(gè)突破比下一個(gè)增量式論文更有價(jià)值。? ?
?張宏江:非常感謝John Hopcroft教授和Bart Selman教授,我們回顧了過(guò)去幾十年在人工智能上取得的突破,以及我們對(duì)下一個(gè)10年的展望。在未來(lái),我們或許會(huì)看到,人工智能社區(qū)走向全球化,經(jīng)典人工智能未來(lái)可期,并與深度學(xué)習(xí)協(xié)同發(fā)展,人工智能的各個(gè)領(lǐng)域會(huì)迎來(lái)百花齊放的盛況,新的突破點(diǎn)潛藏其中,或者在領(lǐng)域之外會(huì)帶來(lái)驚喜。