楊立昆:挺過“神經網絡寒冬”,人工智能實現(xiàn)大突破
原創(chuàng) | 文 BFT機器人

01
“卷積網絡之父”楊立昆談人工智能
今年GPT爆火以后,楊立昆化身“杠精”。從提出“GPT系統(tǒng)將很快被拋棄”的觀點,到回懟特斯拉創(chuàng)始人馬斯克“延緩大模型研究和開發(fā)是一種新的模糊主義,沒有任何意義”,楊立昆的言論引發(fā)了激烈的討論。
在今年6月的智源大會上,楊立昆教授做了精彩的線上演講,題目為“從機器學習到自主智能:朝向能夠學習、推理和規(guī)劃的機器進發(fā)”。在演講中,他提出了未來人工智能將面臨的三大挑戰(zhàn):1、學習表征并預測世界的模型;2、學會推理;3、學習規(guī)劃復雜的行動序列。
而他認為戰(zhàn)勝這些挑戰(zhàn)的答案就是“世界模型”,通過世界模型,未來人工智能可以真正的理解這個世界,并預測和規(guī)劃未來。通過成本核算模塊,結合一個簡單的需求(一定按照最節(jié)約行動成本的邏輯去規(guī)劃未來),它就可以杜絕一切潛在的毒害和不可靠性。雖然這一方案目前還沒有形成完整可行的系統(tǒng),但也具有了一些初步的研究成果。楊立昆認為這是人工智能領域下一個十年的重要研究方向。
楊立昆是法國計算機科學家、Facebook首席人工智能科學家、紐約大學教授,在人工智能領域極富盛名。作為 2018 年的圖靈獎得主之一,楊立昆與杰弗里?辛頓、約書亞?本吉奧并成為“深度學習三巨頭”。他大幅完善了卷積神經網絡(CNN),并將其用于計算機視覺領域,極大地拓寬了應用范圍,被譽為“卷積網絡之父”。

02
深度學習領域的里程碑之一:LeNet-5的開發(fā)
近年來,神經網絡熱度較高,許多 AI 應用都離不開 “三巨頭” 構建的深度學習理論基礎和指導框架。但在 20 多年前,計算機學界和產業(yè)界都對它完全提不起興趣,甚至是嗤之以鼻。在長達近 15 年的神經網絡 “寒冬” 里,學術會議多次拒收神經網絡論文,也沒人愿意公開支持。
上世紀八十年代末,楊立昆和本吉奧以及其他組員進入了當時美國電信巨頭AT&T所屬的實驗室──AT&T貝爾實驗室。在這里,他和他的組員將反向傳播算法應用在卷積神經網路上,這種進階版的人工神經網路,可以自動尋找數(shù)據(jù)中的模式和表征,適合應用在圖像與文字的識別上。在這個基礎上,他們成功開發(fā)出擁有 6.4 萬個連接的 LeNet 卷積神經網絡,并成功研發(fā)出升級版——擁有34萬個連接的LeNet-5,將其部署到銀行支票數(shù)字讀取系統(tǒng),最終應用在美國和法國的許多自動取款機上。這是卷積網絡的首次商業(yè)應用,直至20 世紀 90 年代末,美國所有支票的10%-20%都是它處理的。
03
LeNet-5的基本原理
卷積神經網絡是一種深度學習架構,主要分為三個部分:卷積層、池化層和全連接層。卷積神經網絡的核心是卷積層,它運算的目的是提取輸入的不同特征;池化層用于降低特征圖的空間分辨率,并增強模型對輸入圖像的平移不變性和魯棒性;全連接層能夠整合卷積層或者池化層中具有類別區(qū)分性的局部信息。
LeNet-5的基本結構包含7層網絡結構(不含輸入層),它具有2個卷積層、2個降采樣層(池化層)、2個全連接層和輸出層。

04
LeNet-5的貢獻
LeNet-5在當時的手寫數(shù)字識別任務中擁有高達98%以上的準確率,它的成功也吸引了更多研究者加入到深度學習的研究中。同時,LeNet-5也為AlexNet、VGG、ResNet等更加復雜的卷積神經網絡奠定了基礎。
如今,卷積神經網絡已經席卷計算機視覺、語音識別、語音合成、圖像合成和自然語言處理領域,成為行業(yè)標準。楊立昆也因深度學習的研究貢獻,與杰弗里?辛頓、約書亞?本吉奧共同獲得了2018年計算機科學最高榮譽圖靈獎。
作者?| 小河
排版 |?居居手
更多精彩內容請關注公眾號:BFT機器人
本文為原創(chuàng)文章,版權歸BFT機器人所有,如需轉載請與我們聯(lián)系。若您對該文章內容有任何疑問,請與我們聯(lián)系,將及時回應。