最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

讀 視覺求索 朱松純 《淺談人工智能:現(xiàn)狀、任務、架構(gòu)與統(tǒng)一》有感

2017-11-04 09:16 作者:licuihe  | 我要投稿

文章第一節(jié)總結(jié)概括的說明了人工智能的開端和中期三十年的表面“偃旗息鼓”,和當前的弱人工智能存在的問題。

文章第二節(jié)提出了作者期望的人工智能是什么樣子的。

文章第三節(jié)梳理了幾十年的人工智能發(fā)展方向。

文章第四節(jié)提出了人工智能的認知架構(gòu)并希望借此統(tǒng)一人工智能。具體來說就是:“一,物理環(huán)境客觀的現(xiàn)實與因果鏈條。這是外部物理環(huán)境給烏鴉提供的、生活的邊界條件。在不同的環(huán)境條件下,智能的形式會是不一樣的。任何智能的機器必須理解物理世界及其因果鏈條,適應這個世界。二,智能物種與生俱來的任務與價值鏈條。這個任務是一個生物進化的“剛需”。如個體的生存,要解決吃飯和安全問題,而物種的傳承需要交配和社會活動。這些基本任務會衍生出大量的其它的“任務”。動物的行為都是被各種任務驅(qū)動的。任務代表了價值觀和決策函數(shù),這些價值函數(shù)很多在進化過程中就已經(jīng)形成了,包括人腦中發(fā)現(xiàn)的各種化學成分的獎懲調(diào)制,如多巴胺(快樂)、血清素(痛苦)、乙酰膽堿(焦慮、不確定性)、去甲腎上腺素(新奇、興奮)等。……我們先給他們定義好身體的基本行動的功能,再定一個模型的空間(包括價值函數(shù))。其實,生物的基因也就給了每個智能的個體這兩點。然后,它就降臨在某個環(huán)境和社會群體之中,就應該自主地生存,就像烏鴉那樣找到一條活路:認識世界、利用世界、改造世界。”之后作者給出了驅(qū)動模型在空間運動(學習過程)的原因(出發(fā)點)“兩點:一、 外來的數(shù)據(jù)。外部世界通過各種感知信號,傳遞到人腦,塑造我們的模型。數(shù)據(jù)來源于觀察(observation)和實踐(experimentation)。觀察的數(shù)據(jù)一般用于學習各種統(tǒng)計模型,這種模型就是某種時間和空間的聯(lián)合分布,也就是統(tǒng)計的關(guān)聯(lián)與相關(guān)性。實踐的數(shù)據(jù)用于學習各種因果模型,將行為與結(jié)果聯(lián)系在一起。因果與統(tǒng)計相關(guān)是不同的概念。 二、內(nèi)在的任務。這就是由內(nèi)在的價值函數(shù)驅(qū)動的行為、以期達到某種目的。我們的價值函數(shù)是在生物進化過程中形成的。因為任務的不同,我們往往對環(huán)境中有些變量非常敏感,而對其它一些變量不關(guān)心。由此,形成不同的模型?!边@里的兩點原因和我之前的表述內(nèi)容差不多,當時我的理解是一來自于對其他智能體的觀察二來自于嘗試。缺少了內(nèi)在的任務(比如說如果機器人知道自己快沒電了,他需要去自主的充電。這個充電任務不是從別人那里學習的也不應該是自己沒有原因的想去嘗試獲得的)。作者認為智能系統(tǒng)的影響有三個時間段:“(1)億萬年的進化,被達爾文理論的一個客觀的適者生存的pheontype landscape驅(qū)動;(2)千年的文化形成與傳承;(3)幾十年個體的學習與適應。 我們?nèi)斯ぶ悄苎芯客ǔ?紤]的是第三個階段。 ”其實我的意見是,研究人員何嘗不想創(chuàng)造歷史,打造一個與人類智力水平相當甚至超過的人工智能啊??墒且粊砩飳W上對人類本身和動物界的智能行為研究不足,尤其是腦科學的落后,導致我們并不是十分清楚現(xiàn)在的智能生物怎么理解因果聯(lián)系和產(chǎn)生價值觀。二來是傳感器的差異,想想看人或者其他動物身上有多少傳感器啊,這些傳感器可以觀察并進行實踐或踐行物理世界的客觀存在?,F(xiàn)在僅僅給計算機一個攝像頭或者聽筒就讓他擁有智能視覺和聽覺已經(jīng)不錯啦。當然我也要明確指出,并不是說人就是人工智能的目標、榜樣或例子,就像汽車運動之于人的跑動,達到移動的目的并不需要機器去盡力的復制模仿人?;蛟S就像汽車輪子替代人類的腿這么風馬牛不相及的東西完成任務完成的這么好一樣。人工智能替代人類大腦也可以使用和生物學上大腦風馬牛不相及的樣子實現(xiàn)吧。

文章第五節(jié)講人腦的主要信息來源視覺再人工智能領域的問題。作者的意思是應該使用一些生活常識和幾何常識去理解畫面,在三維重建中只需要對感興趣的目標需求高精度,其他地方并不關(guān)心。而且在一開始也不需要很高的精度,在任務的進行過程中逐步調(diào)整。作者認為圖像識別不應該使用圖像特征去分類,用大量的圖片例子和手工標注去訓練。而應該去定義場景功能(比如一張多功能廚房的圖片應該被識別成做飯、洗菜、用餐、聊天、吃飯等)。這不禁讓人去思考,如何才可以從圖片獲取到圖片所表示的功能?(2min后)似乎沒有什么更好的辦法啊。作者認為畫面中物體的物理穩(wěn)定性和關(guān)系的推理也是非常重要的,據(jù)研究人對于物理穩(wěn)定性的反應很快,大概在100ms就能對將要傾倒的物體有反應。我猜這只是簡單的預測吧,總感覺人對于自身運動的二階導數(shù)(若人是靜止的這里就指加速度,若人是勻速運動的這里就指加加速度)非常不敏感了,但是對于自身運動的一階導數(shù)非常敏感(若人是靜止的這里就指運動的物體,若人是勻速運動的這里就指加速度)。作者還舉了一個例子來說明關(guān)系的推理:桌子上的番茄醬瓶子是道理放置的(直接可以看見)——》瓶子里的番茄醬不多了(推理出的)。作者還說了需要計算機去理解圖中的意向、注意和預測。通過動物或者人眼睛的注視的方向推測其動作意向。其實我覺得這和作者提出的前一個需求是基本一致的,就是基于一階導數(shù)的預測。作者還提出應該任務驅(qū)動的因果推理與學習。還是說理解圖像不僅僅在于圖像,還在于圖像外的知識?!耙粋€人要完成的任務是砸核桃,改變桌子上那個核桃的流態(tài)。把這個任務交給UCLA一個學生,他從桌面上的工具里面選擇了一個錘子,整個過程沒有任何過人之處,因為你也會這么做。不過你細想一下,這個問題還相當復雜。這個動作就包含了很多信息:他為什么選這個錘子而不選別的東西,他為什么拿著錘這個柄靠后的位置?他揮動的力度用多少,這都是經(jīng)過計算的。這還有幾千幾萬的可能其他各種選擇、解法,他沒有選擇,說明他這個選法比其它的選擇肯定會好,好在哪呢?看似簡單的問題,往往很關(guān)鍵,一般人往往忽略了。” 提供給學生的畫面(環(huán)境)是一個小木桌上面有一個核桃和大刷子、鑷子、鏟子、大排筆、錐子、錘子。如果將上面的實驗過程~教~給計算機。讓其進行另一個實驗,目的是一樣的——砸開核桃吃核桃——環(huán)境變了:小木桌上面有一個核桃和書本、膠水、鉛筆袋、礦泉水、橘子、香蕉、紙卷。這個任務對于計算機來說可謂難度登天,可是對于人類智力來說很好解決——用桌子腿砸。

這就是畫面外的知識,這就是舉一反三。作者強調(diào)了Spatial,Temporal and Causal Parse Graph(STC-PG),這個里面“包含了對空間的理解(包括物體、三位形狀、材質(zhì)等)、時間上動作的規(guī)劃、因果的推理?!盨TC-PG的表達不是從圖像中得到的而是之前就想好的。從圖像到任務到實現(xiàn)是“top-down”過程。少量的例子。作者總結(jié)的說“所以,我的一個理念是:計算機視覺要繼續(xù)發(fā)展,必須發(fā)掘這些“dark matter”。把圖像中想象的95%的暗物質(zhì)與圖像中可見的5%的蛛絲馬跡,結(jié)合起來思考,才能到達真正的理解?!曈X研究的未來,我用一句話來說:Go Dark, Beyond Deep --- 發(fā)掘暗,超越深?!边@應該是視覺工作者的方向了。

文章第六節(jié),作者還說:計算機看到你之后還要知道你看到的畫面和你的思考,正如(諸葛亮知道司馬懿知道他的排兵布陣,司馬懿也知道諸葛亮知道……)。

文章第七節(jié),語言、對話——溝通的認知基礎。通訊需要編碼、解碼、譯碼本,這是之前的研究。作者指出除此之外還需要共同的認知基礎,比如外國人在一起講笑話,中國人覺得不好笑,中國人談論林黛玉,外國人不明白。作者還指出“從生成式模型的角度來看,語言就是視覺,視覺就是語言。”作者提出通訊或者對話的“一個認知模型。兩個人之間至少要表達五個腦袋minds:我知道的東西、你知道的東西、我知道你知道的東西、你知道我知道的東西、我們共同知道的東西。還有,對話的時候你的意圖是什么等等諸多問題。具體我不講那么多了?!弊詈笞髡呓y(tǒng)一了計算機視覺、語言、認知、任務規(guī)劃為“計算機的人把它叫做語法,對應于代數(shù)拓撲。比如,頭和脖子在肩膀上是合規(guī)的,概率很高。這個圖像空間的結(jié)構(gòu)其實就是語法,這個語法就是STC-AOG,時空因果的與或圖。語法可導出“語言”,語言就是一個符合語法的句子的總的集合。STC-AOG就是知識的總體表達,而我們看到的眼前每一個例子是由STC-AOG導出來的時空因果解譯圖STC-PG。計算機視覺用它,語言肯定用它,認知是它,機器人任務規(guī)劃也是它。這就是一個統(tǒng)一的表達?!?/p>

文章第八節(jié)講博弈和倫理。作者提出用價值函數(shù)描述人的價值觀,他舉例用人們喜歡做什么樣的椅子,是由身體部位受力不同導致的,統(tǒng)一了達爾文和牛頓。計算機一旦知道了人選擇椅子的價值觀就可以設身處地的為人著想,為人選出最合適的椅子,就能適用不同的椅子和不同的人(有腰傷的就需要腰部少受力)。人工智能不僅要會歸納,還要回演繹。作者又舉例AlphaGO,之前的是從人類經(jīng)驗和無數(shù)對局中學習,最新的AlphaGO已經(jīng)實現(xiàn)了自我演繹。

文章第九節(jié)通過一個例子介紹機器人。我會講機器人得到的信息都寫出來,然后省略機器人的處理,直接寫出機器人的表現(xiàn)。機器人在一個房間內(nèi)已開機,研究人員從外面敲門,機器人聽到敲門聲,機器人開門。機器人看到研究人員雙手拿了一個蛋糕盒子,機器人詢問是否需要幫助。研究人員說要放到冰箱里面,機器人打開冰箱門。研究人員把蛋糕放在冰箱后坐在椅子上,拿了一個可樂罐搖了搖(可樂罐是空的),機器人再次打開冰箱門取出一罐可樂遞送給研究人員。例子到此結(jié)束。現(xiàn)在我來盡量說明這背后的巨量的工作:機器人要知道自己應該站在房間中的哪個位置,也要知道這個房間哪些位置可以站立。機器人要考慮因果關(guān)系,知道之所以有敲門聲(知道這個聲音是敲門聲而不是噪聲或者其他)是因為有人需要開門,進而去實現(xiàn)開門這個動作。機器人要知道人的雙手是什么狀態(tài)的,還能與人進行對話,從對話中獲得人的需求,進而幫助人打開冰箱門。觀察人的動作,理解人的意圖(喝可樂),進而幫助人去實現(xiàn)(喝可樂)……


文章第十節(jié)討論了學習的極限和學習“停機問題”。感覺這里已經(jīng)到了作者的認知邊緣了,說的比較簡單,但是在未來五十年都是值得重視的問題。機器人去求教一個問題的時候,他應該知道自己現(xiàn)在不知道這個問題,他也應該知道要請教的老師知道這個問題。老師機器人在解答時候要了解學生的學習程度,避免重復教學,要準確的提供新知識。機器人是否存在無法理解的概念,如何確定某個問題是機器人可以學會的或者永遠也學不會的。如何確定不同機器人之間的價值觀是否相左,如何確定機器人對某知識不感興趣。所謂的學習的極限就是在這個動態(tài)過程中達到一個平衡。對此,我的理解是:對于基本生存知識應該是每個機器人都要掌握的,不然無法生存。其余的知識由任務驅(qū)動,人類需要他去做什么工作,就設定機器人對這類的知識感興趣。在確認機器人是否可以學會這個知識可以設定動態(tài)閾值,如果超過閾值這個機器人依然沒有進步或者進步過小就標記為學不會。

文章第十一節(jié)是總結(jié):智能科學——牛頓與達爾文理論體系的統(tǒng)一。作者引用了一句話““一切物質(zhì)事件都應當歸結(jié)于一系列的有規(guī)律的原子運動,而不允許把任何生物的意志作為獨立的原因?!锢韺W依賴于一種基本的信念:物理世界存在著完整的因果鏈條,””


我的話,跟著讀了一整天吧,越讀越有興趣。因為這和我在學校選課《智能控制系統(tǒng)》時的設想幾乎一樣(反正沒人看見看到,我就實話實說了),但是當時囿于用詞和認知,沒有這么系統(tǒng)的下功夫的總結(jié)出來。當然也沒有實現(xiàn)出來。感覺浪費了在學校的很多時間。其實當時沒有整理出來呢還有一個原因我沒想明白:所謂的智能體要明白別的智能體的想法,這就是一個悖論啊。綜合這篇文章和之前讀AlphaGO的文章,現(xiàn)在看來可能是一個共同進步可以解決的問題吧,所謂“合適的對手”(AlphaGO那篇文章有講)很關(guān)鍵。就像人類嬰兒剛開始學習這個世界的時候,大人們很自然的裝作很傻很蠢的樣子,發(fā)出奇怪的的聲音和做出弱智的動作。不過呢,話說回來,人工智能的方向就是人類智能的模擬么?難道沒有人提出類似于車輪與腿關(guān)系的人工智能與人類智能的這個“車輪”么?也可能是幾百萬年來人類進化出的這個智能是最適合地球宇宙的吧……(外星人是怎么學習的?)不能再展開了……


讀 視覺求索 朱松純 《淺談人工智能:現(xiàn)狀、任務、架構(gòu)與統(tǒng)一》有感的評論 (共 條)

分享到微博請遵守國家法律
阿拉尔市| 陆丰市| 汾阳市| 当阳市| 浦县| 台前县| 武穴市| 长沙市| 安龙县| 江永县| 南漳县| 涡阳县| 玛曲县| 山丹县| 清镇市| 巨野县| 保德县| 门头沟区| 北票市| 秭归县| 大关县| 大庆市| 普洱| 庐江县| 东港市| 晋宁县| 沾益县| 江口县| 桃园县| 广东省| 罗平县| 乐昌市| 全椒县| 彰化市| 沙坪坝区| 峨眉山市| 达州市| 正安县| 河北省| 洛扎县| 商水县|