最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

權(quán)威|模式識別基礎(chǔ)未來重要研究問題

2020-10-21 17:04 作者:深藍學(xué)院  | 我要投稿
本文來自模式識別國家重點實驗室組織發(fā)布的模式識別學(xué)科發(fā)展報告,已得到模式識別國家重點實驗室授權(quán)發(fā)布。

全文大綱

本報告提出模式識別領(lǐng)域未來需要研究的10個重要問題或任務(wù):

1.?面向模式識別的認知機理與計算模型:如何模擬人類的認知機理,并從可表示、可嵌入的角度建立計算模型,提升模式識別的性能。

2.?理想貝葉斯分類器逼近:突破有限樣本、模式統(tǒng)計、結(jié)構(gòu)特性動態(tài)變化等情形下模式識別決策新理論,并面向開放環(huán)境模式識別任務(wù)構(gòu)建新的技術(shù)范式。

3.?基于不充分信息的模式識別:面對“標記信息不充分”、“數(shù)據(jù)關(guān)系不明”、“目標類信息不充分”等典型應(yīng)用情形,如何提升模式描述與分類能力。

4.?開放環(huán)境下的自主進化學(xué)習(xí):如何解決開放環(huán)境下現(xiàn)有模式識別方法與系統(tǒng)所面臨的魯棒性低、自適應(yīng)能力差、多模態(tài)數(shù)據(jù)應(yīng)用不充分和模態(tài)維度不平衡等難題。

5.?知識嵌入的模式識別:如何在傳統(tǒng)模式識別方法和新的理論與方法中對知識進行表示、嵌入和應(yīng)用。

6.?交互式學(xué)習(xí)的理論模型與方法:如何建立“交互式學(xué)習(xí)、人機協(xié)同混合、人在回路”與模式識別理論與方法的融合范式,提升模式識別系統(tǒng)的泛化能力。

7.?可解釋性深度模型:如何從理論上解釋深度模型的有用性,并為構(gòu)建新型模型提供理論指導(dǎo)。

8.?新型計算架構(gòu)下的模式識別:如何突破現(xiàn)有馮諾依曼計算機體系結(jié)構(gòu)下的模式識別算法體系,構(gòu)建諸如量子計算、DNA計算等新型計算構(gòu)架下的模式識別理論與方法體系。

9.?模式結(jié)構(gòu)解釋和結(jié)構(gòu)模型學(xué)習(xí):如何建立高效的元學(xué)習(xí)方法和新型結(jié)構(gòu)模式描述與結(jié)構(gòu)學(xué)習(xí)方法,提升模型的泛化能力、環(huán)境與任務(wù)自適應(yīng)能力。

10.?安全強化的模式識別理論與方法:如何提升模式識別方法的可對抗性和可抗侵入性,提升模式識別系統(tǒng)的安全性能。

點贊加關(guān)注,好文不迷路~^-^

以下為報告正文部分


引言

隨著信息技術(shù)的發(fā)展和推廣應(yīng)用,模式識別所需處理的數(shù)據(jù)呈現(xiàn)出多源異構(gòu)、海量混雜、時空動態(tài)演變的新特點,對模式識別系統(tǒng)的性能和安全要求越來越高。開放環(huán)境理解、智能人機交互、智能輔助系統(tǒng)等尤其需要先進的模式識別方法驅(qū)動的視聽覺信息理解技術(shù)。從總體發(fā)展態(tài)勢上,傳統(tǒng)的難點基礎(chǔ)理論問題和技術(shù)瓶頸問題尚未得到全面充分地解決;同時,在基于泛在感知與開放環(huán)境感知的智能信息處理過程中不斷地產(chǎn)生著諸多新型的模式識別問題,需要新的學(xué)習(xí)方法加以解決。

現(xiàn)有的模式識別大多建立在樣本充分的假設(shè)和貝葉斯決策理論的基礎(chǔ)之上。即使在樣本較充分的情形下,理想貝葉斯分類器逼近問題也一直未得到完全解決。這一問題在小規(guī)模樣本條件下和信息不充分條件下顯得更加突出。相反,人類對此則比較擅長。因此,除了拓展現(xiàn)有方法之外,尤其需要引入類人模式識別機理,發(fā)展高效的模式描述與分類方法。然而在傳統(tǒng)的以貝葉斯決策為模式識別理論與方法的框架內(nèi),很難將樣本統(tǒng)計量之外的注意、記憶等感知知識在現(xiàn)有模式識別方法中進行有效表示和高效嵌入。

當前,基于深度學(xué)習(xí)的模式識別方法顯示了明顯的優(yōu)勢,但深度學(xué)習(xí)模型顯示可解釋性、小樣本泛化性、魯棒性差等缺陷?,F(xiàn)有深度學(xué)習(xí)方法強調(diào)對樣本的擬合程度,缺乏在建模前、模型本身和模型效果三個環(huán)節(jié)的可解釋性,即難以給出所需要的足夠的可以理解的信息。深度學(xué)習(xí)模型的可解釋性在理論研究方面有一些進展,但還沒有實質(zhì)性突破。

同時,現(xiàn)有的模式識別方法大多建立于靜態(tài)的統(tǒng)計或明晰的模式結(jié)構(gòu)信息之上。但是,這些假定往往與實際應(yīng)用中的開放環(huán)境相去甚遠。在開放環(huán)境下,與同一模式相關(guān)的數(shù)據(jù)類型通常是混雜的、時變的且呈現(xiàn)出多源異構(gòu)特性;模式類別和結(jié)構(gòu)也是動態(tài)變化的;同時,模式信息的不充分性和不確定性變得十分普遍。目前,尚缺乏普遍有效的理論與方法來處理模式類別、類條件概率密度函數(shù)和模式結(jié)構(gòu)時變的情形。

總結(jié)起來,模式識別基礎(chǔ)理論與方法研究呈現(xiàn)出以下幾個趨勢:

(1)面向開放環(huán)境感知的模式識別理論與方法

開放環(huán)境下所面臨的模式情形復(fù)雜多變。從同一模式所關(guān)聯(lián)的數(shù)據(jù)來看,既有海量多模態(tài)數(shù)據(jù),也有小規(guī)模樣本數(shù)據(jù);各類模式的統(tǒng)計特征或結(jié)構(gòu)特征動態(tài)變化,數(shù)據(jù)類型多樣混雜,模式信息不充分和不確定等各種情形。目前,呈現(xiàn)出多源/多模態(tài)協(xié)同模式分析理論與方法、魯棒模式識別理論與方法、連續(xù)自主學(xué)習(xí)理論與方法、開放環(huán)境感知模式識別方法等研究態(tài)勢。

(2)非結(jié)構(gòu)化數(shù)據(jù)模式分析理論與方法

大多數(shù)模式數(shù)據(jù)(如視覺感知數(shù)據(jù))均為非結(jié)構(gòu)化數(shù)據(jù)。建立從非結(jié)構(gòu)化數(shù)據(jù)輸入到結(jié)構(gòu)化輸出(如類別、關(guān)系等)的模式分析系統(tǒng)一直是多種不同應(yīng)用行業(yè)的共同需求。目前,基于特征自學(xué)習(xí)的模式分類理論與方法,以深度學(xué)習(xí)為基準的無監(jiān)督特征學(xué)習(xí)理論與方法均是當前的熱點研究問題。以端到端為核心思想,構(gòu)建面向復(fù)雜場景的、魯棒的、環(huán)境無約束的非結(jié)構(gòu)化數(shù)據(jù)模式分析理論與方法是一個主要的發(fā)展趨勢。

(3)類人/類腦模式表示與學(xué)習(xí)理論與方法

人腦對非結(jié)構(gòu)化感知數(shù)據(jù)具有超強的學(xué)習(xí)和理解能力,具有多模態(tài)信息處理、自主學(xué)習(xí)、實時更新等特點。目前,充分引入人的感知機理,以腦結(jié)構(gòu)、神經(jīng)形態(tài)學(xué)、類腦研究的最新成果為引導(dǎo),研究高效的跨模態(tài)非結(jié)構(gòu)化協(xié)同學(xué)習(xí)方法、小規(guī)模樣本主動可增強自學(xué)習(xí)、自監(jiān)督、自演化方法、自主特征學(xué)習(xí)方法、自動目標感知與識別方法、類腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法,發(fā)展類腦模式識別理論與方法已成為模式識別領(lǐng)域的重要課題。構(gòu)建“能夠模擬人腦神經(jīng)結(jié)構(gòu)的、認知機理的和類人學(xué)習(xí)的”新型模式表示、學(xué)習(xí)與識別的理論與方法、強化學(xué)習(xí)策略等,有望進一步解決非結(jié)構(gòu)化感知數(shù)據(jù)的高效處理和理解問題。

(4)新型計算構(gòu)架下的模式識別

目前并行計算、量子計算和DNA計算已經(jīng)取得了突破。并行計算在模式識別算法改進中得到廣泛應(yīng)用。在DNA計算框架下,通過生化處理技術(shù)解決復(fù)雜模式分析與學(xué)習(xí)任務(wù)已得到開展。在新型計算框架下發(fā)展新型模式識別理論是一個新的趨勢。

基于模式識別理論技術(shù)的現(xiàn)狀和發(fā)展趨勢分析,本報告提出模式識別領(lǐng)域未來需要研究的10個重要問題或任務(wù):

1.?面向模式識別的認知機理與計算模型:如何模擬人類的認知機理,并從可表示、可嵌入的角度建立計算模型,提升模式識別的性能。

2.?理想貝葉斯分類器逼近:突破有限樣本、模式統(tǒng)計、結(jié)構(gòu)特性動態(tài)變化等情形下模式識別決策新理論,并面向開放環(huán)境模式識別任務(wù)構(gòu)建新的技術(shù)范式。

3.?基于不充分信息的模式識別:面對“標記信息不充分”、“數(shù)據(jù)關(guān)系不明”、“目標類信息不充分”等典型應(yīng)用情形,如何提升模式描述與分類能力。

4.?開放環(huán)境下的自主進化學(xué)習(xí):如何解決開放環(huán)境下現(xiàn)有模式識別方法與系統(tǒng)所面臨的魯棒性低、自適應(yīng)能力差、多模態(tài)數(shù)據(jù)應(yīng)用不充分和模態(tài)維度不平衡等難題。

5.?知識嵌入的模式識別:如何在傳統(tǒng)模式識別方法和新的理論與方法中對知識進行表示、嵌入和應(yīng)用。

6.?交互式學(xué)習(xí)的理論模型與方法:如何建立“交互式學(xué)習(xí)、人機協(xié)同混合、人在回路”與模式識別理論與方法的融合范式,提升模式識別系統(tǒng)的泛化能力。

7.?可解釋性深度模型:如何從理論上解釋深度模型的有用性,并為構(gòu)建新型模型提供理論指導(dǎo)。

8.?新型計算架構(gòu)下的模式識別:如何突破現(xiàn)有馮諾依曼計算機體系結(jié)構(gòu)下的模式識別算法體系,構(gòu)建諸如量子計算、DNA計算等新型計算構(gòu)架下的模式識別理論與方法體系。

9.?模式結(jié)構(gòu)解釋和結(jié)構(gòu)模型學(xué)習(xí):如何建立高效的元學(xué)習(xí)方法和新型結(jié)構(gòu)模式描述與結(jié)構(gòu)學(xué)習(xí)方法,提升模型的泛化能力、環(huán)境與任務(wù)自適應(yīng)能力。

10.?安全強化的模式識別理論與方法:如何提升模式識別方法的可對抗性和可抗侵入性,提升模式識別系統(tǒng)的安全性能。


1、面向模式識別的認知機理與計算模型

由于近年來高性能計算以及大規(guī)模數(shù)據(jù)的出現(xiàn),基于深度學(xué)習(xí)(深度神經(jīng)網(wǎng)絡(luò))的模式識別方法在各個任務(wù)(主要是基于監(jiān)督學(xué)習(xí)的分類任務(wù))中都取得了重大突破。然而,在面向真實場景中對信息語義的理解層面上,仍存在大量難題。例如,在一個特定場景中,不僅要知道目標是什么、在哪里,還需要知道目標之間的關(guān)系,分別包括物與物、人與人、以及人與物的關(guān)系;日常生活中的對話場景不僅包含對語言內(nèi)容本身的討論,還包括對場景中的信息進行討論和交談,交談的語言信息反過來幫助對內(nèi)容的理解;一個相對于人來說特別簡單的任務(wù),譬如“進房間取一杯水”,需要進行探索并執(zhí)行一系列的決策,簡短的文本命令并不能提供太多的監(jiān)督信息,基于新奇、好奇的內(nèi)在動機能夠驅(qū)動一系列探索,最終達到任務(wù)目標;當我們走在路上看到有一群人一起看著某一個方向時,我們會有意或無意地將自己的注意力轉(zhuǎn)向他們正在注意的方向和關(guān)注的事物,這樣能有效地獲悉他人的內(nèi)在狀態(tài)(如行為意圖、目標信念等)以及共享環(huán)境中的重要事件和關(guān)鍵信息(如食物、危險等)。可以看到,這些復(fù)雜任務(wù)包含了關(guān)系挖掘、問答/對話、視聽覺協(xié)同、動機與學(xué)習(xí)等,它們需要實現(xiàn)對信息的選擇與過濾、信息的保留與維持、以及信息的推理,而這些都是很重要的認知機制與認知過程,主要涉及到認知中的注意、記憶、學(xué)習(xí)與推理。

人類認知具有語義理解、多模態(tài)信息處理、小規(guī)模樣本泛化、自主學(xué)習(xí)、實時更新、魯棒描述與識別等諸多優(yōu)點。但是,前期研究通常忽略了一個重要事實,即現(xiàn)在廣泛使用的深度神經(jīng)網(wǎng)絡(luò)僅僅是對人腦中的單一認知機制進行粗略建模,而系統(tǒng)地研究大腦認知機制對于信號處理的重要性是不言而喻的。因此,研究認知計算理論與方法將會推動模式識別領(lǐng)域的變革性發(fā)展。

在研究方法上,通過建立模擬人類視覺認識機理,建立小規(guī)模樣本認知模式語義描述和分類方法,提升開放環(huán)境下模式識別方法的魯棒性;通過建立模擬人類的記憶機理,建立知識表示和知識嵌入的模式識別方法與系統(tǒng);通過建立模擬人類多源信息融合的能力,提升多模態(tài)信息處理能力;面對復(fù)雜的模式識別任務(wù)和魯棒系統(tǒng)構(gòu)建,建立類人認識的目標模塊、視覺模塊、動作模塊和描述性知識模塊,通過模擬人的感知、思想和行為提升系統(tǒng)性能。


2、理想貝葉斯分類器逼近

貝葉斯分類是一類基于貝葉斯決策(最小風(fēng)險決策,最大后驗概率決策)的模式分類方法。在“各類先驗分布”和“各類條件概率密度函數(shù)”均已知的理想情形下,基于貝葉斯決策規(guī)則所構(gòu)建的分類器稱為貝葉斯分類器,在理論上是性能最優(yōu)的(期望風(fēng)險或分類錯誤率最小)。但是,在實際應(yīng)用中,上述兩個已知的理想要素可能均未知,且由于訓(xùn)練樣本數(shù)有限,很難得到準確的概率密度函數(shù)估計。因此,實際中不同類型的分類器只能對概率密度函數(shù)進行近似估計,或者繞過概率密度估計直接對判別函數(shù)或后驗概率進行估計或近似。這些實際的分類器類型都可看作是貝葉斯分類器的近似,理論上其性能亞于貝葉斯分類器。如何在樣本有限的情況下設(shè)計更優(yōu)的分類器,使其性能盡量逼近貝葉斯分類器,是一個重要的研究課題和方向。

研究理想貝葉斯分類器的逼近,在理論和應(yīng)用上都具有重要意義。理論上,從貝葉斯決策的角度對實際分類器進行分析,有助于探索出更優(yōu)分類器設(shè)計方法;應(yīng)用上,在性能上逼近貝葉斯分類器的分類器具有更好的實際應(yīng)用性能。這些優(yōu)勢不僅僅只體現(xiàn)在分類精度,同時還具有魯棒性、可解釋性、可靠性等方面的優(yōu)勢。

理想的貝葉斯分類器要求基于無限多的樣本對類先驗概率和條件概率密度函數(shù)進行準確估計,這在實際中不可實現(xiàn)。因此,在有限樣本情形下,采用結(jié)構(gòu)和功能受限的分類器結(jié)構(gòu)(函數(shù)),針對具體應(yīng)用場景設(shè)計近似貝葉斯決策的分類器,是比較通行的做法。但是,設(shè)計出來的分類器對貝葉斯分類器到底近似到何種程度,如何更好地逼近貝葉斯分類器等問題沒有得到解決。在實際應(yīng)用中,面對高維空間有限樣本、類條件概率密度函數(shù)動態(tài)變化、開放類別集、目標類信息不平衡等因素的綜合作用和關(guān)聯(lián)影響,貝葉斯分類器逼近會變得更加復(fù)雜。在研究途徑上,可對已有的各種分類器或新設(shè)計的分類器從特征空間分析和概率密度估計的角度對分類器性能和貝葉斯分類器的逼近程度進行數(shù)學(xué)分析和多角度(不同樣本條件、分類模型假設(shè)、不同性能指標)實驗評價,給出逼近貝葉斯分類器的條件和實現(xiàn)指導(dǎo)。


3、基于不充分信息的模式識別

模式是指存在于時間和空間中可觀測、可度量和可區(qū)分的信息。模式識別的核心任務(wù)是對模式進行分析與處理,進而實現(xiàn)描述、辨識、分類與解譯。然而在現(xiàn)實應(yīng)用中,由于各種原因?qū)δJ降挠^測往往不充分,通常情況下僅能獲得有關(guān)同類模式的有限樣例。在統(tǒng)計上,有限樣例難以描述同類模式的真實分布。同時,受技術(shù)條件限制,所獲取的模式信息可能不完備。另外,模式所關(guān)聯(lián)的時空環(huán)境具有不確定性,決策環(huán)境的先驗信息難以精確描述。這些不確定性因素導(dǎo)致人們在應(yīng)用當前普遍遵循的貝葉決策理論與技術(shù)方法進行模式分類時存在決策器泛化能力不足的風(fēng)險。

受客觀條件以及問題自身性質(zhì)等各方面因素的影響,數(shù)據(jù)信息的不充分性主要表現(xiàn)在以下幾個方面。其一,標記信息不充分:數(shù)據(jù)概念標記的獲取通常需要通過專家標注或科學(xué)實驗等途徑,從而消耗大量的人力和物力。因此,真實世界中的數(shù)據(jù)在很多情況下只具有有限的標記信息,從而導(dǎo)致標記信息的不充分。其二,關(guān)系信息不充分:真實世界中的數(shù)據(jù)其固有的關(guān)系信息在很多情況下并未充分地表達出來(比如,空間位置關(guān)系、相似關(guān)系、包含關(guān)系等),從而不利于學(xué)習(xí)系統(tǒng)泛化能力的提高。其三,目標類信息不充分:在真實世界中,人們感興趣的目標類數(shù)據(jù)的出現(xiàn)頻率通常遠低于非目標類,從而產(chǎn)生類不平衡現(xiàn)象,導(dǎo)致目標類信息不充分。

不充分信息條件下的模式識別需要發(fā)展新的決策理論與方法體系。在研究途徑上,在理論上,需要在現(xiàn)有的貝葉決策理論框架基礎(chǔ)上發(fā)展結(jié)構(gòu)化統(tǒng)計和知識推理型模式分類理論體系;在方法上,需要發(fā)展弱信息條件下的強模式識別方法、小規(guī)模樣本模式識別方法、關(guān)系模式識別方法、信息不對稱條件下的模式識別方法、生物啟發(fā)的模式識別,并在實際應(yīng)用中對理論與方法不斷進行驗證和更迭。


4、開放環(huán)境下的自適應(yīng)學(xué)習(xí)

現(xiàn)有的統(tǒng)計模式識別方法大多是在貝葉斯統(tǒng)計決策理論框架下按照最小錯誤率或最?。ńY(jié)構(gòu))風(fēng)險規(guī)則建立而來。在該框架中,類先驗和類條件概率密度函數(shù)是靜態(tài)不變的。這種靜態(tài)性假定同類樣本獨立同分布且具有一致的應(yīng)用環(huán)境。然而,在開放條件下,數(shù)據(jù)以動態(tài)方式獲得。一方面,在開放環(huán)境下,樣本分布呈現(xiàn)持續(xù)動態(tài)變化形態(tài),因此獨立同分布的假設(shè)往往不復(fù)存在。另一方面,在開放環(huán)境下,新的模式總是不斷呈現(xiàn)。但是,貝葉斯統(tǒng)計決策理論框架所建立的模式分類方法大多是類封閉的,缺乏新類自主發(fā)現(xiàn)能力。目前,模式度量、新類條件、風(fēng)險準則均沒有對應(yīng)的計算機制。面向這些問題,需要研究開放環(huán)境下的自適應(yīng)學(xué)習(xí),以滿足開放環(huán)境下模式識別所面臨的新特點、新模式和新挑戰(zhàn)。傳統(tǒng)的模式識別系統(tǒng)一旦訓(xùn)練完成將不再改變,這和人腦的智能截然不同,并且也無法滿足系統(tǒng)長時間運行和環(huán)境變化的需求。因此,具備環(huán)境適應(yīng)能力的模式識別系統(tǒng)顯得尤為重要。

在開放環(huán)境下,與同一模式相關(guān)的數(shù)據(jù)通常是混雜的,如帶標記數(shù)據(jù)、無標記數(shù)據(jù)、噪音數(shù)據(jù)、錯誤標記數(shù)據(jù),并且這些數(shù)據(jù)是時變的。同時,模式類別也是動態(tài)變化的。因此,面向混雜流數(shù)據(jù)和多類型環(huán)境,開放環(huán)境下的學(xué)習(xí)需要突破傳統(tǒng)的一次性訓(xùn)練、增量訓(xùn)練到主動訓(xùn)練、演化與迭代技術(shù)范式,實現(xiàn)學(xué)習(xí)器的環(huán)境動態(tài)自適應(yīng)性。

在開放環(huán)境下,模式系統(tǒng)識別主要面臨噪聲與任務(wù)魯棒性低、環(huán)境自適應(yīng)能力差、多模態(tài)數(shù)據(jù)應(yīng)用不充分等難題。在研究途徑上,面向混雜數(shù)據(jù)流,增強增量學(xué)習(xí)的連續(xù)學(xué)習(xí)能力,構(gòu)建可適應(yīng)分布動態(tài)變化的分類器方法、開放類別集的分類器方法、主動半監(jiān)督增量學(xué)習(xí)方法、分類器連續(xù)自適應(yīng)學(xué)習(xí)方法,并通過設(shè)計新的分類準則和學(xué)習(xí)策略實現(xiàn)對模式類別數(shù)、類別分布、決策面、模型參數(shù)和動態(tài)調(diào)整;面向動態(tài)變化的環(huán)境,引入博弈、競爭、演化、和深度強化學(xué)習(xí)等機制,實現(xiàn)分類環(huán)境自適應(yīng)性和自我升級。


5、知識嵌入的模式識別

以深度學(xué)習(xí)為代表的主流模式識別模型往往都是基于大量數(shù)據(jù)的統(tǒng)計學(xué)習(xí)方法,一方面需要海量高質(zhì)量標注數(shù)據(jù)進行學(xué)習(xí),另一方面對數(shù)據(jù)中未能涵蓋的模式泛化性能差。因此,如何將傳統(tǒng)的領(lǐng)域知識嵌入到模式識別系統(tǒng)的學(xué)習(xí)過程中,是亟待研究的重要問題。通過知識和數(shù)據(jù)雙驅(qū)動的方式可以進一步提升模型的泛化性和魯棒性。同時,在學(xué)習(xí)過程中如何發(fā)現(xiàn)新知識并以此為基礎(chǔ)實現(xiàn)系統(tǒng)的自學(xué)習(xí)自更新是需要進一步研究的問題。

人類認知機制可以高效地表征不同類型的知識及其相互關(guān)系,并將其有規(guī)律地組織起來。模式識別模型急需對感知知識的自主發(fā)現(xiàn)、結(jié)構(gòu)化組織和層次化計算,通過建立知識運用的類人認知能力的計算方法,實現(xiàn)知識的可計算??赡艿难芯客緩接校夯诙嗄B(tài)信息融合的多類型知識聯(lián)合發(fā)現(xiàn)框架,感知知識的組織范式、知識量化與度量、知識關(guān)聯(lián)關(guān)系,圖結(jié)構(gòu)化感知知識表征模型,類人層次化知識凝練的計算策略,圖知識層次化推理機制與計算方法等。傳統(tǒng)模式識別方法大多將感知問題簡單建模為從輸入感知數(shù)據(jù)到輸出類別信息的非線性映射。這類純屬數(shù)據(jù)驅(qū)動的感知模型將所有感知數(shù)據(jù)不加區(qū)分地進行整體處理,缺乏像類人記憶機制那樣可選擇性地對顯著內(nèi)容進行知識提取與組織,同時無法自適應(yīng)地將提取的知識進行長時存儲與更新,因此缺乏環(huán)境交互性和自適應(yīng)性。因此研究感知數(shù)據(jù)與知識在記憶空間的協(xié)同表示顯得尤為重要,通過建立感知模型和知識記憶交互的統(tǒng)一框架,實現(xiàn)知識融合的自適應(yīng)感知與學(xué)習(xí)??赡艿难芯客緩桨ǎ貉芯扛兄獢?shù)據(jù)和知識在同一記憶空間的協(xié)同表示、高效推理方法和注意機制;研究具有記憶機制的新型深度學(xué)習(xí)感知模型與方法,挖掘感知數(shù)據(jù)內(nèi)部知識的關(guān)聯(lián)性和依賴性,賦予其“學(xué)習(xí)-記憶-預(yù)測”機制;構(gòu)建自適應(yīng)感知深度學(xué)習(xí)模型框架,使其能夠?qū)崿F(xiàn)不同記憶狀態(tài)間的信息協(xié)同和傳遞,具備信息可動態(tài)感知、表示可同步更新、知識可長期自主學(xué)習(xí)等類人自適應(yīng)感知與學(xué)習(xí)能力。


6、交互式學(xué)習(xí)的理論模型與方法

基于貝葉斯決策理論的模式分類建立在充分觀測的基礎(chǔ)上,并強調(diào)觀測樣本集蘊含足夠多類分布信息。但現(xiàn)有的任何分類器并不具有舉一反三的能力,不能有效應(yīng)對模式的線性或非線性變化,缺乏足夠的遷移能力、泛化能力和語義嵌入能力。交互式學(xué)習(xí)、人機協(xié)同混合方法、人在回路的方法等是有望突破上述缺限的主要技術(shù)路線,但目前缺乏相應(yīng)的理論與算法體系的支撐。

統(tǒng)計機器學(xué)習(xí)中的一個重要環(huán)節(jié)就是生成訓(xùn)練數(shù)據(jù),但是在很多實際場景中訓(xùn)練數(shù)據(jù)往往不足。交互式學(xué)習(xí)能夠較好的彌補數(shù)據(jù)缺失的問題,從而提升模式識別系統(tǒng)的整體性能。與數(shù)據(jù)增廣以及自監(jiān)督學(xué)習(xí)不同,交互式學(xué)習(xí)可以獲取更高質(zhì)量的數(shù)據(jù)。一個典型的例子是在計算機應(yīng)用系統(tǒng)中記錄用戶的使用行為,將其用于系統(tǒng)性能提高是日志數(shù)據(jù)挖掘的基本想法,比如,互聯(lián)網(wǎng)搜索引擎會記錄用戶查詢的點擊數(shù)據(jù),包括用戶提交的查詢,系統(tǒng)返回的URL,以及用戶點擊的其中的URL,這些廉價的點擊數(shù)據(jù)可以用于機器學(xué)習(xí)的訓(xùn)練,用戶在提供行為數(shù)據(jù)的過程中不需花費更多的代價,只需要自然地使用應(yīng)用系統(tǒng)即可。另外一個例子是眾包(Crowdsourcing):將數(shù)據(jù)標注作為任務(wù),在網(wǎng)上市場上進行任務(wù)交易,雇用大眾進行數(shù)據(jù)標注,數(shù)據(jù)收集者將標注任務(wù)發(fā)布在市場上;市場中有大量注冊會員,稱為工人,工人根據(jù)自己的能力、興趣選擇任務(wù),進行數(shù)據(jù)標注,得到一定報酬,這樣就可以通過使用大量人工標注數(shù)據(jù)很快地構(gòu)建一個智能系統(tǒng),互聯(lián)網(wǎng)將人們聯(lián)系在一起,使眾包成為可能。還有一些例子是人機交互協(xié)同計算的,如通過一些特別設(shè)計的游戲來獲取數(shù)據(jù),比如,ESP游戲中,給兩個玩者同時展示一張圖片,讓他們各自獨立地對圖片進行標注;如果兩人標注的標記一致,就都得分,如果不一致,就都不得分。另一個例子是ReCAPTCHA,用戶在登錄網(wǎng)站時通常需要輸入驗證碼,很多網(wǎng)站采用了ReCAPTCHA系統(tǒng)產(chǎn)生驗證碼。驗證碼分兩段;一段有正確答案,用于鑒別登錄是來自真人還是機器人,另一段沒有正確答案,用于OCR訓(xùn)練數(shù)據(jù)的收集。

世界上有兩種計算機,一種是電子計算機,另一種就是人本身的“計算機”。兩種計算機各有所長,可以互相取長補短,協(xié)同合作,完成任務(wù)。這就是交互式學(xué)習(xí)的主要想法。人機交互中獲取數(shù)據(jù)是提高機器學(xué)習(xí)的有效途徑,孕育著巨大的可能性、同時也帶來眾多的挑戰(zhàn)。設(shè)計數(shù)據(jù)收集方法時,我們需要考慮,如何調(diào)動大眾,如何處理大數(shù)據(jù),如何保證數(shù)據(jù)的質(zhì)量,如何用于具體應(yīng)用;設(shè)計學(xué)習(xí)方法時,我們需要考慮,如何實施大規(guī)模機器學(xué)習(xí),如何提高學(xué)習(xí)的準確性。


7、可解釋性深度模型

模式結(jié)構(gòu)解釋是指對輸入模式內(nèi)部的組成元素及元素間關(guān)系進行的分析。很多模式識別應(yīng)用問題不僅需要求模型給出預(yù)測或識別結(jié)果,同時還需要模型對預(yù)測給出解釋。比如,在醫(yī)療問題中,模型不僅需要給出診斷結(jié)果,更重要的是給出支持結(jié)論的證據(jù)或原因;在文本、圖像的檢索和匹配問題中,模型不僅要給出兩個對象之間的相似性評分,還要給出他們內(nèi)部結(jié)構(gòu)的對應(yīng)關(guān)系。不僅在應(yīng)用中有廣泛需求,結(jié)構(gòu)解釋通常包含對模式內(nèi)部的構(gòu)成元素進行分析,對元素間的因果關(guān)系、組成關(guān)系、時空關(guān)系等進行建模,本質(zhì)上,能夠提供一種對模式的深層理解,因此,具有極高的理論意義。

模式結(jié)構(gòu)解釋和結(jié)構(gòu)模型的學(xué)習(xí)一直是模式識別領(lǐng)域的核心問題之一。上世紀七十年代,華人學(xué)者傅京孫就提出了句法模式識別方法,使用語法表示數(shù)據(jù)間關(guān)系,通過語法分析進行推理和識別。此外,基于串匹配、圖匹配的方法也是結(jié)構(gòu)預(yù)測中一類重要的方法。但上述方法只對特定問題有效,而且串模板和圖模板的自動學(xué)習(xí)至今尚無有效的方法。目前,應(yīng)用最為廣泛的是基于統(tǒng)計學(xué)習(xí)的結(jié)構(gòu)模型。早期的方法,如LASSO、決策樹,通過特征選擇對預(yù)測結(jié)果提供一些簡單的可解釋性,但這些方法基于輸入特征和輸出結(jié)果之間的統(tǒng)計相關(guān)性并不能提供對模式內(nèi)部的深層理解。概率圖模型是最經(jīng)典的統(tǒng)計結(jié)構(gòu)模型,它通過對多隨機變量聯(lián)合分布的建模能夠?qū)ψ兞块g的各種關(guān)系進行表示、推理和學(xué)習(xí)。典型的概率圖模型,如條件隨機場、隱馬爾可夫模型,在計算機視覺、語音識別、自然語言處理等領(lǐng)域有著廣泛應(yīng)用。深度學(xué)習(xí)興起后,圖神經(jīng)網(wǎng)絡(luò)逐漸成為一類新的結(jié)構(gòu)學(xué)習(xí)方法。相比概率圖模型,圖神經(jīng)網(wǎng)絡(luò)在計算效率、靈活性、關(guān)系學(xué)習(xí)能力方面都具有優(yōu)勢。


8、新型計算架構(gòu)下的模式識別

現(xiàn)有的模式識別算法均是在馮諾依曼計算機體系結(jié)構(gòu)下構(gòu)建的,且大多是面向個人計算機的。當前,物理計算能力和計算構(gòu)架正在發(fā)生深刻變化。超算平臺、云計算、基于NPU的高性能計算、多集群分布式計算等已經(jīng)得到廣泛應(yīng)用,但在模式識別算法開發(fā)與應(yīng)用方面仍不充分。同時,在信息技術(shù)領(lǐng)域中,仿生生物計算機、量子計算機等概念相繼推出。在這些新的計算構(gòu)架下,模式識別問題描述與算法實現(xiàn)將會隨之發(fā)生新變化。

一些新的需求和發(fā)展趨勢也對模式識別技術(shù)提出了新的挑戰(zhàn)。在邊緣計算方面:隨著萬物互聯(lián)的時代來臨,越來越多的計算從中心向邊緣轉(zhuǎn)移,便于在邊緣端支援繁重的數(shù)據(jù)分析應(yīng)用,進而支援決策的即時制定。在內(nèi)存驅(qū)動計算方面:傳統(tǒng)計算架構(gòu)中以CPU為中心不停地在部件間進行數(shù)據(jù)移動,數(shù)據(jù)處理效率低下,內(nèi)存驅(qū)動計算架構(gòu)將內(nèi)存置于計算平臺的中心,而非處理器,能夠顯著提高性能和效率,推動智能發(fā)展。在可重構(gòu)計算方面:真正理想的計算應(yīng)該是軟件和硬件的架構(gòu)一模一樣,軟件是什么樣的拓撲結(jié)構(gòu),硬件就應(yīng)該是怎樣的拓撲結(jié)構(gòu);軟件需要什么樣的運算,硬件需要存在這樣的運算資源,硬件功能和架構(gòu)能夠動態(tài)地按照軟件實時進行改變。

另外,量子計算得到了蓬勃發(fā)展。基于量子力學(xué)態(tài)疊加原理和量子力學(xué)演化的并行性,調(diào)控量子信息單元,保持多個量子比特的量子相干性,進行超高精度的量子邏輯操作,實現(xiàn)大規(guī)模量子計算,提升計算機的計算效率和能力。同時,在DNA計算方面,對數(shù)據(jù)進行DNA編碼,根據(jù)堿基配對原理,在溶液中實現(xiàn)大規(guī)模并行計算,以空間換時間,通過生化處理技術(shù)解決復(fù)雜模式分析與學(xué)習(xí)任務(wù)。針對這些特殊的應(yīng)用場景和新興計算技術(shù),模式識別無論是從模型還是算法層面都要做出相應(yīng)的調(diào)整以滿足新時代的實際需求。


9、模式結(jié)構(gòu)解釋和結(jié)構(gòu)模型學(xué)習(xí)

模式結(jié)構(gòu)解釋是指對輸入模式內(nèi)部的組成元素及元素間關(guān)系進行的分析。很多模式識別應(yīng)用問題不僅要求模型給出預(yù)測或識別結(jié)果,同時還需要模型對預(yù)測給出解釋。比如,在醫(yī)療問題中,模型不僅需要給出診斷結(jié)果,更重要的是給出支持結(jié)論的證據(jù)或原因;在文本、圖像的檢索和匹配問題中,模型不僅要給出兩個對象之間的相似性評分,還要給出他們內(nèi)部結(jié)構(gòu)的對應(yīng)關(guān)系。不僅在應(yīng)用中有廣泛需求,結(jié)構(gòu)解釋通常包含對模式內(nèi)部的構(gòu)成元素進行分析,對元素間的因果關(guān)系、組成關(guān)系、幾何關(guān)系等進行建模,本質(zhì)上,能夠提供一種對模式的深層理解,因此,具有極高的理論意義。

模式結(jié)構(gòu)解釋和結(jié)構(gòu)模型的學(xué)習(xí)一直是模式識別領(lǐng)域的核心問題之一。上世紀七十年代,華人學(xué)者傅京孫就提出了句法模式識別方法,使用語法表示數(shù)據(jù)間關(guān)系,通過語法分析進行推理和識別。此外,基于串匹配、圖匹配的方法也是結(jié)構(gòu)預(yù)測中一類重要的方法。但上述方法只對特定問題有效,而且串模板和圖模板的自動學(xué)習(xí)至今尚無有效的方法。目前,應(yīng)用最為廣泛的是基于統(tǒng)計學(xué)習(xí)的結(jié)構(gòu)模型。早期的方法,如LASSO、決策樹,通過特征選擇對預(yù)測結(jié)果提供一些簡單的可解釋性,但這些方法基于輸入特征和輸出結(jié)果之間的統(tǒng)計相關(guān)性并不能提供對模式內(nèi)部的深層理解。概率圖模型是最經(jīng)典的統(tǒng)計結(jié)構(gòu)模型,它通過對多隨機變量聯(lián)合分布的建模能夠?qū)ψ兞块g的各種關(guān)系進行表示、推理和學(xué)習(xí)。典型的概率圖模型,如條件隨機場、隱馬爾可夫模型,在計算機視覺、語音識別、自然語言處理等領(lǐng)域有著廣泛應(yīng)用。深度學(xué)習(xí)興起后,圖神經(jīng)網(wǎng)絡(luò)逐漸成為一類新的結(jié)構(gòu)學(xué)習(xí)方法。相比概率圖模型,圖神經(jīng)網(wǎng)絡(luò)在計算效率、靈活性、關(guān)系學(xué)習(xí)能力方面都具有優(yōu)勢。


10、安全強化的模式識別理論與方法

現(xiàn)有的統(tǒng)計模式識別主要以貝葉斯決策作為其理論依據(jù)。在該框架下所演化出的學(xué)習(xí)模型以平均(經(jīng)驗或期望)最小錯誤率或最小風(fēng)險為學(xué)習(xí)目標,由此所建立的模式識別系統(tǒng)難以與安全性和可靠性量化評估策略進行有效關(guān)聯(lián)。然而,在諸多現(xiàn)實應(yīng)用中(如公共安全、國家安全、軍事決策、臨床醫(yī)學(xué)等領(lǐng)域),不僅要求模式識別系統(tǒng)具有高精度的模式分類能力,并且要求其作出的決策是可行的,同時要求其系統(tǒng)具有可對抗性、抗侵入性和可靠性。因此,發(fā)展安全模式識別理論與方法具有十分重要的意義。

發(fā)展安全強化的模式識別理論與方法,涉及到諸多新的模式分析問題。首先,模式描述方法應(yīng)具有魯棒性和安全性。其次,模式識別系統(tǒng)應(yīng)具有對抗無關(guān)模式的能力,發(fā)現(xiàn)偽模式和篡改模式的鑒別能力和抗侵入能力。另外,模式識別系統(tǒng)應(yīng)具有對單模態(tài)和多模態(tài)聯(lián)合或獨立適應(yīng)能力。因此,上述多個技術(shù)因素綜合和應(yīng)用環(huán)境的復(fù)雜性導(dǎo)致安全模式識別是一個十分復(fù)雜的問題。

在研究途徑上,首先,應(yīng)提高模式描述的魯棒性,發(fā)展具有幾何變換、非線性變換不變性、跨模態(tài)不變性、跨模態(tài)距離度量魯棒學(xué)習(xí)方法和擾動分析方法;其次,可采用生成對抗網(wǎng)絡(luò)提升模式識別系統(tǒng)的可對抗性和可抗侵入性,提高模式演變軌跡的描述能力;另外,研究模式識別方法的安全性驗證體系,發(fā)展模式識別因果連鎖理論、能量意外轉(zhuǎn)移理論、變化-失誤理論,提升模式識別方法與系統(tǒng)的安全性和可靠性。


權(quán)威|模式識別基礎(chǔ)未來重要研究問題的評論 (共 條)

分享到微博請遵守國家法律
定西市| 额济纳旗| 德格县| 沙田区| 永清县| 合江县| 哈密市| 河间市| 襄城县| 沿河| 蕲春县| 滨海县| 军事| 广宁县| 怀来县| 巴彦县| 广东省| 京山县| 广西| 浠水县| 康乐县| 杂多县| 呼伦贝尔市| 清河县| 玉龙| 县级市| 阳信县| 拉萨市| 沙河市| 红河县| 华阴市| 皋兰县| 台前县| 靖边县| 梁山县| 绍兴县| 华坪县| 吕梁市| 石柱| 德阳市| 哈尔滨市|