最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【運(yùn)籌OR帷幄】大話“人工智能、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)”--綜述

2020-11-04 07:01 作者:留德華叫獸  | 我要投稿

作者?留德華叫獸?美國(guó)Clemson應(yīng)用數(shù)學(xué)|運(yùn)籌學(xué)碩士、博士候選人,德國(guó)海德堡大學(xué)數(shù)學(xué)|組合優(yōu)化博士,博士研究方向?yàn)殡x散優(yōu)化在計(jì)算機(jī)視覺(jué)的交叉應(yīng)用。讀博期間于意大利博洛尼亞大學(xué)和法國(guó)巴黎綜合理工訪問(wèn)10個(gè)月,意大利IBM Cplex實(shí)習(xí)半年。學(xué)術(shù)不精,轉(zhuǎn)而致力于科普,讀博期間創(chuàng)辦?運(yùn)籌OR帷幄?(運(yùn)籌學(xué)|數(shù)據(jù)科學(xué)|人工智能社區(qū))以及?DIY飛躍計(jì)劃?(全球1000+海外碩博留學(xué)咨詢師)倆個(gè)知乎機(jī)構(gòu)號(hào)|微信公眾號(hào)|頭條號(hào)|社區(qū),并邀請(qǐng)學(xué)界|業(yè)界大佬聯(lián)合舉辦了10+知乎 Live?,F(xiàn)于德國(guó)某汽車集團(tuán)無(wú)人駕駛部門機(jī)器學(xué)習(xí)組,擔(dān)任計(jì)算機(jī)視覺(jué)研發(fā)工程師。?本文于2017年4月首發(fā)于?@運(yùn)籌OR帷幄 知乎專欄和公眾號(hào),并收錄于知乎日?qǐng)?bào)文章:『AI 領(lǐng)域的名詞好難懂,這篇文章可以讓你全面了解』。

編者按:寫(xiě)作此文當(dāng)年花了我10小時(shí),或許很多內(nèi)容現(xiàn)在看來(lái)顯得有些“稚嫩”,但決定予以保留,也算是我對(duì)讀博那段青春的追憶吧:)


本文包含4個(gè)帶圖實(shí)例,目的是從宏觀上剖析和理解這三個(gè)術(shù)語(yǔ),適合剛?cè)腴T人工智能(縮寫(xiě)AI)、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)(縮寫(xiě)人數(shù)機(jī))的愛(ài)好者,完整閱讀可能需要20分鐘。由于我的研究領(lǐng)域僅限于機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué),淺談其他領(lǐng)域的時(shí)候還勞駕該領(lǐng)域的大牛拍磚。

前言:學(xué)科交叉乃大勢(shì)所趨,新興學(xué)科應(yīng)市場(chǎng)需求孕育而生。人數(shù)機(jī),便產(chǎn)生在這樣的時(shí)代背景下。什么,你所在的學(xué)校至今還沒(méi)開(kāi)設(shè)相關(guān)專業(yè)?不必驚慌,老牌資本主義國(guó)家德國(guó)同樣如此。但是,學(xué)好微積分、線代、優(yōu)化、統(tǒng)計(jì)、編程,你和人數(shù)機(jī)可能只是倆三堂專業(yè)課的距離。本文旨在從宏觀的視角剖析人數(shù)機(jī),具體到某個(gè)學(xué)科或問(wèn)題,請(qǐng)參見(jiàn)文中給出的鏈接。

機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí),這些“學(xué)習(xí)”都是什么鬼?3 中的回答或許會(huì)讓你大跌眼鏡。


本文提綱:

1,人數(shù)機(jī)的概念 2,AI的應(yīng)用領(lǐng)域 3,AI的解法-機(jī)器學(xué)習(xí) 4,機(jī)器學(xué)習(xí)底層的模型-運(yùn)籌、統(tǒng)計(jì) 5,AI的算法 6,強(qiáng)AI vs 弱AI 7,AI學(xué)術(shù)界、工業(yè)界的全球排名

--------------------------------------------------------------------

書(shū)歸正傳,我們一起逐點(diǎn)擊破人數(shù)機(jī)這個(gè)大泡泡,力求以最通俗易懂的語(yǔ)言還原他們高大上外表下弱小的真面目(數(shù)學(xué)模型+算法)。

------------------------------------------------------------------------

首先我把最近火起來(lái)的,關(guān)于人數(shù)機(jī)最熱門的幾個(gè)術(shù)語(yǔ)都列出來(lái),因?yàn)椴恢浪鼈兊脑?,你可能已?jīng)OUT了。

人工智能、數(shù)據(jù)科學(xué)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、增強(qiáng)學(xué)習(xí)、(無(wú))監(jiān)督學(xué)習(xí)、數(shù)據(jù)挖掘、文本挖掘、模式識(shí)別、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、GPU計(jì)算、并行計(jì)算、物聯(lián)網(wǎng)、工業(yè)4.0、智能供應(yīng)鏈、智能xx、商業(yè)智能、xx智能、圖像處理、自動(dòng)駕駛、統(tǒng)計(jì)推斷、(凸)優(yōu)化、K-means算法、Ford-Fulkerson算法等等。(歡迎評(píng)論區(qū)補(bǔ)充“火”的術(shù)語(yǔ))

下文我嘗試把這些術(shù)語(yǔ)按照概念、應(yīng)用、模型、方法、算法來(lái)進(jìn)行分類。


1,概念--人工智能(Artificial Intelligence)、數(shù)據(jù)科學(xué)(Data Science)、大數(shù)據(jù)(Big Data)

這三個(gè)術(shù)語(yǔ)最大,放在第一個(gè)說(shuō)--他們屬于概念。

簡(jiǎn)單地說(shuō),計(jì)算機(jī)能像人一樣思考并自動(dòng)處理任務(wù),就可以稱為人工智能,即教計(jì)算機(jī)完成人想完成的復(fù)雜的或具有高度重復(fù)性的任務(wù)。(這里需要注意計(jì)算機(jī)能理解的只是數(shù)據(jù),包括向量和矩陣)

從這個(gè)概念出發(fā),那么計(jì)算機(jī)從發(fā)明至今,可以說(shuō)就頂著“人工智能”的帽子了。比如我們學(xué)習(xí)任何一門計(jì)算語(yǔ)言的循環(huán)語(yǔ)句,就很好地服務(wù)于這個(gè)宗旨。你寫(xiě)一個(gè)for i=1..100,就等于讓計(jì)算機(jī)給你重復(fù)做了100遍活。還嫌不夠多?把100改成1個(gè)億吧。讓(“教”)電腦給你干活,這就是人工智能。

由于人工智能“教”計(jì)算機(jī)處理的,通常都是很大的數(shù)據(jù)。例如圖像處理,對(duì)于計(jì)算機(jī)來(lái)說(shuō),一張1000*1000的圖片在它看來(lái)只是100萬(wàn)個(gè)像素(灰度圖是100萬(wàn)個(gè)數(shù)字,RGB圖是100萬(wàn)*3的一個(gè)向量)。

因此數(shù)據(jù)科學(xué)、大數(shù)據(jù)也屬于人工智能概念的范疇,它們和人工智能一樣,僅僅是被炒起來(lái)的“術(shù)語(yǔ)”。而理解上面三段話,你就擁有了和小白吹牛的資本。

這些行業(yè)到底有多熱,看看薪資就能略知一二。

再舉個(gè)比循環(huán)語(yǔ)句稍稍復(fù)雜點(diǎn)的例子:預(yù)測(cè)(Forecasting、Prediction)。

給你一堆點(diǎn)(x_i,y_i),人眼一看,根據(jù)數(shù)據(jù)以往的趨勢(shì),下一個(gè)點(diǎn)x_n的y坐標(biāo)--y_n應(yīng)該出現(xiàn)在箭頭所指的地方。但是如果有1000堆類似數(shù)據(jù)等你預(yù)測(cè)呢?你需要1000個(gè)人來(lái)描這個(gè)點(diǎn)么?NO,你只需要教會(huì)計(jì)算機(jī)如何根據(jù)x_n預(yù)測(cè)出y_n的值。--很簡(jiǎn)單,學(xué)過(guò)統(tǒng)計(jì)的應(yīng)該都知道線性回歸(Linear Regression),用最小二乘法根據(jù)以往的數(shù)據(jù)(x_i,y_i)算出線性系數(shù)b_0和b_1,那么預(yù)測(cè)函數(shù)y=b_0+b_1*x,電腦就可以根據(jù)這個(gè)公式來(lái)預(yù)測(cè)后面所有的y值。當(dāng)然有進(jìn)階版的分段線性回歸(piecewise linear fitting),歡迎聽(tīng)下回分解。



2,應(yīng)用--模式識(shí)別(Pattern Recognition)、計(jì)算機(jī)視覺(jué)(Computer Vision)、自然語(yǔ)言處理(Natural Language Processing)、數(shù)據(jù)挖掘(Data Mining)、物聯(lián)網(wǎng)(Intenet of Things)、商業(yè)智能(Business Inteligence)、自動(dòng)駕駛(Auto Driving)、云計(jì)算(Cloud Computing)、虛擬增強(qiáng)現(xiàn)實(shí)(Virtual Augmented Reality)等

這些都屬于人工智能和大數(shù)據(jù)的應(yīng)用場(chǎng)景。

模式識(shí)別:把一堆雜亂無(wú)章的數(shù)據(jù)或像素(圖像)里深藏的“模式”或規(guī)則用計(jì)算機(jī)自動(dòng)識(shí)別出來(lái)。

計(jì)算機(jī)視覺(jué):“教”計(jì)算機(jī)像人一樣理解圖像或視頻,并作出解釋(例如分割、追蹤、分類等)。

自然語(yǔ)言處理-語(yǔ)音識(shí)別:同樣的,計(jì)算機(jī)看待人說(shuō)的話只是一段段音頻信號(hào)(signal),或者更底層些,只是一個(gè)x坐標(biāo)為時(shí)間t的二維數(shù)據(jù)。如何把電信號(hào)翻譯成文字(text),需要人來(lái)“教”它。

數(shù)據(jù)挖掘:從一大堆數(shù)據(jù)里挖掘出你想要的有用的信息。怎么樣,是不是和模式識(shí)別有點(diǎn)異曲同工之妙?不過(guò)其主要數(shù)據(jù)對(duì)象是數(shù)據(jù)庫(kù)(Database),類似的還有文本挖掘(text mining)。

物聯(lián)網(wǎng):把所有東西(例如家電)都聯(lián)網(wǎng),并實(shí)時(shí)保持?jǐn)?shù)據(jù)的連通,然后計(jì)算機(jī)處理這些數(shù)據(jù)。例如根據(jù)主人的生活習(xí)性自動(dòng)開(kāi)關(guān)暖氣。

商業(yè)智能:人工智能應(yīng)用在商業(yè)大數(shù)據(jù)領(lǐng)域。例如銀行欺詐性交易的監(jiān)測(cè)。

自動(dòng)駕駛:顧名思義,內(nèi)置在汽車甚至設(shè)置在云端的計(jì)算機(jī)自動(dòng)給你開(kāi)車。利用的是計(jì)算機(jī)處理汽車上的攝像頭實(shí)時(shí)產(chǎn)生的圖片信息,以及雷達(dá)產(chǎn)生的信號(hào)。

云計(jì)算:把計(jì)算任務(wù)傳送到“云端”,得出結(jié)果后再傳送回來(lái)。云端可能是一個(gè)大的計(jì)算機(jī)集群(Cluster),難點(diǎn)在于如何協(xié)同CPU和GPU。

虛擬、增強(qiáng)現(xiàn)實(shí)(VR、AR):VR眼鏡應(yīng)該都體驗(yàn)過(guò)吧?未來(lái)的趨勢(shì),3D電影演唱會(huì)等,足不出戶體驗(yàn)現(xiàn)場(chǎng)感。Pokemon Go是AR最好的例子,使虛擬和現(xiàn)實(shí)混合在一起。倆者的核心技術(shù)都在計(jì)算機(jī)視覺(jué)里,包括校準(zhǔn)、3D重建、識(shí)別、追蹤等等。

通過(guò)以上九個(gè)術(shù)語(yǔ)的翻譯,相信媽媽再也不用擔(dān)心我被“概念”的炒作蒙蔽雙眼了。

再舉個(gè)例子:模式識(shí)別(Pattern Recognition)里的圖像分割(Image Segmentation)。

給你一張圖片,你自然知道描出圖里所有物體的輪廓,把該圖分割成了幾塊,該圖的“模式”就被識(shí)別出來(lái)了。但是給你100,1000張圖呢?你還有耐心一張張用手描輪廓?這時(shí)候你需要教計(jì)算機(jī)如何畫(huà)這個(gè)輪廓,并且不僅僅限于幾張圖,這個(gè)模型或算法必須適用于絕大多數(shù)的圖片。這就是模式識(shí)別和圖像分割。



3,方法--機(jī)器學(xué)習(xí)(Machine Learning)

前面討論了概念和應(yīng)用,那么用什么方法來(lái)實(shí)現(xiàn)2中的應(yīng)用呢?機(jī)器學(xué)習(xí)便是最有力的方法之一。把機(jī)器學(xué)習(xí)單獨(dú)放在方法里,是為了體現(xiàn)其重要性。雖然它是一門建立在統(tǒng)計(jì)和優(yōu)化上的新興學(xué)科,但是在人工智能、數(shù)據(jù)科學(xué)等領(lǐng)域,它絕對(duì)是核心課程中的核心。

機(jī)器學(xué)習(xí),顧名思義,教機(jī)器如何“學(xué)習(xí)”,或讓機(jī)器自己“學(xué)習(xí)”。因此從字面上看就天然的屬于人工智能范疇。“學(xué)習(xí)”這個(gè)看似高深的術(shù)語(yǔ),在1線性回歸的例子里,僅僅指求解(學(xué)習(xí))b0, b1這倆個(gè)系數(shù)。任何其他炒得火熱的“xx學(xué)習(xí)”,也只是求解一些參數(shù)-說(shuō)得都很好聽(tīng),僅此而已。

對(duì)于統(tǒng)計(jì)和運(yùn)籌學(xué)這倆門基礎(chǔ)學(xué)科來(lái)說(shuō),機(jī)器學(xué)習(xí)又是應(yīng)用(見(jiàn)下面四類問(wèn)題),因?yàn)樗罅康赜玫搅私y(tǒng)計(jì)的模型如馬爾可夫隨機(jī)場(chǎng)(Markov Random Field--MRF),和其他學(xué)科的模型,如偏微分方程(變分法等),最后通常轉(zhuǎn)化成一個(gè)能量函數(shù)最小化的優(yōu)化問(wèn)題。

機(jī)器學(xué)習(xí)的核心在于建模和算法,學(xué)習(xí)得到的參數(shù)只是一個(gè)結(jié)果(見(jiàn)5)。

機(jī)器學(xué)習(xí)里最重要的四類問(wèn)題(按學(xué)習(xí)的結(jié)果分類):

預(yù)測(cè)(Prediction)--可以用如回歸(Regression)等模型。

聚類(Clustering)--如K-means方法。

分類(Classification)--如支持向量機(jī)法(Support Vector Machine, SVM)。

降維(Dimensional reduction)--如主成份分析法(Principal component analysis (PCA)--純矩陣運(yùn)算)。

前三個(gè)從字面意思就好理解,那么為什么要降維呢?因?yàn)橥ǔG闆r下,一個(gè)自變量x就是一個(gè)維度,機(jī)器學(xué)習(xí)中動(dòng)不動(dòng)就幾百萬(wàn)維,運(yùn)算復(fù)雜度非常高。但是幾百萬(wàn)維度里,可能其中幾百維就包含了95%的信息。因此為了運(yùn)算效率,舍棄5%的信息,我們需要從幾百萬(wàn)維中找出這包含95%信息的維度。這就是降維問(wèn)題。

機(jī)器學(xué)習(xí)按學(xué)習(xí)方法的分類:

監(jiān)督學(xué)習(xí)(Supervised Learning,如深度學(xué)習(xí)),

無(wú)監(jiān)督學(xué)習(xí)(Un-supervised Learning,如聚類),

半監(jiān)督學(xué)習(xí)(Semi-supervised Learning),

強(qiáng)化學(xué)習(xí)(Reinforcement?Learning)。

這里不從晦澀的定義上深入展開(kāi),舉倆個(gè)例子或許效果更好。

郵件分類的例子:

郵件管理器中的垃圾郵件和非垃圾郵件的分類,就是一個(gè)典型的機(jī)器學(xué)習(xí)的分類問(wèn)題。這是一個(gè)有監(jiān)督的學(xué)習(xí)問(wèn)題(Supervised Learning),什么叫有監(jiān)督呢?計(jì)算機(jī)是在你的監(jiān)督(標(biāo)記)下進(jìn)行學(xué)習(xí)的。簡(jiǎn)單地說(shuō),新來(lái)一封郵件,你把他標(biāo)記為垃圾郵件,計(jì)算機(jī)就學(xué)習(xí)該郵件里有什么內(nèi)容才使得你標(biāo)記為“垃圾”;相反,你標(biāo)記為正常郵件,計(jì)算機(jī)也學(xué)習(xí)其中的內(nèi)容和垃圾郵件有何不同你才把它標(biāo)記為“正?!薄?梢园堰@倆個(gè)分類簡(jiǎn)單的看成"0"和“1”的分類,即二分問(wèn)題(Binary Classification)。并且,隨著你標(biāo)記越來(lái)越多,計(jì)算機(jī)學(xué)習(xí)到的規(guī)律也越來(lái)越多,新出現(xiàn)一封郵件標(biāo)記的正確率也會(huì)越來(lái)越高。

當(dāng)然分類可不止用在判別垃圾郵件,其他應(yīng)用例如銀行欺詐交易的判別(商業(yè)智能范疇),計(jì)算機(jī)視覺(jué)里給計(jì)算機(jī)一張圖片,分類為狗還是貓(著名的ImagNet,可是把圖片分成了2萬(wàn)多類)。等等。

前面講了監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)即在沒(méi)有人工標(biāo)記的情況下,計(jì)算機(jī)進(jìn)行預(yù)測(cè)、分類等工作。

再來(lái)一個(gè)例子--聚類(Clustering)--無(wú)監(jiān)督的學(xué)習(xí)

事先沒(méi)有對(duì)圖中的點(diǎn)進(jìn)行標(biāo)記類別,左圖在計(jì)算機(jī)看來(lái),僅僅是12個(gè)點(diǎn)(x,y坐標(biāo)),但是人眼可以判別它大致可以分為三類(這時(shí),123,321,132代表的都是相同的聚類,順序沒(méi)有關(guān)系)。如何教計(jì)算機(jī)把數(shù)據(jù)歸類呢?這就是聚類問(wèn)題。其中最經(jīng)典的算法叫K-means。


半監(jiān)督介于倆者之間,強(qiáng)化學(xué)習(xí)牽扯到更深的運(yùn)籌、隨機(jī)過(guò)程、博弈論基礎(chǔ),這里暫時(shí)不展開(kāi)。

機(jī)器學(xué)習(xí)作為新創(chuàng)的學(xué)科或方法,被廣泛地應(yīng)用于人工智能和數(shù)據(jù)科學(xué)等問(wèn)題的求解。按照行業(yè)的說(shuō)法,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí)等模型都屬于機(jī)器學(xué)習(xí)的范疇。

本節(jié)最后出一個(gè)思考題,1中的線性回歸屬于監(jiān)督還是無(wú)監(jiān)督學(xué)習(xí)呢?



4,模型--運(yùn)籌學(xué)(Operations Research(O.R.))、凸優(yōu)化(Convex Optimization)、統(tǒng)計(jì)分析(Statistical Analysis)、神經(jīng)網(wǎng)絡(luò)(Neural Network)、深度學(xué)習(xí)(Deep Learning)

把它們歸到一類,因?yàn)樗麄兌际且环N解決實(shí)際問(wèn)題的模型。例如解決圖像分割問(wèn)題,你可以用統(tǒng)計(jì)的模型(如馬爾可夫隨機(jī)場(chǎng)),也可以用神經(jīng)網(wǎng)絡(luò)模型,當(dāng)然也可以用深度學(xué)習(xí),即卷積神經(jīng)網(wǎng)絡(luò)模型(Convolutional Neural Networks)。

統(tǒng)計(jì)和運(yùn)籌作為有深厚淵源的學(xué)科,這倆個(gè)名詞本身就能成為一個(gè)專業(yè),其下又有無(wú)數(shù)的分支和方向。他們本身研究的對(duì)象就是大數(shù)據(jù),因此和人工智能、數(shù)據(jù)科學(xué)有著天然的淵源。最近因?yàn)槿藬?shù)機(jī)的興起,統(tǒng)計(jì)、凸優(yōu)化模型也再度熱了起來(lái)(特別是概率圖模型)。相信他們和人工智能會(huì)起到相輔相成、互相促進(jìn)的效果。

神經(jīng)網(wǎng)絡(luò)(監(jiān)督學(xué)習(xí)門下,需要有標(biāo)簽的數(shù)據(jù))和深度學(xué)習(xí),相比前倆個(gè)龐大學(xué)科,充其量只能算一個(gè)基于圖論(Graph Theory)的模型。神經(jīng)網(wǎng)絡(luò)也是由來(lái)已久,剛開(kāi)始的全連接神經(jīng)網(wǎng)絡(luò)(Fully Connected Neural Network)以及多層神經(jīng)網(wǎng)絡(luò),都是傳統(tǒng)神經(jīng)網(wǎng)絡(luò),由于參數(shù)多計(jì)算(學(xué)習(xí)這些參數(shù))的復(fù)雜度很高,因此實(shí)用性不強(qiáng)沒(méi)有得到足夠的重視。直到近些年卷積神經(jīng)網(wǎng)絡(luò)的橫空出世,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network)已基本秒殺其他一切傳統(tǒng)方法,缺點(diǎn)是需要有標(biāo)簽的龐大的數(shù)據(jù)集以及訓(xùn)練時(shí)間過(guò)長(zhǎng)(計(jì)算機(jī)資源)。

當(dāng)然人工智能,特別是深度學(xué)習(xí)有過(guò)熱的趨勢(shì),導(dǎo)致炒概念這樣不良風(fēng)氣的產(chǎn)生,甚至有偷換概念之嫌。下面鏈接乃計(jì)算機(jī)視覺(jué)領(lǐng)軍人物之一加州大學(xué)洛杉磯分校UCLA統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授Song-Chun Zhu的訪談錄,給深度學(xué)習(xí)潑一點(diǎn)冷水。
初探計(jì)算機(jī)視覺(jué)的三個(gè)源頭、兼談人工智能|正本清源

由于O.R.出身,把運(yùn)籌放在最后一點(diǎn)--樓主必須正本清源O.R.的在人工智能中扮演的重要角色。

在機(jī)器學(xué)習(xí)里我已提到,這里再?gòu)?qiáng)調(diào)一遍,幾乎所有的人工智能問(wèn)題最后會(huì)歸結(jié)為求解一個(gè)優(yōu)化問(wèn)題(Optimization Problem)。而研究如何求解優(yōu)化問(wèn)題的學(xué)科,正是運(yùn)籌學(xué)。

運(yùn)籌學(xué)的作用,不僅限于求解其他模型(如統(tǒng)計(jì))最后產(chǎn)生的優(yōu)化問(wèn)題,也可以作為模型本身(優(yōu)化模型)來(lái)解決人工智能問(wèn)題。

優(yōu)化模型包含目標(biāo)函數(shù)和約束條件。優(yōu)化問(wèn)題就是求解滿足約束條件的情況下使得目標(biāo)函數(shù)最優(yōu)的解。敬請(qǐng)讀者們關(guān)注我的運(yùn)籌專欄,聽(tīng)我下回仔細(xì)分解。這里只提一點(diǎn),大家所熟知的支持向量機(jī),其實(shí)完全可以看作運(yùn)籌中的二次規(guī)劃(Quadratic Programming)問(wèn)題。

[運(yùn)籌帷幄]大數(shù)據(jù)和人工智能時(shí)代下的運(yùn)籌學(xué) - 知乎專欄

最后嘮叨一句樓主的科研方向,就是用運(yùn)籌學(xué)中的混合整數(shù)規(guī)劃(Mixed Integer Nonlinear Programming)模型建模,解決人工智能中的應(yīng)用,如圖像分割。

由于版面有限,不再具體展開(kāi)。

關(guān)于運(yùn)籌學(xué)你所要知道的幾乎一切,都在下面:

【運(yùn)籌OR帷幄】人工智能的“引擎”--運(yùn)籌學(xué),一門建模、優(yōu)化、決策的科學(xué)


5,算法--K-means,F(xiàn)ord-Fulkerson

做過(guò)人工智能實(shí)際/科研項(xiàng)目的人知道,解決一個(gè)實(shí)際問(wèn)題就像小時(shí)候解應(yīng)用題,從假設(shè)未知數(shù)開(kāi)始(已是模型的范疇),一般步驟便是數(shù)學(xué)建模-設(shè)計(jì)算法-編程實(shí)現(xiàn),并以此反復(fù)推敲。因此為了文章的完整性,加上算法這一節(jié)。

K-means在3的聚類問(wèn)題中已提到,這里重點(diǎn)講講最大流以及算法和模型之間的關(guān)系。


Ford-Fulkerson算法屬于運(yùn)籌學(xué)或圖論-網(wǎng)絡(luò)流問(wèn)題(Network Flow Problem)中一個(gè)非常經(jīng)典的問(wèn)題-最大流問(wèn)題(Max Flow Problem)的算法,它在圖像處理特別是圖像分割中,有著極為重要的應(yīng)用。

如圖:把一張3*3像素的圖像看作3*3個(gè)點(diǎn)的圖(圖論術(shù)語(yǔ)里的圖),并且把上下左右相鄰的點(diǎn)用邊連接起來(lái),組成edge(圖論里的邊)。這么一來(lái),圖像分割問(wèn)題就完美地轉(zhuǎn)換成了一個(gè)基于圖論(或者network flow)的優(yōu)化問(wèn)題。如下圖,九個(gè)像素的圖被最大流算法用綠線分割成了倆個(gè)部分(segment),綠線即為最小分割(min cut),這里s點(diǎn)和t點(diǎn)是為了構(gòu)建網(wǎng)絡(luò)流模型額外增加的倆個(gè)點(diǎn)(terminal node)。


這里強(qiáng)調(diào)下數(shù)學(xué)建模的重要性,為何要數(shù)學(xué)建模呢?的確很多naive的算法完全不需要建立在數(shù)學(xué)模型之上,比如clustering里面經(jīng)典的EM算法,是一個(gè)iterative method,基本一眼就能看出算法的思路然后編程實(shí)現(xiàn)。那么基于數(shù)學(xué)模型上的算法有何妙處呢?答案是一個(gè)好的數(shù)學(xué)模型,往往是被研究了幾十甚至幾百年的學(xué)科,比如圖論,很多性質(zhì)都已經(jīng)被研究得很透徹可以直接使用?;氐缴厦娴睦樱医⒌倪@個(gè)網(wǎng)絡(luò)流的模型,是一個(gè)被研究了很久的模型,因此我可以直接使用其很多已知的好定理或算法來(lái)服務(wù)我的問(wèn)題,比如這里基于里max flow的Ford-Fulkerson算法,如果能在其基礎(chǔ)上做改進(jìn),等于站在巨人的肩膀。因此這就是數(shù)學(xué)建模的重要之處。

往往同一個(gè)問(wèn)題,從不同的角度去看可以有千百種數(shù)學(xué)建模方法,而不同的數(shù)學(xué)模型差別往往巨大。而數(shù)學(xué)建模又是解決一個(gè)實(shí)際問(wèn)題的第一步,在這基礎(chǔ)上才考慮算法和數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)。因此,數(shù)學(xué)模型和背后的數(shù)學(xué)基礎(chǔ)在我看來(lái)是重中之重,也是我推薦學(xué)習(xí)的課程的核心。當(dāng)然了,計(jì)算機(jī)系出生的朋友,數(shù)學(xué)這個(gè)層面學(xué)習(xí)得不是很深,可以偏向于算法的設(shè)計(jì)和實(shí)現(xiàn),它們也是重要的。



6,強(qiáng)人工智能(Strong AI或 Artificial General Intelligence) vs 弱人工智能(Applied AI,narrow AI,weak AI)

上面嘮叨了那么多,說(shuō)來(lái)說(shuō)去都是建立在以二進(jìn)制為機(jī)理的圖靈計(jì)算機(jī)上的“弱人工智能”,即計(jì)算機(jī)需要人去“教”它怎么做。而人工智能、神經(jīng)網(wǎng)絡(luò)的最終目的,是模仿人腦的機(jī)理和組成(腦神經(jīng)元、神經(jīng)網(wǎng)絡(luò)),讓計(jì)算機(jī)能像人一樣具有思維、自主意識(shí),自行學(xué)習(xí)和決策,稱為“強(qiáng)人工智能”。

這里不得不提到母校德國(guó)海德堡大學(xué)物理系和英國(guó)曼徹斯特大學(xué)牽頭的歐盟“人腦計(jì)劃”,其最終目的就是打破計(jì)算機(jī)的二進(jìn)制機(jī)理,模仿人腦神經(jīng)元(Neuron)放電(spark)的隨機(jī)性,打造出一臺(tái)能像人腦一樣“思考”的計(jì)算機(jī)。從此計(jì)算機(jī)不再二進(jìn)制(0或1),而是可以取[0,1]間的隨機(jī)值。另外工業(yè)界如IBM也在打造此類計(jì)算機(jī)。

此機(jī)一旦面世,以往一切慣例將被打破,“強(qiáng)人工智能”的新紀(jì)元或許會(huì)隨之到來(lái)。



7,人工智能學(xué)術(shù)界、工業(yè)界全球排名

按照本文作者的尿性,最后不出意外會(huì)給個(gè)排名。今天也不例外,排名不分先后。

學(xué)術(shù)界:人工智能等新興學(xué)科通常設(shè)置在計(jì)算機(jī)系,此處可參考CS排名

美國(guó)憑借教授數(shù)量一如既往地排在前頭:CMU、斯坦福、MIT、UC伯克利、哈佛、普林斯頓、康奈爾、UIUC等等

英國(guó)倫敦也是AI重地:牛津、劍橋、帝國(guó)理工再加愛(ài)丁堡,還有UCL

加拿大可謂深度學(xué)習(xí)孵化地,DL三杰都和楓葉國(guó)國(guó)有淵源:多倫多、滑鐵盧、蒙特利爾、麥克吉爾大學(xué)、英屬哥倫比亞大學(xué)UBC

歐洲因教職稀少排名自然弱,瑞士倆校拔得頭籌,ETH、EPFL,海德堡HCI五教授之陣容理應(yīng)占得一席--哦,原來(lái)三個(gè)隸屬物理系。

日本東大山河日下,中國(guó)清華異軍突起,姚班功不可沒(méi)。

工業(yè)界:憑借著財(cái)大氣粗吸引人才,以及計(jì)算能力和數(shù)據(jù)量的優(yōu)勢(shì),工業(yè)界在AI領(lǐng)域或許已經(jīng)趕超學(xué)術(shù)界

美國(guó)自然是全球AI中心(硅谷、西雅圖、波士頓、紐約):Google剛請(qǐng)來(lái)了斯坦福李飛飛(sabbatical)以及多大的Geoffrey Hinton,F(xiàn)acebook有NYU的Yann LeCun, 微軟、IBM研究院早已名聲在外,Amazon云計(jì)算一家獨(dú)大,還有Uber、Airbnb、LinkedIn等新貴互聯(lián)網(wǎng)公司的助力。

英國(guó)倫敦:DeepMind被Google收購(gòu),Google、微軟等在倫敦都設(shè)有研究院。

歐洲:IBM、Google在蘇黎世和慕尼黑都有研究院,擴(kuò)招中;amazon在盧森堡有研究院;德國(guó)傳統(tǒng)公司,如拜耳、博世、西門子等紛紛發(fā)力AI建立研究院,寶馬奔馳奧迪等車場(chǎng)也投注自動(dòng)駕駛。最后說(shuō)說(shuō)海德堡,SAP總部所在地,還有NEC、ABB等歐洲研究院。

加拿大:加拿大政府在多倫多剛成立人工智能研究院-Vector Institute?,G Hinton任首席科學(xué)顧問(wèn),Google在蒙特利爾準(zhǔn)備成立新研究院,可見(jiàn)Yoshua Bengio領(lǐng)導(dǎo)的深度學(xué)習(xí)研究院名聲在外。

中國(guó):北有科技之都北京,得天獨(dú)厚的優(yōu)勢(shì),微軟亞洲研究院培養(yǎng)起了中國(guó)一大批AI大佬;百度、京東以及地平線機(jī)器人、滴滴等一大批互聯(lián)網(wǎng)新貴開(kāi)始嶄露頭角。南有深圳,華為、騰訊、大疆、順豐等也毫不示弱。


到此,相信讀者們可以更有自信地吹“人工智能、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)”的牛逼了。

【運(yùn)籌OR帷幄】大話“人工智能、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)”--綜述的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
砚山县| 大埔县| 柘城县| 手机| 旬阳县| 宁晋县| 来凤县| 六枝特区| 东宁县| 青浦区| 卢湾区| 嵊泗县| 玉林市| 临江市| 安福县| 丰原市| 探索| 科技| 普定县| 土默特右旗| 绥滨县| 施甸县| 保定市| 类乌齐县| 四子王旗| 盐源县| 仙桃市| 贵港市| 安仁县| 封开县| 吴忠市| 宁陵县| 定远县| 银川市| 历史| 家居| 黄平县| 和顺县| 迁安市| 凉城县| 梨树县|