智能時代操作系統(tǒng)之爭:中國軍團正在崛起,仍需頭雁“領(lǐng)隊”

天元、MindSpore、計圖、OneFlow……一連串國產(chǎn)開源深度學(xué)習(xí)框架的相繼問世,讓中國的開源AI迎來了遲到的“暖春”。
8月15日的“2019中國電子學(xué)會科學(xué)技術(shù)獎”頒獎儀式上,百度自主研發(fā)的“飛槳產(chǎn)業(yè)級深度學(xué)習(xí)技術(shù)與平臺”,更是榮獲2019年度中國電子學(xué)會科學(xué)技術(shù)獎科技進步一等獎。
國產(chǎn)開源深度學(xué)習(xí)框架開始得到行業(yè)的認(rèn)可。
早在2016年的時候,國內(nèi)的開源AI還只有百度飛槳一股力量,不少開發(fā)者被迫在Google的TensorFlow和Facebook的PyTorch之間做選擇。特別是在“斷供華為”的陰影下,深度學(xué)習(xí)框架是否會被“斷奶”,一度成為外界熱議的焦點。在過度依賴國外開源框架造成的不確定中,“框架自由”成了國內(nèi)不少開發(fā)者的夙愿。
2020年國產(chǎn)的深度學(xué)習(xí)框架逐漸填補了空白,可人工智能的“開源之戰(zhàn)”也愈演愈烈,早已上升為爭奪人工智能話語權(quán)的較量。中國需要的不僅是越來越多的參與者,還需要在世界舞臺上拼刀法的撒手锏。
01 開源的自由與國界
關(guān)于深度學(xué)習(xí)框架的價值,還要從算法開始說起。
在人工智能的三要素中,如果說數(shù)據(jù)是燃料、算力是發(fā)動機,算法就是催化劑,直接決定著發(fā)動機對燃料的利用率,也是深度學(xué)習(xí)研究中的基本功。在深度學(xué)習(xí)的初級階段,每位研究者都要花大量的時間寫算法。
深度學(xué)習(xí)框架的出現(xiàn),大大降低了開發(fā)者入門的門檻,不再需要從零開始寫一套機器學(xué)習(xí)的算法,可以直接使用框架中已有的模型進行組裝,或者在已有模型的基礎(chǔ)上訓(xùn)練自己的模型,讓算法的規(guī)?;a(chǎn)成為可能。
打一個比方的話:優(yōu)秀的深度學(xué)習(xí)框架給開發(fā)者的價值,可以讓開發(fā)者在項目訓(xùn)練中告別手工時代,就像拖拉機之于農(nóng)民,原先需要一鋤頭接著一鋤頭平整土地,自動化的拖拉機可以讓一個人完成原來數(shù)十人的工作。
其實業(yè)界對深度學(xué)習(xí)框架的價值早已形成了共識,爭議在于“開源”二字。無論是Google的TensorFlow,還是Facebook的PyTorch,無不披著開源的外衣,在“開源自由”的互聯(lián)網(wǎng)世界里,中國是否有必要推崇所謂的“國產(chǎn)”?

長江商學(xué)院經(jīng)濟學(xué)教授、人工智能與制度研究中心主任許成鋼,曾經(jīng)分享過這樣一組數(shù)據(jù):中國關(guān)注人工智能開源軟件包的人數(shù)在2017年秋就超過了美國,但93%的中國研究者使用的是TensorFlow等美國企業(yè)提供的開源框架。
某種程度上說,這是一組相當(dāng)恐怖的數(shù)據(jù),芯片和開源框架分別代表了算力和算法,在芯片已經(jīng)被國外卡脖子的局面下,倘若繼續(xù)高度依賴國外的開源框架,算力和算法兩大基石都受制于人,等同于徹底把游戲規(guī)則的制定權(quán)交到了美國手中。一旦游戲規(guī)則掌握在別人手里,中國永遠都是缺少話語權(quán)的弱者。
況且中國并不缺少過度信奉開源的教訓(xùn),典型的例子就是華為。在美國政府的封殺下,谷歌雖然照舊向華為開源了AOSP項目,可配套的GMS服務(wù)卻把華為拒之門外,直接影響了華為手機在海外市場的銷量。
開源深度學(xué)習(xí)框架是否存在同樣的隱憂?可能在槍響之前,我們永遠都不知道下一個陷阱在哪里。
02 中國開源的冰與火
回到開源深度學(xué)習(xí)框架的話題上,在各種不確定風(fēng)險的作用下,勢必要燃起屬于中國的星星之火。
從淺的層面來說,深度學(xué)習(xí)框架的自立是避險的需要,連亞馬遜、蘋果、微軟等都在自主研發(fā)深度學(xué)習(xí)框架,避免被谷歌牽制的時候,中國的人工智能企業(yè)應(yīng)該有最基本的風(fēng)險意識,盡可能避免芯片產(chǎn)業(yè)的覆舟之戒。
進一步思考的話,創(chuàng)新通常不是靠砸錢、堆人就能發(fā)生的,最大的魅力還是創(chuàng)新的偶然性,可能發(fā)生在少數(shù)人身上。如果中國有越來越多的開發(fā)者、越開越多的企業(yè)參與到深度學(xué)習(xí)框架中來,創(chuàng)新的概率也將被提高。
但同時需要理性認(rèn)識的是,雖然深度學(xué)習(xí)框架關(guān)乎人工智能賽道的制高點,可本質(zhì)上還是一款“軟件”,它的難度并不在開發(fā)層面——伯克利、清華等一些頂級高校的博士生,往往也能開發(fā)出不錯的深度學(xué)習(xí)框架。
開源深度學(xué)習(xí)框架的重心在于產(chǎn)業(yè)化和長期維護,能否建立起一套完整的開源體系,進入門檻遠沒有想象中低。
一個典型的例子,美國大大小小的開源深度學(xué)習(xí)框架有幾十個,最終脫穎而出的卻是谷歌、亞馬遜、Facebook等巨頭,除了自身過硬的實力外,還在于巨頭們有充足資金進行技術(shù)、團隊、社區(qū)等方面的建設(shè)。一些剛剛起步的創(chuàng)業(yè)型公司,常常因為資金、技術(shù)、人才等方面的壓力而自縛手腳。
另一個層面來看,開源深度學(xué)習(xí)框架的用戶是開發(fā)者,所追求的是框架的易用性。在人們的固有認(rèn)知中,習(xí)慣傾向于信賴被大眾認(rèn)可的事物,在情感上更偏向于有巨頭背景的開源深度學(xué)習(xí)框架。即使一些初創(chuàng)企業(yè)可以提供有亮點的產(chǎn)品和服務(wù),開發(fā)者也會出于安全、穩(wěn)定等考量選擇搶先培養(yǎng)了用戶習(xí)慣的產(chǎn)品。
中國開源深度學(xué)習(xí)框架的行業(yè)現(xiàn)狀,也是如此。
一面是行業(yè)越來越熱鬧,來自清華大學(xué)計算機系圖形實驗室的計圖、國內(nèi)計算機視覺領(lǐng)域的獨角獸曠視推出的天元,再到創(chuàng)業(yè)公司一流科技打造的OneFlow,已然呈現(xiàn)出一副百花齊放的景象。與2015年前后的美國市場如出一轍,短時間中涌現(xiàn)出了大大小小、各種各樣的開源深度學(xué)習(xí)框架。
一面是開源生態(tài)的貧瘠,開源深度學(xué)習(xí)框架的核心價值在于生態(tài),需要向下對接芯片,向上支撐各種應(yīng)用,進而打造深度學(xué)習(xí)的標(biāo)準(zhǔn),也就需要持續(xù)的資源投入。華為的MindSpore還處于嬰兒狀態(tài),阿里、騰訊等互聯(lián)網(wǎng)巨頭沒有太大的聲音,深度介入上下游生態(tài)的還只有百度飛槳一家而已。
03 抓住產(chǎn)業(yè)的窗口期
然而在新基建的浪潮下,留給中國開源深度學(xué)習(xí)框架試錯的時間已經(jīng)不多。
諸如智慧醫(yī)療、智慧社區(qū)、智慧金融、智慧交通等市場需求的爆發(fā),正倒逼中國的開源AI形成一個完整的閉環(huán),加速人工智能的產(chǎn)業(yè)化。確切地說,深度學(xué)習(xí)框架已經(jīng)不僅僅是個開源的問題,還是一個商業(yè)化問題。
畢竟開源的目的就是在商業(yè)化的過程中,以一個結(jié)構(gòu)化的、開放的底層系統(tǒng),同時兼容存量市場和新增需求,降低客戶和合作伙伴的使用門檻,繼而為開發(fā)者提供快速實現(xiàn)商業(yè)化落地的路徑。
不少人嘗試對飛槳、天元、計圖等開源深度學(xué)習(xí)框架進行橫向?qū)Ρ?,試圖找到最有吸引力的產(chǎn)品?;蛟S并不需要復(fù)雜的對比,僅僅是這些開源框架在GitHub上的星級就能一較高下,百度飛槳的星數(shù)為12.5K,計圖、OneFlow和天元分別為1.6K、1.7K和2.5K,瀏覽量和服務(wù)端的代碼倉庫克隆數(shù)上,飛槳也遠遠領(lǐng)先其他國內(nèi)開源架構(gòu)。

除了在GitHub上的絕對優(yōu)勢,百度飛槳還是近乎唯一有著大規(guī)模應(yīng)用案例的一家:
百度飛槳的大規(guī)模分布式訓(xùn)練,被OPPO應(yīng)用于應(yīng)用商店、內(nèi)容推薦、負(fù)一屏、廣告等推薦場景,推薦場景效果提升了4%—5%;
普宙飛行器科技基于百度飛槳打造的一款無人機自主飛行平臺,實現(xiàn)了大范圍森林的自主巡邏、火情監(jiān)測、非法入侵、森林樹木砍伐監(jiān)測等功能;
山東信通引入飛槳的模型壓縮庫PaddleSlim和端側(cè)推理引擎Paddle Lite,打造出了一整套輸電智能巡檢方案……
之所以將不同的開源深度學(xué)習(xí)框架進行對比,并非是為了渲染“春秋戰(zhàn)國”的對抗氣氛,而是當(dāng)深度學(xué)習(xí)走向與產(chǎn)業(yè)結(jié)合的深水區(qū),深度學(xué)習(xí)框架逐漸在產(chǎn)業(yè)智能化進程中扮演核心角色的時候,應(yīng)該多探討一下生態(tài)該怎么建設(shè)。
中國的開源深度學(xué)習(xí)框架需要的不僅是百花齊放,在加速應(yīng)用落地、擺脫外部依賴的大背景下,還應(yīng)該鼓勵一枝爭春。
比如重點扶持一兩家開源深度學(xué)習(xí)框架,推動上下游產(chǎn)業(yè)的聯(lián)動,就像百度飛槳與華為麒麟芯片的深度合作,嘗試打造深度學(xué)習(xí)的中國標(biāo)準(zhǔn);
再比如推動不同開源框架的兼容,一些創(chuàng)業(yè)公司和大學(xué)實驗室不缺少天才程序員,也適合一些創(chuàng)新性的探索,而百度、華為等科技巨頭則擅長開源生態(tài)的建設(shè)。至少從PyTorch引入TensorFlow的可視化來看,谷歌和Facebook已經(jīng)開始了合作。
何況留待中國開源AI的核心挑戰(zhàn)在于能否抓住產(chǎn)業(yè)化的窗口期,不同平臺間合作的契機遠大于商業(yè)上的沖突。
04 寫在最后
百度CTO王海峰曾經(jīng)這樣形容深度學(xué)習(xí)框架的價值:
在智能時代,深度學(xué)習(xí)框架起到承上啟下的作用,下接芯片和大型計算機系統(tǒng),上承各種業(yè)務(wù)模型與行業(yè)應(yīng)用,是“智能時代的操作系統(tǒng)”。
假如中國無法在智能時代打造出屬于自己的“操作系統(tǒng)”,被Windows、安卓卡脖子的故事將再次上演。想要在這場全球性的AI爭奪戰(zhàn)中勝出,中國企業(yè)勢必要在基礎(chǔ)和關(guān)鍵技術(shù)上下苦功,避免在沙灘上起高樓。
幸運的是,在無數(shù)有識之士的呼聲奔走下,國內(nèi)也有了自己的開源深度學(xué)習(xí)框架“天團”,既有百度飛槳這樣在技術(shù)和應(yīng)用上全面領(lǐng)先的C位擔(dān)當(dāng),也有計圖、天元、MindSpore、OneFlow等新興勢力。
只是就目前來看,從開源深度學(xué)習(xí)框架的遍地開花,到整個開源AI生態(tài)的持續(xù)繁榮,再到中國人工智能應(yīng)用的行穩(wěn)致遠,還需要不同領(lǐng)域開發(fā)者的協(xié)同努力,以及在政策層面進行適當(dāng)?shù)囊龑?dǎo)。