ChatGPT火到汽車圈,毫末智行、集度紛紛進(jìn)場
作者 | 白日夢想家
編輯 | 于婷
ChatGPT的火爆,已經(jīng)席卷到了汽車領(lǐng)域。
眾多相關(guān)企業(yè)宣布紛紛布局,車企也爭相宣布將搭載類似產(chǎn)品。
2月初,百度宣布將在今年3月完成類似ChatGPT的項(xiàng)目“文心一言”的內(nèi)部測試。據(jù)悉,該產(chǎn)品是基于百度文心大模型ERNIE打造,具備跨模態(tài)、跨語言的深度語義理解與生成能力。
在百度官宣推出該產(chǎn)品之后,截止到2月20日,已有集度、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、愛馳、零跑、吉利汽車、海馬汽車等近10家車企加入文心一言的朋友圈。
自動駕駛領(lǐng)域,2月17日,毫末智行宣布將自動駕駛認(rèn)知大模型(人駕自監(jiān)督認(rèn)知大模型)正式升級為“DriveGPT”,在自動駕駛模型算法方面,全面運(yùn)用ChatGPT的模型和技術(shù)邏輯。
毫末智行方面表示,ChatGPT采用的是Transformer大模型以及“人類反饋強(qiáng)化學(xué)習(xí)(RLHF)”技術(shù),而毫末智行是國內(nèi)最早將Transformer大模型引入到數(shù)據(jù)智能體系MANA當(dāng)中的企業(yè)。
隨著汽車新四化的發(fā)展,在電動化之后,智能化成為引領(lǐng)汽車行業(yè)持續(xù)發(fā)展的重要?jiǎng)恿σ蛩?。而汽車智能化的發(fā)展,則離不開人工智能技術(shù)的加持。
也正因此,ChatGPT的火爆也讓汽車行業(yè)看到了巨大的價(jià)值空間。
作為一種對話式的軟件,業(yè)內(nèi)人士認(rèn)為ChatGPT技術(shù)或最先在智能座艙領(lǐng)域、車載語音等智能交互功能上落地。
此外,其背后所使用的AI大模型,也對自動駕駛技術(shù)的發(fā)展具有重要的作用。中國科學(xué)院院士、清華大學(xué)教授、百人會副理事長歐陽明高認(rèn)為,ChatGPT會讓自動駕駛、智能駕駛的編程變得更簡單,并將成為重要的技術(shù)趨勢。
在面向企業(yè)整車研發(fā)的過程中,ChatGPT也能夠提供一定的助力作用。
那么,ChatGPT將如何助力汽車行業(yè)發(fā)展?而眾多入局的玩家,誰又能夠做智能汽車行業(yè)的“ChatGPT”?
ChatGPT大熱
在講ChatGPT對汽車行業(yè)的影響和應(yīng)用之前,我們需要先搞清楚這個(gè)產(chǎn)品究竟是什么,以及背后應(yīng)用的核心技術(shù)是什么。
ChatGPT是由美國公司OpenAI研發(fā)的一款基于上千億超大語料參數(shù)組成的 GPT3.0 架構(gòu)訓(xùn)練出來的自然語言處理聊天工具。ChatGPT 的算法采用了 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu),具有很好的時(shí)序數(shù)據(jù)處理能力。
ChatGPT于去年12月正式上線,上線5天注冊用戶突破100萬,兩個(gè)月后用戶量突破1億。
據(jù)用戶在社交媒體曬出來的對話例子,可以看出ChatGPT能夠完成包括寫代碼,修復(fù)bug(代碼改錯(cuò)),翻譯文獻(xiàn),寫小說,寫商業(yè)文案,創(chuàng)作菜譜,做作業(yè),評價(jià)作業(yè)等一系列常見文字輸出型任務(wù)。
ChatGPT所表現(xiàn)出來的能力非常智能,甚至連特斯拉CEO埃隆·馬斯克都在社交媒體稱贊道:“ChatGPT好得嚇人,我們離危險(xiǎn)而強(qiáng)大的人工智能不遠(yuǎn)了?!?/p>
一般來說,想要機(jī)器人能夠準(zhǔn)確、迅速的理解人類語音并進(jìn)行回答,就需基于海量的數(shù)據(jù)建立的模型去支持機(jī)器人進(jìn)行訓(xùn)練。這也意味著,模型需要具備處理海量數(shù)據(jù)的能力。
傳統(tǒng)的算法小模型已經(jīng)并不具備該能力。因此,隨著人工智能技術(shù)的發(fā)展,以及海量數(shù)據(jù)的加持,算法訓(xùn)練模型也從傳統(tǒng)的算法小模型逐漸發(fā)展至大模型。
ChatGPT的背后,也是基于算法大模型的支持。
在NLP領(lǐng)域早期發(fā)展階段,主流的模型為循環(huán)神經(jīng)網(wǎng)絡(luò),但該模型存在不穩(wěn)定或者過早停止有效訓(xùn)練等問題。因此,在2017年,谷歌大腦團(tuán)隊(duì)首次提出基于自我注意力機(jī)制(self-attention)的變換器(Transformer)模型,并首次將其用于理解人類的語言。
在Transformer之后,OpenAI又相繼在語言處理大模型領(lǐng)域推出了包括GPT-1、GPT-2、GPT-3等語言訓(xùn)練大模型。ChatGPT則是OpenAI對GPT-3模型(又稱為GPT-3.5)微調(diào)后開發(fā)出來的對話機(jī)器人。
從2017年的Transformer到今天的ChatGPT,大型語言模型經(jīng)歷了如此多的迭代,一代比一代性能更強(qiáng)?,F(xiàn)如今,隨著汽車智能化的發(fā)展,以及整車對海量數(shù)據(jù)處理的實(shí)際需求,算法大模型也勢必會對汽車行業(yè)產(chǎn)生重要影響。
推動汽車智能化,ChatGPT影響多個(gè)領(lǐng)域
整車在智能化過程中,離不開感知(識別)、理解和決策三方面的能力。其中,理解人類語言,分析感知數(shù)據(jù),成為汽車智能化發(fā)展所面臨的重要難題之一。
而ChatGPT基于大規(guī)模預(yù)訓(xùn)練語言模型(GPT-3.5),通過在人工標(biāo)注和反饋的大規(guī)模數(shù)據(jù)上進(jìn)行學(xué)習(xí),能夠更好的理解人類的問題并給出更好的回答。
另外,ChatGPT還使用了一種叫「人類反饋強(qiáng)化學(xué)習(xí)(RLHF)」的訓(xùn)練方法,在訓(xùn)練中可以根據(jù)人類反饋,保證對無益、失真或偏見信息的最小化輸出。
基于如此強(qiáng)大的能力,ChatGPT能夠集成至車上各個(gè)場景,助力汽車行業(yè)智能化發(fā)展。
首先,車載語音領(lǐng)域或?qū)⑹荂hatGPT最先落地的應(yīng)用場景之一。
行業(yè)專家表示,ChatGPT在推理和學(xué)習(xí)能力上優(yōu)勢明顯,不僅可以用于理解和對話,更可以通過上下文交流和自我學(xué)習(xí),來實(shí)現(xiàn)輔助創(chuàng)作和知識進(jìn)化。
ChatGPT這些能力同樣適用車載語音交互領(lǐng)域,融合對話智能技術(shù)、深度學(xué)習(xí)大模型技術(shù)、工程化能力、大數(shù)據(jù)的潛力,帶來更流暢、更有效的響應(yīng)。在車內(nèi)有限的空間,結(jié)合聲場定位和多說話人判斷,提升多角色、長上下文對話的邏輯一致性;更可以拓展?jié)M足方言、外語的統(tǒng)一識別和對話需求,快速實(shí)現(xiàn)更靈活、自由、個(gè)性化的交互。
2月14日,在集度ROBOVERSE三里屯體驗(yàn)中心啟動會上,集度汽車CEO夏一平宣布,集度汽車機(jī)器人將融合百度文心一言的全面能力,打造全球首個(gè)針對智能汽車場景的大模型人工智能交互體驗(yàn),將“支持汽車機(jī)器人實(shí)現(xiàn)自然交流的再進(jìn)階”。
此前,集度智能駕駛負(fù)責(zé)人王偉寶也談到,關(guān)于集度將引入汽車的百度文心一言大模型,其現(xiàn)階段將用于語音和對話方面,未來不排除把該模型融入自動駕駛的數(shù)據(jù)生成工作中。
在自動駕駛領(lǐng)域,ChatGPT背后所應(yīng)用的算法大模型,具備對海量算法的處理能力以及多維度分析能力。因此,ChatGPT也能夠通過分析駕駛行為數(shù)據(jù),找出駕駛員的行為規(guī)律,以此來訓(xùn)練自動駕駛控制系統(tǒng),從而提高系統(tǒng)在復(fù)雜情境下的決策能力。
毫末智行是國內(nèi)首家將Transformer大模型引入數(shù)據(jù)智能體系中的公司。
此前,毫末智行也曾多次表示,當(dāng)前自動駕駛行業(yè)正在從小規(guī)模數(shù)據(jù)、小模型的軟件驅(qū)動的2.0時(shí)代向大規(guī)模數(shù)據(jù)、大參數(shù)模型為代表的數(shù)據(jù)驅(qū)動的3.0時(shí)代的跨越階段。
在今年1月份舉辦的毫末智行AI DAY上,毫末智行CEO顧維灝重點(diǎn)提及ChatGPT,并直言:“毫末已經(jīng)展開對ChatGPT背后的技術(shù)研究。”
顧維灝還表示,實(shí)際上,此前毫末智行推出的人駕自監(jiān)督認(rèn)知大模型就已借鑒了ChatGPT的實(shí)現(xiàn)思路,采用人類反饋強(qiáng)化學(xué)習(xí)(RLHF)技術(shù),通過引入真實(shí)人駕接管數(shù)據(jù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。通過這一大模型,在掉頭、環(huán)島等公認(rèn)的困難場景中,場景通過率提升30%以上。
2月17日,毫末智行宣布將自動駕駛認(rèn)知大模型(人駕自監(jiān)督認(rèn)知大模型)正式升級為“DriveGPT”,并稱將在2023年4月舉行的第八屆HAOMO AI DAY上公布重要進(jìn)展。
據(jù)悉,目前毫末DriveGPT已完成模型搭建和第一階段數(shù)據(jù)的跑通,參數(shù)規(guī)??蓪?biāo)GPT-2的水平。接下來 DriveGPT將持續(xù)引入大規(guī)模真實(shí)接管數(shù)據(jù),通過人駕數(shù)據(jù)反饋的強(qiáng)化學(xué)習(xí),來不斷提升測評效果,同時(shí)也將DriveGPT作為云端測評模型,用來評估車端小模型的駕駛效果。
除了車載語音和自動駕駛領(lǐng)域外,DriveGPT還可以應(yīng)用至汽車研發(fā)上,比如說,其可以通過對數(shù)據(jù)的分析和處理,為汽車生產(chǎn)企業(yè)提供更準(zhǔn)確的生產(chǎn)計(jì)劃和決策,幫助汽車生產(chǎn)企業(yè)實(shí)現(xiàn)更加智能化的生產(chǎn)管理,降低生產(chǎn)成本和提高生產(chǎn)效率。
當(dāng)然,現(xiàn)階段ChatGPT在汽車領(lǐng)域的應(yīng)用尚處于初步階段,未來發(fā)展還充滿著不確定性。那么,在如此火熱的狂潮下,國內(nèi)眾多玩家中誰又能夠真正跑出第一個(gè)“ChatGPT”?
誰才能做智能汽車行業(yè)的“ChatGPT”?
要做智能汽車行業(yè)的ChatGPT,門檻并不低。
一方面,ChatGPT背后最核心的技術(shù)能力,是大模型對數(shù)據(jù)的處理能力,而這又需要對AI具有非常深厚的技術(shù)積累。
另一方面,從成本來看,ChatGPT的研究需要巨大的資金和人才投入,其需要超算平臺、算法、數(shù)據(jù)等各核心力量支撐。
由此來看,當(dāng)前只有巨頭平臺公司具備這方面的優(yōu)勢,對于科技企業(yè)可以更多從場景融合入手,尋求創(chuàng)新機(jī)會。
目前,在智能汽車領(lǐng)域,百度率先推出了“文心一言”產(chǎn)品,劍指車載語音賽道。而該賽道中,科大訊飛、Cerence又占據(jù)著強(qiáng)勢的市場份額優(yōu)勢,二者在NLP領(lǐng)域也有著深厚的技術(shù)積累。
在自動駕駛賽道中,特斯拉是最先引用Transformer的企業(yè),毫末智行緊隨其后,是國內(nèi)最早一批率先展開對人工智能技術(shù)的研究,并率先將其優(yōu)化應(yīng)用至自身的自動駕駛系統(tǒng)之中,這一點(diǎn)幾乎可以是與特斯拉同步。
此外,基于對前沿技術(shù)發(fā)展趨勢的準(zhǔn)確判斷,毫末智行率先實(shí)現(xiàn)了智能輔助駕駛產(chǎn)品的規(guī)模量產(chǎn),打通自動駕駛數(shù)據(jù)閉環(huán),并快速實(shí)現(xiàn)產(chǎn)品迭代升級。
2021年初,毫末智行宣布推出HPilot1.0,在之后短時(shí)間內(nèi),很快就推出2.0和3.0產(chǎn)品,并且在3.0產(chǎn)品上實(shí)現(xiàn)了類似特斯拉FSD的飛躍式的換代。
此外,面對ChatGPT的火熱,甚至原美團(tuán)聯(lián)合創(chuàng)始人王慧文都按耐不住,高調(diào)在社交平臺公布一則求賢令,為其創(chuàng)立的北京光年之外科技有限公司招攬AI研發(fā)大牛,并以2億美元的估值,個(gè)人出資5000萬美元,只為打造中國的OpenAI。
智能汽車的發(fā)展和技術(shù)的迭代升級,離不開AI技術(shù)的支持。ChatGPT火熱,也讓汽車行業(yè)看到未來無限的發(fā)展空間。那么,在眾多車企官宣入局之后,誰又能夠做出真正的第一個(gè)國內(nèi)“ChatGPT”?