百度大模型生態(tài)不止文心杯,李彥宏更希望創(chuàng)業(yè)者卷 AI 原生應(yīng)用
"只有在大模型基礎(chǔ)上產(chǎn)生足夠多的AI原生應(yīng)用,才是一個(gè)健康的生態(tài)環(huán)境。"
本文為IPO早知道原創(chuàng)
作者|Stone Jin
據(jù)IPO早知道消息,在9月5日舉行的百度云智大會(huì)上,為期將近百天的百度“文心杯”創(chuàng)業(yè)大賽揭曉了15個(gè)優(yōu)勝團(tuán)隊(duì),并在當(dāng)天下午舉行了Demo Day。這些優(yōu)勝項(xiàng)目將獲得百度最高千萬(wàn)級(jí)別的投資,同時(shí)將在業(yè)務(wù)合作、技術(shù)輔導(dǎo)、市場(chǎng)宣傳等方面得到百度的長(zhǎng)期支持。
對(duì)于本次創(chuàng)業(yè)大賽,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏頗為重視——在5月31日宣布啟動(dòng)"文心杯"時(shí),李彥宏即指出,美國(guó)開發(fā)者正基于ChatGPT或其他語(yǔ)言模型開發(fā)新應(yīng)用。在中國(guó),更多開發(fā)者將會(huì)基于文心大模型來(lái)開發(fā)AI應(yīng)用;而在9月5日的云智大會(huì)上,李彥宏再次強(qiáng)調(diào),“我們希望創(chuàng)業(yè)者在文心大模型之上,可以做出AI時(shí)代的爆款應(yīng)用?!?/strong>
為了促進(jìn)大模型生態(tài)發(fā)展,除“文心杯”創(chuàng)業(yè)大賽外,百度還面向開發(fā)者推出AI Studio星河大模型社區(qū)、插件機(jī)制以及文心大模型“星河”共創(chuàng)生態(tài)計(jì)劃。目前,已有500多家生態(tài)伙伴通過(guò)百度智能云千帆大模型平臺(tái)使用各類大模型服務(wù),千帆大模型平臺(tái)上月活企業(yè)數(shù)超過(guò)10000家。
接下來(lái),百度還計(jì)劃繼續(xù)支持1萬(wàn)家初創(chuàng)企業(yè),落地“AI加速器”項(xiàng)目,推出千帆大模型社區(qū),定期舉辦大模型相關(guān)賽事,以不斷推動(dòng)大模型生態(tài)繁榮。
綜上不難發(fā)現(xiàn),在國(guó)內(nèi)這一眾大廠中,百度是第一個(gè)、或許也是迄今為止唯一一個(gè)愿意給予這么大的資源投入來(lái)支持開發(fā)者及初創(chuàng)企業(yè)的大廠。
在李彥宏看來(lái),模型本身是不直接產(chǎn)生價(jià)值的,基于基礎(chǔ)大模型開發(fā)出來(lái)的應(yīng)用才是模型存在的意義。
“對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),卷大模型沒有意義,卷應(yīng)用機(jī)會(huì)更大?!崩顝┖暾f(shuō)道,“移動(dòng)互聯(lián)網(wǎng)時(shí)代操作系統(tǒng)只有安卓和iOS,但特別成功的應(yīng)用卻很多,只有在大模型基礎(chǔ)上產(chǎn)生足夠多的AI原生應(yīng)用,才是一個(gè)健康的生態(tài)環(huán)境?!?/p>
近1000個(gè)項(xiàng)目報(bào)名、超8成聚焦應(yīng)用層落地,文心大模型逐漸成創(chuàng)企開發(fā)首選
自5月31日百度“文心杯”創(chuàng)業(yè)大賽啟動(dòng)以來(lái),共吸引了近 1000 個(gè)項(xiàng)目報(bào)名。其中,超8成項(xiàng)目聚焦大模型應(yīng)用層落地。
「IPO早知道」在Demo Day現(xiàn)場(chǎng)發(fā)現(xiàn),除生產(chǎn)力工具、營(yíng)銷等熱門賽道之外,不少創(chuàng)業(yè)者同樣在積極探索大模型在醫(yī)療、教育、金融、法律、材料等行業(yè)應(yīng)用的重構(gòu)與改造。
從創(chuàng)業(yè)者的職業(yè)畫像來(lái)看,既有來(lái)自騰訊、阿里、美團(tuán)、字節(jié)、Meta、Pinterest、Hulu等海內(nèi)外大廠的產(chǎn)品經(jīng)理、連續(xù)創(chuàng)業(yè)者,亦有斯坦福大學(xué)、牛津大學(xué)、康奈爾大學(xué)、清華大學(xué)、香港科技大學(xué)等名校教授、博士的科研團(tuán)隊(duì),以及在傳統(tǒng)行業(yè)深耕多年的資深人士;而從年齡階段來(lái)看,走到最后的15個(gè)項(xiàng)目的創(chuàng)始人一半都是90后。
不可否認(rèn)的一點(diǎn)是,絕大多數(shù)開發(fā)者最早接觸到的大語(yǔ)言模型還是ChatGPT,即起步階段大都基于ChatGPT開發(fā)新應(yīng)用。但隨著國(guó)內(nèi)大廠逐步完善并開放自己的大模型,更多創(chuàng)業(yè)者將基于國(guó)內(nèi)通用大模型來(lái)完成進(jìn)一步開發(fā)將是大勢(shì)所趨。
只是,「IPO早知道」早前與多位從事大模型應(yīng)用層創(chuàng)業(yè)的創(chuàng)業(yè)者交流時(shí)發(fā)現(xiàn),仍有不少創(chuàng)業(yè)者對(duì)國(guó)內(nèi)大模型的能力以及從ChatGPT切換至國(guó)內(nèi)大模型的成本抱有一定的猶豫和懷疑。對(duì)此,在Demo Day現(xiàn)場(chǎng),「IPO早知道」與部分參賽選手就這一問(wèn)題展開了一些交流。
Buysmart.AI創(chuàng)始人陳歷飛指出,鑒于其打造的智能電商購(gòu)物助手未來(lái)還是要面向國(guó)內(nèi)市場(chǎng),因此“抱著試一試的心態(tài)”,Buysmart.AI團(tuán)隊(duì)將大模型從ChatGPT切換成了文心一言,這也是Buysmart.AI團(tuán)隊(duì)使用的第一個(gè)國(guó)內(nèi)大語(yǔ)言模型。“目前整體看下來(lái),切換是比較順利的,gap并沒有那么大,因?yàn)檎Z(yǔ)言的差別,在部分問(wèn)題上的回答還是會(huì)不一樣,但總體使用起來(lái)還是比較流暢?!痹诒敬未筚愔?,Buysmart.AI獲得了一等獎(jiǎng)。
致力于打造新一代AI-Native亞文化興趣同好創(chuàng)作社區(qū)的Genie AI CEO彭康偉同樣認(rèn)為,對(duì)比ChatGPT和文心一言,無(wú)論是模型的微調(diào),還是一些關(guān)鍵詞的表述,兩者的表現(xiàn)基本一致;而從安全以及中文兼容性的角度來(lái)看,文心一言則是更好的一個(gè)?!岸?,如果使用ChatGPT,就需要圍繞著它去做很多的代碼構(gòu)建和架構(gòu)構(gòu)建,這需要更多的時(shí)間成本?!?/p>
隨著8月31日文心一言率先向全社會(huì)全面開放,且企業(yè)用戶可以直接登陸百度智能云千帆大模型平臺(tái)官網(wǎng)調(diào)用文心一言能力,以及百度智能云對(duì)“千帆大模型平臺(tái)”的升級(jí),百度文心大模型將有望滿足更多不同行業(yè)、不同規(guī)模、不同開發(fā)能力的企業(yè)用大模型的需求。
在完成升級(jí)后,千帆大模型平臺(tái)納管的國(guó)內(nèi)外主流大模型達(dá)到42個(gè),還預(yù)置了41個(gè)高質(zhì)量有行業(yè)特色的數(shù)據(jù)集,預(yù)裝了知識(shí)問(wèn)答、客服對(duì)話、代碼助手等10個(gè)精選應(yīng)用范式,大幅降低企業(yè)使用、訓(xùn)練和推理大模型的門檻。對(duì)于除文心大模型之外的第三方大模型,千帆平臺(tái)不只是簡(jiǎn)單的接入,還提供中文增強(qiáng)、性能增強(qiáng)、上下文增強(qiáng)等能力。換言之,原來(lái)要用英文對(duì)話效果才好的Llama2等國(guó)外大模型,現(xiàn)在用中文也一樣好。
AI原生應(yīng)用絕不是對(duì)App和PC軟件的重復(fù),做好“開發(fā)者的副駕駛”、助力更多應(yīng)用創(chuàng)新
百度過(guò)去這些年,始終不變和堅(jiān)持的一點(diǎn)是堅(jiān)持用AI重塑所有業(yè)務(wù),這份對(duì)“技術(shù)的信仰”體現(xiàn)在——百度近十年累計(jì)研發(fā)投入超1400億元,這也使其成為全球?yàn)閿?shù)不多的、有著應(yīng)用、模型、框架、芯片四層全棧布局的AI公司,實(shí)現(xiàn)端到端優(yōu)化,并在各個(gè)層面都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù)。李彥宏曾介紹,過(guò)去幾年百度的最高獎(jiǎng)當(dāng)中,獲獎(jiǎng)的團(tuán)隊(duì)絕大多數(shù)都是來(lái)自技術(shù)部門。
這在一定程度上也解釋了為何百度能在這一波大模型浪潮中屢獲第一——文心大模型2019年發(fā)布,中國(guó)第一;文心一言2023年發(fā)布,中國(guó)第一,全球大廠第一;文心一言首批對(duì)公眾開放,中國(guó)第一。據(jù)IDC發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》顯示,文心大模型3.5拿下12項(xiàng)指標(biāo)的7個(gè)滿分,綜合評(píng)分、算法模型、行業(yè)覆蓋均為第一?!安痪煤螅覀兙蛯⑼瞥鑫男拇竽P?.0版本?!崩顝┖暝赒2財(cái)報(bào)會(huì)上透露。
在技術(shù)優(yōu)勢(shì)的基礎(chǔ)上,“如何給予自己一個(gè)清晰的定位”便成了新課題——在這一點(diǎn)上,百度想得更加清楚,做好“開發(fā)者的副駕駛”。李彥宏曾多次表示,百度的目標(biāo)是打造好大模型的基礎(chǔ)能力,支持好AI原生應(yīng)用開發(fā)。
“我非??春弥袊?guó)AI應(yīng)用的發(fā)展前景,如果回顧過(guò)去幾十年歷史,在中國(guó)大家都非常愿意擁抱新興技術(shù)。雖然我們沒有發(fā)明Android、iOS或Windows系統(tǒng),但我們開發(fā)了許多非常創(chuàng)新的應(yīng)用,比如微信、抖音和滴滴等,還有很多應(yīng)用都很受歡迎、很實(shí)用。在人工智能時(shí)代,也是同樣的情況??萍紟?lái)了很多可能,我們非常善于開發(fā)應(yīng)用,并充分利用了這些可能。"李彥宏這樣說(shuō)道。
換言之,通用大模型的創(chuàng)業(yè)當(dāng)然值得鼓勵(lì),但從“以終為始”的角度來(lái)看,能夠走到最后的通用大模型畢竟還是少數(shù),“輪子”沒必要重復(fù)造,如何創(chuàng)造出更多的創(chuàng)新應(yīng)用才能促使整個(gè)AI生態(tài)更具活力。
李彥宏進(jìn)一步給出了自己的思考和建議,AI原生應(yīng)用應(yīng)該滿足三個(gè)基礎(chǔ)條件:一是能夠用自然語(yǔ)言交互,二是充分利用大語(yǔ)言模型的理解、生成、推理、記憶等能力,三是每個(gè)應(yīng)用的交互不超過(guò)兩級(jí)菜單,所以交互會(huì)更簡(jiǎn)單。
當(dāng)然,若將視角放大、時(shí)間拉長(zhǎng),諸如“黑客馬拉松”此類的活動(dòng)在國(guó)內(nèi)外都屢見不鮮,百度自然也不會(huì)是最后一個(gè)舉辦創(chuàng)業(yè)大賽的大廠?;谧约旱募夹g(shù)先發(fā)優(yōu)勢(shì),第一時(shí)間為開發(fā)者服務(wù),進(jìn)而反哺基礎(chǔ)模型的持續(xù)迭代并創(chuàng)造更好的用戶體驗(yàn),百度已經(jīng)走在了領(lǐng)跑的位置上。
隨著“應(yīng)用層的創(chuàng)新才是AI 2.0時(shí)代最大的機(jī)會(huì)”這句話逐漸變成共識(shí),可以預(yù)見的是,在接下來(lái)一段時(shí)間內(nèi),國(guó)內(nèi)將涌現(xiàn)越來(lái)越多的基于大模型的應(yīng)用層的創(chuàng)業(yè)比賽,國(guó)內(nèi)的整個(gè)AI生態(tài)也將愈發(fā)繁榮。
只是,有多少大廠愿意一次又一次、不計(jì)投入地自己默默耕耘技術(shù)、盡力為創(chuàng)業(yè)者服務(wù),希望不止百度一家。
“堅(jiān)持技術(shù)投入即使是五年、十年,見不到什么商業(yè)的回報(bào),但如果你覺得它在更長(zhǎng)的時(shí)期內(nèi)能夠會(huì)對(duì)這個(gè)社會(huì)對(duì)人們產(chǎn)生一個(gè)正向的影響的話,我們還是能夠做得起?!崩顝┖暝缡潜硎?。