火山引擎入局大模型之戰(zhàn),卻為何不走尋常路?
導(dǎo)語(yǔ):
火山引擎以一種新的姿態(tài)加入了大模型賽道的競(jìng)爭(zhēng),那就是基于開放的大模型服務(wù)平臺(tái)模式。
可以想見(jiàn)的是,目前已經(jīng)有如此多的企業(yè)聚焦大模型,可以說(shuō)在供給側(cè),未來(lái)的大模型能力會(huì)和水、電、煤一樣俯拾皆是。
所以,對(duì)于用戶來(lái)說(shuō),不用擔(dān)心沒(méi)有大模型可用,反而要擔(dān)心如何解決選擇困難癥;而對(duì)于大模型企業(yè)來(lái)說(shuō),要擔(dān)心的則是推廣難、獲客難。
而火山引擎推出的“火山方舟”大模型服務(wù)平臺(tái),不僅為諸多大模型提供了渠道、服務(wù)鏈路和平臺(tái),也非常適合企業(yè)采用輕量級(jí)、多嘗試、易解耦的策略,廣泛的嘗試多家大模型提供商不同的大模型服務(wù),讓時(shí)間和實(shí)踐成為最后選擇的指導(dǎo),讓大模型生態(tài)更加自然而健康的生長(zhǎng)。

1. 火山引擎&大模型,另一種形態(tài)的爆發(fā)
時(shí)間進(jìn)入炎熱的7月,大模型賽道的熱度仿佛疊加了氣溫,更加的炙手可熱。
既有王興接盤自己老隊(duì)友的初創(chuàng)大模型企業(yè)這樣的業(yè)內(nèi)軼事,也有6月28日V-Tech體驗(yàn)創(chuàng)新科技峰會(huì)上,火山引擎推出名為“火山方舟”的大模型服務(wù)平臺(tái)的重磅行業(yè)新聞。
不過(guò)筆者發(fā)現(xiàn),很多讀者在激動(dòng)之下,很容易犯一個(gè)錯(cuò)誤——把大模型和大模型服務(wù)平臺(tái)弄混。
大模型和大模型服務(wù)平臺(tái),完全是兩碼事。
前者好比是一塊CPU或GPU,解決的是一個(gè)核心部件的功能、性能問(wèn)題;后者好比是一個(gè)商城,在這里你可以選擇不同的模型以及相關(guān)的精調(diào)、評(píng)測(cè)、推理等一整套服務(wù)。
一個(gè)強(qiáng)大的零部件和一套完整的服務(wù),商業(yè)價(jià)值上有巨大的差距。
比如在數(shù)字時(shí)代里,雖然我們每個(gè)人理論上都擁有一塊或幾塊CPU,乃至我們的每一次觸碰和點(diǎn)擊,都要用到CPU。但是實(shí)際生活中,我們都是通過(guò)使用iPhone這樣的整機(jī)來(lái)間接的使用CPU的。
所以某種程度上,一個(gè)解決方案的完全體,比核心零部件提供商的商業(yè)想象空間更高——全球CPU霸主英特爾的市值是1300億美金,炙手可熱的GPU霸主英偉達(dá)的市值是1萬(wàn)億美金。
但蘋果公司的市值卻是3萬(wàn)億美金。
說(shuō)回這次火山方舟的發(fā)布——其實(shí),火山引擎在今年的春季Force原動(dòng)力大會(huì)上就明確表示不會(huì)做大模型了,解答了“不做什么”的問(wèn)題。
而這次火山方舟的發(fā)布,解答了“做什么”的問(wèn)題。
簡(jiǎn)而言之,就是火山引擎發(fā)布的大模型服務(wù)平臺(tái)“火山方舟”,它面向企業(yè)提供模型精調(diào)、評(píng)測(cè)、推理等全方位的平臺(tái)服務(wù)(MaaS,即Model-as-a-Service)。
它最大的特點(diǎn),就是把各家的百花齊放、各具特色的大模型,集合到自家的平臺(tái)上,基于獨(dú)特的多模型架構(gòu),讓應(yīng)用企業(yè)可同步體驗(yàn)、嘗試、應(yīng)用多個(gè)大模型,進(jìn)而選用更適合自身業(yè)務(wù)需要的模型組合。
僅僅在邀請(qǐng)測(cè)試階段,火山方舟就集成了百川智能、出門問(wèn)問(wèn)、復(fù)旦大學(xué)MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型。
某種程度上,這等于把這七家企業(yè)的大模型,一下子提速到了馬上可以落地應(yīng)用的階段,大模型服務(wù)平臺(tái)的產(chǎn)業(yè)價(jià)值,也驟然彰顯。
2. 頭部賽道的差異化打法
雖然在6月28日這天,火山引擎并沒(méi)有推出自研的大模型,但就憑火山方舟的創(chuàng)新服務(wù)模式,火山引擎成為了目前國(guó)內(nèi)大模型賽道的最大變量之一,把自己拉到了中國(guó)“模型即服務(wù)”的第一陣營(yíng)。
作為全球AI唯二的創(chuàng)新源地,國(guó)內(nèi)目前的大模型賽道可謂“群模亂舞”,但能夠進(jìn)入第一陣營(yíng)的只有區(qū)區(qū)幾家而已。
例如阿里巴巴,它在中國(guó)云計(jì)算市場(chǎng)上仍然處于頭部?jī)?yōu)勢(shì)地位,而“模型即服務(wù)”也屬于廣義云服務(wù)的范疇。
由于長(zhǎng)達(dá)十幾年的云計(jì)算研發(fā)、運(yùn)營(yíng)經(jīng)驗(yàn),和AI、BigData、cloud三者融合的必然趨勢(shì),阿里巴巴在云計(jì)算相關(guān)的軟硬件上都做了廣泛深入的投資,技術(shù)底蘊(yùn)雄厚,例如其大模型基于阿里云、達(dá)摩院打造的硬件優(yōu)勢(shì),可將大模型所需算力大幅度壓縮。
另外,阿里全自研的底層技術(shù)優(yōu)勢(shì),也非常有利于構(gòu)建AI服務(wù)的統(tǒng)一底層,這些都屬于戰(zhàn)略級(jí)而非戰(zhàn)術(shù)級(jí)的優(yōu)勢(shì);阿里的通義千問(wèn),也是國(guó)內(nèi)第二家發(fā)布的生成式大模型。所以可以說(shuō),阿里目前已經(jīng)可以基于自身大模型,向市場(chǎng)提供實(shí)際落地的大模型服務(wù)。
百度也不可不提。作為國(guó)內(nèi)AI研發(fā)的正規(guī)軍之一,百度應(yīng)該是國(guó)內(nèi)最早投入AI研發(fā)的互聯(lián)網(wǎng)企業(yè),多年累積投入千億以上,生態(tài)建設(shè)全面。包括有深度學(xué)習(xí)框架—飛槳,有非常適合產(chǎn)生AI的業(yè)務(wù)——搜索……以及國(guó)內(nèi)首發(fā)的生成式大模型——文心一言及其云服務(wù)模型“文心千帆”等。
火山引擎總裁譚待并不否認(rèn)這些頭部企業(yè)的優(yōu)勢(shì),他指出,目前國(guó)內(nèi)大模型市場(chǎng)的最頂層,還將是幾家超級(jí)平臺(tái)支撐的超級(jí)大模型并存的格局,這種存在是不可否認(rèn)的。

圖:火山引擎總裁譚待
那么,火山引擎作為相對(duì)的后來(lái)人,它的戰(zhàn)略設(shè)計(jì)有何獨(dú)特之處?
在筆者看來(lái),火山引擎的打法,就是堅(jiān)定走自己“多云多模型”的路,而不是跟著別人的節(jié)奏起舞。
所以我們看到,雖然火山引擎不直接做大模型,但通過(guò)為大模型企業(yè)提供AI基礎(chǔ)設(shè)施,國(guó)內(nèi)幾十家做大模型的企業(yè),多數(shù)已經(jīng)在火山引擎的云上。
又比如,由于大量的服務(wù)于大模型企業(yè),也使得火山引擎針對(duì)大模型的服務(wù)支撐不斷強(qiáng)化,并打造了深層次的軟硬件一體化能力,如火山引擎的自研DPU,將通信優(yōu)化的算法直接寫到網(wǎng)卡硬件中,以降低延遲、削減擁塞等。
如是的類似技術(shù)細(xì)節(jié)還有很多,但筆者認(rèn)為,真正關(guān)鍵的不僅僅在于火山引擎的技術(shù),還有它為大模型賽道設(shè)計(jì)的獨(dú)特模式和競(jìng)爭(zhēng)策略。
3. 多云多模型和1+N
從AI到大模型,從大模型到大模型商業(yè)化落地,其中最大的堵點(diǎn),主要不是技術(shù)問(wèn)題,而是商業(yè)模式問(wèn)題。
Chatgpt出現(xiàn)之前,各家企業(yè)的AI商業(yè)化落地,都磕磕絆絆。其實(shí)最大的問(wèn)題,是沒(méi)有讓用戶看到價(jià)值,同時(shí)也不容易讓用戶感受到價(jià)值。
Chatgpt出現(xiàn)后,大家都對(duì)AI的價(jià)值看的很清楚了,但問(wèn)題是,什么樣的商業(yè)模式才能迅速讓大模型的優(yōu)勢(shì)得以發(fā)揮。
這就涉及到對(duì)大模型應(yīng)用模式的底層邏輯判斷。
而譚待告訴筆者,他認(rèn)為未來(lái)大模型應(yīng)用最核心的兩個(gè)特征,是“多云多模型”和“1+N”。
所謂的多云多模型,指的是——未來(lái)的企業(yè)會(huì)同時(shí)選擇不同層次的多個(gè)模型和多家企業(yè)的云服務(wù),來(lái)解決不同層次的問(wèn)題。
“未來(lái)大模型賽道的格局,會(huì)是少數(shù)幾家超級(jí)模型+一部分通用大模型+很多垂直領(lǐng)域的細(xì)分模型”,譚待說(shuō):“這就和企業(yè)用工一樣,不是所有的問(wèn)題都要博士畢業(yè)的員工才能解決,博士干博士的活兒、碩士、本??粕捕几鶕?jù)自己的能力干力所能及的工作,才是一個(gè)相對(duì)的最優(yōu)解。所以未來(lái)的大模型賽道也會(huì)是,一個(gè)企業(yè)會(huì)同時(shí)用到多種模型和多種功能?!?/p>
但模型又并不是越多越好,過(guò)多的模型增加了試錯(cuò)的成本,增加了技術(shù)的復(fù)雜性,所以火山引擎的判斷是,未來(lái)較大的可能是,一個(gè)企業(yè)選擇一個(gè)主要的大模型作為主干,同時(shí)選擇多個(gè)專用模型解決不同的問(wèn)題,也就是“1+N”。
無(wú)論是哪一種模式,都面臨一個(gè)底層邏輯——火山方舟這樣的大模型服務(wù)平臺(tái),要能提供盡可能多的選擇、組合,同時(shí)提供高水平的服務(wù)。
我們可以從用戶和大模型提供商的角度,來(lái)看這種服務(wù)邏輯的優(yōu)點(diǎn)。
先從對(duì)大模型用戶的突出優(yōu)點(diǎn)來(lái)看。
第一個(gè)優(yōu)點(diǎn),是可以快速的“試穿試用”。
火山方舟目前集成了百川智能、出門問(wèn)問(wèn)、復(fù)旦大學(xué)MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等,未來(lái)可想而知的還會(huì)集成更多的大模型提供商。在火山方舟的統(tǒng)一支撐下,企業(yè)可以靈活選擇、低成本試錯(cuò),不用跨平臺(tái)就能尋找更適合自己企業(yè)的模型服務(wù)。
第二個(gè)優(yōu)點(diǎn),是獲得與模型提供商一致的服務(wù)。
火山方舟的“模型精調(diào)”模式,就是一個(gè)實(shí)用價(jià)值很高的服務(wù)。
火山引擎智能算法負(fù)責(zé)人吳迪指出,從短期看,訓(xùn)練大模型很昂貴,但是從長(zhǎng)期看,模型的推理開銷會(huì)超過(guò)訓(xùn)練開銷。

圖:火山引擎智能算法負(fù)責(zé)人吳迪
這意味著,模型并不是越大越好。例如,微軟以醫(yī)學(xué)文章為主要數(shù)據(jù)集,精調(diào)了生物領(lǐng)域的BioGPT-Large模型,僅有15億參數(shù),但在 PubMedQA 基準(zhǔn)測(cè)試中的準(zhǔn)確率,卻優(yōu)于有著上千億乃至數(shù)千億參數(shù)的大型通用語(yǔ)言模型。
而“火山方舟”提供了豐富的模型精調(diào)和評(píng)測(cè)支持。甚至可以讓一家企業(yè)用統(tǒng)一的工作流對(duì)接多家大模型,再通過(guò)自動(dòng)化和人工評(píng)估直觀對(duì)比模型精調(diào)效果。
而精調(diào)其實(shí)也是需要很高的技術(shù)門檻的,所以火山方舟還將通過(guò)提供運(yùn)營(yíng)干預(yù)工具,讓用戶可以快速設(shè)置相關(guān)規(guī)則,這樣在模型已經(jīng)投入使用后,無(wú)需精調(diào)模型即可干預(yù)模型輸出結(jié)果。
總之,是怎么便宜、實(shí)用、方便,就怎么來(lái)。
第三個(gè)優(yōu)點(diǎn),是超強(qiáng)的安全性。
聚合多模型、服務(wù)多用戶,這樣的架構(gòu)決定了一個(gè)問(wèn)題會(huì)被凸顯出來(lái),那就是安全問(wèn)題。
既有模型服務(wù)商的安全問(wèn)題,也有用戶的安全問(wèn)題。前者在意大模型的源代碼安全,后者在意自己獨(dú)家且精調(diào)過(guò)的數(shù)據(jù)的安全。
而火山方舟對(duì)用戶的需求把握精準(zhǔn),通過(guò)互信計(jì)算框架,滿足基于不同客戶的安全和隱私保護(hù)訴求,設(shè)計(jì)了包括安全沙箱、可信硬件以及聯(lián)邦學(xué)習(xí)方案,來(lái)保證合作的多方在互信的基礎(chǔ)上推理、精調(diào)等,讓模型提供商和用戶都更加放心的使用。
這將是火山方舟的一個(gè)重要競(jìng)爭(zhēng)力。
接下來(lái),我們?cè)俜治鲆幌禄鹕椒街勰J綄?duì)于大模型服務(wù)商的優(yōu)勢(shì)。
首先,火山引擎作為一個(gè)成熟的云計(jì)算服務(wù)商,將很好的提升大模型企業(yè)和市場(chǎng)對(duì)接的效率,讓大模型企業(yè)跳過(guò)“冷啟動(dòng)期”。
其實(shí),無(wú)論是大模型開發(fā)企業(yè)單獨(dú)提供服務(wù),還是通過(guò)火山方舟平臺(tái),服務(wù)用戶的路徑在原理上基本是類似的。
但對(duì)于大模型開發(fā)企業(yè)來(lái)說(shuō),特別是在早期,單獨(dú)修建這樣一條服務(wù)路徑的成本不僅很高,而且只能由企業(yè)自身承擔(dān),這樣效率不僅低下,成本也很難被攤薄。
而加入火山方舟就相當(dāng)于把商品放進(jìn)了成熟的渠道,不但可以共用路徑、共享服務(wù),還可以得到火山引擎的能力加持,等于說(shuō)跳過(guò)了冷啟動(dòng)階段,直接進(jìn)入了服務(wù)落地階段。這對(duì)于初創(chuàng)大模型企業(yè)的吸引力十分巨大。
其次,火山引擎提供了應(yīng)用企業(yè)所需的、完整的技術(shù)支持。
火山方舟一切從實(shí)際需求出發(fā)來(lái)提供服務(wù)——模型廠商擔(dān)心算力和工程穩(wěn)定性,火山引擎就提供技術(shù)支持;大模型要真正應(yīng)用,安全信任和推理成本問(wèn)題必須解決,火山方舟就實(shí)現(xiàn)了安全互信計(jì)算;更不要說(shuō),還有前敘的模型精調(diào)支持、訓(xùn)推一體等服務(wù),并且可以通過(guò)公有云的彈性,幫助廠商降低成本。
最后,隨著越來(lái)越多的模型被集成,有可能醞釀新的模式和能力。
我們反復(fù)的討論過(guò),無(wú)論是“多云多模型”還是“1+N”,本質(zhì)都是不同層次、不同功能的模型能力的組合。而火山方舟的開放性,決定了這種組合是跨平臺(tái)的,其組合形態(tài)和數(shù)量級(jí)會(huì)指數(shù)級(jí)的提升,因而,也為醞釀出基于全盤的最優(yōu)組合乃至跨越式創(chuàng)新提供了機(jī)會(huì),它不僅將成為模型服務(wù)的集合者,也會(huì)成為模型服務(wù)的創(chuàng)新平臺(tái)。
結(jié)語(yǔ):
客觀的說(shuō),雖然大模型之戰(zhàn)非?;馃?,但其實(shí)總體上來(lái)說(shuō),還是很初級(jí)的階段,而其原因是多方面的:
一個(gè)是大模型技術(shù)遠(yuǎn)遠(yuǎn)沒(méi)有固化,未來(lái)發(fā)展可期;
一個(gè)是現(xiàn)在對(duì)大模型發(fā)展路徑已經(jīng)開始發(fā)生爭(zhēng)議,未來(lái)發(fā)展充滿挑戰(zhàn);
一個(gè)是大模型的商業(yè)化落地還在探索,這才是最終決定大模型的價(jià)值體現(xiàn)的關(guān)鍵一步;
但是,很顯然,大模型的開發(fā),并不是任何企業(yè)都可以勝任的。未來(lái)這個(gè)賽道會(huì)有非常細(xì)的生態(tài)分層,例如最具實(shí)力的去開發(fā)超級(jí)大模型,有一定實(shí)力的可能專攻產(chǎn)業(yè)級(jí)大模型,甚至精調(diào)、預(yù)訓(xùn)練、數(shù)據(jù)等領(lǐng)域都會(huì)產(chǎn)生新的獨(dú)角獸。
而火山方舟的價(jià)值在于,在賽道的極早期就卡位在聚合多模型的大模型服務(wù)平臺(tái)的定位上,為未來(lái)發(fā)展繁衍出超級(jí)生態(tài)進(jìn)行了周到的布局。
當(dāng)然,不得不說(shuō)的是,多模型聚合是未來(lái)模型即服務(wù)的方向,現(xiàn)在也有越來(lái)越多的企業(yè)宣布自己集成更多的大模型,這既是這個(gè)賽道發(fā)展的必然,也是火山方舟未來(lái)也要面對(duì)更激烈的挑戰(zhàn)的前奏。