“遍地開花”的大模型,“百模大戰(zhàn)”誰能夠笑傲江湖?
這段時間,由ChatGPT引起這把火,在國內(nèi)越燒越旺。
當(dāng)百度官宣“文心一言”時,筆者也曾訝異:“國內(nèi)有生成式AI實力的遠(yuǎn)不止百度一家,為何只有百度入局。”話音還未落下,國內(nèi)類ChatGPT產(chǎn)品便接踵而至,諸如,阿里的“通義千問”、商湯的“商湯日日新大模型”、三六零的“360智腦”,還有騰訊、科大訊飛、字節(jié)跳動、出門問問等廠商推出的大模型緊隨其后,每隔幾天便有新的大模型降生。大模型賽道在迎來選手的同時,也面臨新的競爭,上演著一場“百模大戰(zhàn)”。哪些大模型能夠笑傲江湖,未來又將何去何從??
賽道迎來新“賽車手”
百度的“文心一言”并非最早官宣的類ChatGPT產(chǎn)品。今年2月份,科大訊飛透露其AI學(xué)習(xí)機(jī)、訊飛聽見等將成為公司類ChatGPT技術(shù)率先落地的產(chǎn)品。日前,筆者獲悉,科大訊飛將于5月6日發(fā)布訊飛星火認(rèn)知大模型,屆時訊飛AI學(xué)習(xí)機(jī)、訊飛聽見、訊飛開放平臺將迎來重磅更新,其中最令人期待的莫過于星火認(rèn)知大模型。
在國內(nèi)引起廣泛關(guān)注的當(dāng)屬百度官宣“文心一言”,號稱中國版ChatGPT一經(jīng)官宣火爆整個AI圈。之所以受到廣泛關(guān)注,是因為早年間百度便將注意力轉(zhuǎn)向AI、自動駕駛領(lǐng)域,而“文心一言”的官宣也是對百度的考驗,其次是因為百度在ChatGPT最擅長的搜索領(lǐng)域有龐大的用戶基礎(chǔ),也容易商業(yè)變現(xiàn)。事實上,“文心一言”推出之后,媒體、企業(yè)也都紛紛官宣接入,筆者所在的天極網(wǎng)和比特網(wǎng)也在第一時間宣布接入,目前也在內(nèi)測。
或許是百度文心一言的不自信,又或許是資本關(guān)注度不斷攀升,抑或是企業(yè)想要借助類ChatGPT這一工具提升產(chǎn)品體驗,文心一言尚在內(nèi)測的時候,阿里、360、商湯等企業(yè)開始布局大模型市場。與文心一言同在搜索領(lǐng)域占據(jù)優(yōu)勢的有360GPT,2023數(shù)字安全與發(fā)展高峰論壇上,360創(chuàng)始人周鴻祎演示360GPT,其產(chǎn)品也被網(wǎng)友成為“紅孩兒”。日前,360更是推出了“360智腦”。
接下來,大模型市場就更加熱鬧了。消息稱網(wǎng)易有道教育場景下類ChatGPT模型“子曰”將推出,基于“子曰”大模型研發(fā)的AI口語老師和中文作文批改將開放內(nèi)測。京東集團(tuán)副總裁何曉冬也透露,京東將在今年發(fā)布新一代大模型“ChatJD”,定位為產(chǎn)業(yè)版本ChatGPT。不久前,昆侖萬維宣布與奇點智源合作自研的國產(chǎn)大語言模型“天工3.5”即將發(fā)布,并開放邀請內(nèi)測。?
在AI賽道有深厚積淀的華為也并沒有放棄這次機(jī)會,旗下的“盤古”系列的NLP(自然語言處理)大模型、CV(機(jī)器視覺)大模型、科學(xué)計算大模型被標(biāo)注為即將上線狀態(tài),外界也認(rèn)為華為即將加入大模型競賽。字節(jié)跳動也被曝年初就已開始組建專門的大模型團(tuán)隊。其中大語言模型方向由字節(jié)搜索部門牽頭。還有消息稱,原阿里達(dá)摩院科學(xué)家,超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的技術(shù)負(fù)責(zé)人楊紅霞已加入該團(tuán)隊。隨著越來越多的賽車手加入,大模型領(lǐng)域的硝煙越來越濃。
野蠻生長與各自為戰(zhàn)
天下大勢,合久必分,分久必合。這是規(guī)律,尤其是在一個朝代結(jié)束時,先是十八路諸侯的爭相撻伐,通過兼并戰(zhàn)形成三足鼎立或南北對峙,最后一統(tǒng)天下。當(dāng)前的大模型市場像極了十八路諸侯的征戰(zhàn)。每一個涉及AI的企業(yè)都想在AIGC中獲得競爭優(yōu)勢,又想借助大模型獲得客戶的信任與認(rèn)可。然而“百模大戰(zhàn)”,多個通用大模型百花齊放顯然是不現(xiàn)實的,盡管誰都想在競賽中脫穎而出。
事實上,與PC操作系統(tǒng)中的Windows、MacOS一樣,以AI大模型為基礎(chǔ)的商業(yè)生態(tài)中,最終成功的通用大模型為數(shù)不多,其他的競爭者也將成為存活下來的通用大模型的生態(tài)組成部分。這其中最大的原因在于算力。我們知道,大型語言模型對算力的需求很大,有需要海量的數(shù)據(jù)作為支撐,面臨很大的資源缺口。據(jù)悉,ChatGPT依賴于英偉達(dá)的A100顯卡,OpenAI為了訓(xùn)練ChatGPT甚至用上了上萬片英偉達(dá)A100,這是一個巨大的算力消耗。ChatGPT還因需求量太大暫停了升級服務(wù),并停止Plus付費項目的銷售。
除了GPU外,存儲系統(tǒng)也是限制之一。ChatGPT、文心一言等屬于大型語言模型,其他的模型還有BERT、T5等。大型語言模型通常包含百億級別的神經(jīng)元或參數(shù),因此對計算機(jī)系統(tǒng)的內(nèi)存構(gòu)成重大挑戰(zhàn)。決定大型語言模型運行的性能瓶頸也通常在于存儲系統(tǒng)。此外,還有強(qiáng)大的機(jī)器學(xué)習(xí)能力、海量的數(shù)據(jù)作為支撐。而這些也都是限制大模型的關(guān)鍵因素。這也成為這些語言大模型在發(fā)展中后期與其他大模型拉開距離的關(guān)鍵。事實上,擁有實力的企業(yè)屈指可數(shù)。?
從細(xì)分領(lǐng)域、細(xì)分場景出發(fā),與其說一些大模型的降生是為了掘金AIGC,倒不如說各大企業(yè)都在趁機(jī)提升自身產(chǎn)品的服務(wù)能力。日前,金山辦公宣布推出具備大語言模型能力的生成式人工智能應(yīng)用,暫定代號“WPS?AI”?!癢PS?AI”未來將以用戶體驗為優(yōu)先級,逐步放開公測,嵌入金山辦公全線產(chǎn)品。由此可見,大模型的推出是為了部分滿足自身的需求,在此基礎(chǔ)上再滿足其他企業(yè)的需求。
同時,我們也應(yīng)該洞察大模型面向的客戶的需求。日前,用友產(chǎn)品經(jīng)理談及類GPT產(chǎn)品時表示:“用友對于類ChatGPT是開放的態(tài)度,并不會只采用一種產(chǎn)品,而是各個產(chǎn)品的優(yōu)勢,盡可能地博采眾長?!?/p>
大模型賽道,誰能笑傲江湖?
現(xiàn)在說笑傲江湖還為時尚早,目前大模型市場還處于燒錢入局的階段。盡管如此,這些大模型依舊繞不開激烈的競爭。大模型市場對最終應(yīng)用的能力影響極大,尤其是B端市場,基礎(chǔ)大模型級別的ChatGPT、GPT4,偏向應(yīng)用層的Midjourney、Stable?Diffusion對于企業(yè)來說都已經(jīng)是被市場驗證過的,效果極佳的工具。在這個競爭格局下,國內(nèi)市場被主流大模型及應(yīng)用侵蝕是必然的。此外,大模型要想出海還繞不開數(shù)據(jù)安全、數(shù)據(jù)合規(guī)等問題。
然而,大模型市場的路到底在何方,深入哪些產(chǎn)業(yè)能夠快速商業(yè)化。首先便是搜索,大語言模型徹底改變了“搜索”,從打開搜索引擎獲取所需信息,到現(xiàn)在的打開大模型,或是集成了大模型的搜索引擎,不僅能獲取所需信息,還能通過持續(xù)不斷的對話不斷精確答案;其實便是對現(xiàn)在應(yīng)用的改造,智能化、數(shù)字化技術(shù)本身作為工具服務(wù)于人類,而大模型改變的并非一個獨立的應(yīng)用市場,而會對現(xiàn)有的全部應(yīng)用市場進(jìn)行改造。
數(shù)智化浪潮不斷噴涌向前,大模型正如浪潮中的一個階段,行業(yè)和企業(yè)要做的也只能是順應(yīng)這個趨勢,用這些手段不斷提升自身實力,以更好地服務(wù)千行百業(yè)的數(shù)字化轉(zhuǎn)型。透過國內(nèi)掀起的入局AIGC賽道的現(xiàn)象,我們可以清晰地看到百度、阿里、三六零等的大模型商品都是對自身產(chǎn)品和服務(wù)的進(jìn)階。