《科技觀察》192:三個絕對第一領跑全行業(yè),解讀百度文心大模型3.5的“統(tǒng)治力”
“百模大戰(zhàn)”之際,各家的大模型能力究竟幾何,無疑是最令外界關注的。
日前,IDC最新發(fā)布的《AI大模型技術能力評估報告,2023》對此給出了參考,這是IDC首次提出AI大模型技術能力評估框架,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商參與了本次評估。

結果顯示,百度文心大模型3.5拿下12項指標中的7個滿分,綜合評分第一。此外,在代表基礎能力的算法模型和代表產(chǎn)業(yè)應用情況的行業(yè)覆蓋方面,文心大模型也都是唯一拿到第一的大模型。三個絕對第一背后,可以說充分體現(xiàn)了百度文心大模型的領先優(yōu)勢,以及其在基礎技術上的深度和產(chǎn)業(yè)應用覆蓋上的廣度。
不僅如此,此前多個公開測評也顯示,文心大模型3.5版支持下的“文心一言”中文能力突出,甚至有超出GPT-4 的表現(xiàn);綜合能力在評測中更是超過ChatGPT,遙遙領先于其他大模型。
那么,百度文心大模型為何能夠以絕對的領先優(yōu)勢實現(xiàn)全面領跑?在這背后,它究竟有何與眾不同的優(yōu)勢和競爭力?更為關鍵的是,在大模型已成為實現(xiàn)多種人工智能應用通用平臺和載體的今天,百度文心大模型又能否繼續(xù)把其優(yōu)勢轉換為勝勢,并將中國的大模型發(fā)展帶到一個全新的高度呢?
三個絕對第一領跑全行業(yè)
事實上,作為IDC首次提出AI大模型技術能力評估框架,本次《AI大模型技術能力評估報告,2023》對比的“顆粒度”可謂十分細致,如針對百度文心大模型的測評就一共分為了12項指標,其中包括3項一級指標,即服務生態(tài)、產(chǎn)品技術和行業(yè)應用;以及9項二級指標,涵蓋了算法模型、通用能力、創(chuàng)新能力、平臺能力、安全可解釋、大模型的應用行業(yè)以及配套服務和大模型生態(tài)等,同時還將大模型市場服務劃分為1-5五個層級,分數(shù)越高代表廠商能力越強,最終評估結果通過雷達圖展示。
根據(jù)IDC結果顯示,百度文心大模型實現(xiàn)了“三個絕對第一”,即綜合評分絕對第一,算法模型絕對第一,行業(yè)覆蓋絕對第一,全面超過報告中的其他廠商,不僅整體競爭力位于領先水平,同時在模型能力、工具平臺、生態(tài)布局以及行業(yè)覆蓋上優(yōu)勢明顯,并已落地到產(chǎn)業(yè)應用,具體來看:
一是,綜合評分絕對第一。在12項指標中,百度文心大模型有7項指標均處于第一的位置。其中,產(chǎn)品技術維度中的5個細分指標有4項均為第一;而服務生態(tài)維度中的生態(tài)合作為第一;行業(yè)應用維度中行業(yè)覆蓋以及能源行業(yè)也拿到了第一。

如果我們對比目前國內(nèi)主流大模型的各項指標評分,還可以發(fā)現(xiàn)百度文心大模型無論是在算法模型、通用能力、創(chuàng)新能力、平臺能力、行業(yè)覆蓋和生態(tài)合作等方面都全面超越阿里巴巴通義大模型、科大訊飛星火大模型,以及智譜AI大模型等友商的產(chǎn)品,以絕對的實力和能力領跑整個大模型市場。
二是,算法模型絕對第一。作為典型的“大數(shù)據(jù)+大算力+強算法”結合的產(chǎn)物,算法在大模型中“缺一不可”,而百度文心大模型在此次IDC評估中也獲得了算法模型維度的唯一一個滿分,同樣也體現(xiàn)了百度在大模型核心技術上的領先優(yōu)勢。
作為國內(nèi)較早投入AI領域的公司,百度可以說在AI領域有著長期的技術積累,百度自2010年開始布局人工智能,2013年建立全球首個專注深度學習研究的深度學習研究院(IDL),在AI領域的沉淀已有十余年的時間。而在大模型方面,百度自2019年就開始深耕預訓練模型研發(fā),先后發(fā)布文心知識增強系列模型,同樣也是國內(nèi)最早對大模型展開“前瞻式”研發(fā)的公司;前不久,百度正式發(fā)布文心大模型3.5版本,實現(xiàn)了基礎模型升級、精調技術創(chuàng)新、知識點增強、邏輯推理增強等,新版本在效果、功能、性能全面提升。
三是,行業(yè)覆蓋絕對第一。大模型與更多的細分場景和垂直行業(yè)結合,將會讓AI加速走入百行百業(yè),推動全行業(yè)的智能化轉型進程。而根據(jù)IDC評估結果顯示,百度文心大模型在行業(yè)覆蓋上獲得唯一滿分成績,尤其是在能源、金融、教育、醫(yī)療等領域均已經(jīng)實現(xiàn)廣泛業(yè)務布局和落地場景探索。
之所以能夠在行業(yè)覆蓋方面領先,背后正是百度文心大模型源于產(chǎn)業(yè)實踐,服務于產(chǎn)業(yè)實踐的體現(xiàn),百度在業(yè)內(nèi)率先提出了行業(yè)大模型的落地思路,并聯(lián)合國家電網(wǎng)、浦發(fā)銀行、泰康、吉利、哈爾濱市、深圳燃氣、TCL、上海辭書出版社等企業(yè)單位,合作發(fā)布了11個行業(yè)大模型,是業(yè)內(nèi)最早和廣泛深入推動行業(yè)大模型的廠商。數(shù)據(jù)也顯示,目前文心大模型已經(jīng)擁有中國最大的產(chǎn)業(yè)應用規(guī)模,目前有15萬家企業(yè)申請接入文心一言測試。百度智能云與300多家生態(tài)伙伴,在超過400個場景中已取得相當不錯的測試效果。
客觀地看,百度文心大模型以“三個絕對第一”領跑全行業(yè),其“含金量”是非常高的,既有基礎能力,又有產(chǎn)業(yè)應用覆蓋,背后不僅是百度在大模型領域前瞻洞察力、技術創(chuàng)新力的體現(xiàn),同時也是其在行業(yè)應用方面始終堅持探索新范式和新路徑,推動大模型更為廣泛落地的印證,更是其“十年磨一劍”,厚積薄發(fā)的必然結果。
深度解讀背后的“統(tǒng)治力”
俗話說,機遇往往是留給那些有準備的人。因此,不要驚訝于百度文心大模型的市場表現(xiàn),而我們要追問的是,為什么是百度,而不是其他大模型服務商能夠實現(xiàn)全面的領先呢?
回頭來看,百度文心大模型取得“第一”背后,其實得益于百度“芯片-框架-模型-應用”四層技術棧所構建的獨特優(yōu)勢。眾所周知,百度是全球為數(shù)不多的全棧布局的人工智能公司,在各個層面都有領先業(yè)界的自研技術,并形成了端到端的深度技術優(yōu)化,特別是百度自研的深度學習平臺飛槳,更是有力支撐了大模型的高效訓練和推理。

以百度文心大模型3.5版本為例,與3月份的3.0版本相比,其在效果上、效率上、功能上都實現(xiàn)了全面的迭代和優(yōu)化。在效果方面,無論是創(chuàng)作問答還是推理代碼等任務上,其能力得到了全面的提升,效果累計提升超過50%。而且在內(nèi)容安全性方面也得到了很大的提升;在效率方面,依托飛槳和文心的聯(lián)合優(yōu)化,訓練速度提升了2倍,而推理速度更提升了高達30倍;此外,在功能方面,文心大模型3.5版本新增了插件機制,而插件機制大大拓展了大模型的能力邊界,顯著提升了模型的效果和用戶體驗。
百度文心大模型3.5之所以能夠保持快速迭代,背后的“制勝秘訣”可以從幾個維度來做觀察:
在基礎訓練方面,百度文心大模型3.5依托飛槳的自適應混合并行訓練技術及混合精度計算策略,并采用多種策略優(yōu)化數(shù)據(jù)源和數(shù)據(jù)分布,使得預訓練大模型的訓練效率和效果都得到了顯著提升。此外,百度文心大模型研發(fā)團隊創(chuàng)新了多類型多階段有監(jiān)督精調、多層次多粒度獎勵模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術,也使模型效果及場景適配能力進一步顯著提升。
百度文心大模型3.5還在知識增強和檢索增強的基礎上,也進一步創(chuàng)新了知識點增強技術,使得模型能夠更好地利用精細的知識點來提升模型的理解生成等方面的能力。
而在推理方面,百度也通過大規(guī)模邏輯數(shù)據(jù)構建、邏輯知識建模、粗粒度與細粒度語義知識組合以及符號神經(jīng)網(wǎng)絡技術,顯著提升百度文心大模型3.5在邏輯推理、數(shù)學計算及代碼生成等任務上的表現(xiàn)。

除了在技術創(chuàng)新方面多年沉淀的自研技術優(yōu)勢之外,百度在生態(tài)方面同樣走在了業(yè)界的前列。百度文心形成了企業(yè)、教育、社區(qū)“三位一體”的大模型生態(tài),目前有750萬的開發(fā)者基礎,20萬的企業(yè)生態(tài)基礎,形成從多層次人才培訓、企業(yè)賦能、社區(qū)互動的生態(tài)體系;值得一提的是,百度還設立10億創(chuàng)投基金鼓勵大模型創(chuàng)意、繁榮大模型生態(tài)。
通過深度解讀百度文心大模型的技術創(chuàng)新能力,可以看到其在市場上全面領先的背后并非是“一蹴而就”的,所有的這些技術創(chuàng)新,都是依托百度在人工智能和自然語言處理領域的多年的積累和深耕達成的,而這也正是百度文心大模型能夠在“百模大戰(zhàn)”中脫穎而出的關鍵,更是其能夠在未來的市場競爭中構建起“統(tǒng)治力”的核心所在。
為產(chǎn)業(yè)提供“更優(yōu)”的選擇
毫無疑問,當下生成式AI行業(yè)鮮花著錦,諸多大模型爭相問世,在此背景下IDC發(fā)布的《AI大模型技術能力評估報告,2023》應該說不僅讓整個業(yè)界更好的了解到了國內(nèi)大模型的發(fā)展狀態(tài),為企業(yè)發(fā)展和投資選型大模型提供了借鑒和參考,同時其中的一些分析和觀察也引發(fā)出了更多的思考。
第一,盡管未來所有的企業(yè)都會強依賴大模型,所有的產(chǎn)品都會基于大模型來開發(fā),但并不意味著所有的企業(yè)都要自己投資開發(fā)大模型。根本的原因在于,真正從底層做起來的大模型成本非常高,從大模型所需要的最基本的“算力+數(shù)據(jù)+算法”來看,大模型對于算力規(guī)模要求非常大,性能也要求高;此外,數(shù)據(jù)規(guī)模大,收集、挖掘、建設、篩選、清洗這些數(shù)據(jù)本身也是一項巨大的工程;更為重要的是,大模型由于參數(shù)巨大,其訓練難度高、成本也很高。
第二,由于大模型訓練的成本極高,大模型要更快地深入千行百業(yè)產(chǎn)生價值,其產(chǎn)業(yè)化落地之路也需要盡快探索出新路徑和新方式。例如,大模型的產(chǎn)業(yè)模式類似芯片代工廠的模式,一些具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè),可以將模型生產(chǎn)的復雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務,這種產(chǎn)業(yè)化路徑的探索與創(chuàng)新,目前已在百度文心大模型產(chǎn)業(yè)實踐中得到了驗證,可以說也能為整個大模型產(chǎn)業(yè)化提供全新的參考價值。
第三,對于普通開發(fā)者和中小企業(yè)而言,未來更加“務實”和“接地氣”的做法,就是選擇適合自己的大模型服務商,借助通用大模型的平臺能力,開發(fā)或者“封裝”屬于自身領域型或者行業(yè)型的應用,同樣也可以起到“事半功倍”的效果,更能夠“站在巨人的肩膀上”打造差異化競爭優(yōu)勢。

從這個角度來看,在目前整個的大模型產(chǎn)業(yè)中,百度文心大模型以其多年的積累和沉淀,以及不斷探索大模型技術創(chuàng)新的“無人區(qū)”,讓其技術能力的領先性走在了整個行業(yè)的前列,同時其在行業(yè)落地方面的表現(xiàn),也能夠讓更多的中國企業(yè)將大模型更快的“內(nèi)化”為自身的生產(chǎn)力工具,這是百度文心大模型之所以能夠力壓眾多大模型服務商,在整個大模型行業(yè)中領跑的關鍵原因,也是未來持續(xù)引領大模型技術進化和升級的優(yōu)勢和勝勢所在,相信這種能力也能夠在中國企業(yè)實現(xiàn)智能化轉型升級過程中,提供“更優(yōu)”的大模型選擇。