ACM圖靈大會開幕,王海峰解讀文心大模型3.5最新進(jìn)展
7月28日-30日,頂級學(xué)術(shù)會議ACM中國圖靈大會在武漢舉辦,圍繞“通用智能,人機(jī)共生”主題,圖靈獎得主、中國科學(xué)院院士、企業(yè)代表等與會探討尖端技術(shù)及人工智能發(fā)展,展望計(jì)算科學(xué)未來。百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰解讀文心大模型的核心技術(shù),闡述人工智能產(chǎn)業(yè)模式,為人工智能技術(shù)及產(chǎn)業(yè)發(fā)聲。據(jù)了解,文心一言已成為百度員工工作中的 “超級助理”,Comate智能編碼伙伴幫助80%百度工程師提升編程效率,改變了程序開發(fā)模式,吸引100多家合作伙伴。
飛槳開發(fā)者數(shù)量已達(dá)到750萬
當(dāng)前,人工智能已經(jīng)成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,而深度學(xué)習(xí)是其關(guān)鍵核心技術(shù),具有很強(qiáng)的通用性,呈現(xiàn)出標(biāo)準(zhǔn)化、自動化、模塊化的工業(yè)大生產(chǎn)特征,推動人工智能進(jìn)入工業(yè)大生產(chǎn)階段。大模型具有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn),成為人工智能發(fā)展的主流方向。
人工智能時(shí)代,IT技術(shù)棧發(fā)生根本性改變,從芯片、操作系統(tǒng)和應(yīng)用三層架構(gòu),轉(zhuǎn)變?yōu)樾酒?、框架、模型、?yīng)用四層架構(gòu)。深度學(xué)習(xí)框架和大模型構(gòu)成了產(chǎn)業(yè)智能化基座,支撐各行各業(yè)的應(yīng)用智能化重構(gòu)。

百度在“芯片-框架-模型-應(yīng)用”人工智能四層技術(shù)棧全面布局,自研的深度學(xué)習(xí)平臺飛槳支撐了文心大模型的高效訓(xùn)練和推理,截至目前飛槳平臺開發(fā)者數(shù)量已達(dá)到750萬。IDC報(bào)告顯示,百度穩(wěn)居中國深度學(xué)習(xí)平臺市場綜合份額第一。根據(jù)中國信通院發(fā)布的《深度學(xué)習(xí)平臺報(bào)告(2022)》,飛槳是中國深度學(xué)習(xí)市場應(yīng)用規(guī)模第一的深度學(xué)習(xí)框架和賦能平臺。
據(jù)IDC報(bào)告,文心大模型綜合評分第一
算法模型第一,行業(yè)覆蓋第一
據(jù)了解,文心一言是百度自主研制的知識增強(qiáng)大語言模型,首先從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學(xué)習(xí)得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)和提示等技術(shù),并具備知識增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)等技術(shù)優(yōu)勢。
王海峰解讀了文心大模型3.5的核心技術(shù)創(chuàng)新,通過飛槳與文心協(xié)同優(yōu)化,文心大模型3.5實(shí)現(xiàn)了基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)等,模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。
在基礎(chǔ)模型訓(xùn)練上,采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,加快了模型迭代速度,顯著提升了模型效果和安全性。同時(shí),百度研發(fā)團(tuán)隊(duì)創(chuàng)新了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎勵(lì)模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場景適配能力。
在知識增強(qiáng)和檢索增強(qiáng)基礎(chǔ)上,文心大模型3.5提出了“知識點(diǎn)增強(qiáng)技術(shù)”,使得模型能夠更好地利用精細(xì)的知識點(diǎn)來提升理解生成等方面的能力,進(jìn)而提升對世界知識的掌握和運(yùn)用。
在推理方面,通過大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識建模、多粒度語義知識組合以及符號神經(jīng)網(wǎng)絡(luò)技術(shù),提升文心大模型3.5在邏輯推理、數(shù)學(xué)計(jì)算及代碼生成等任務(wù)上的表現(xiàn)。
文心大模型3.5還新增了插件機(jī)制,包括官方插件百度搜索和ChatFile,使得文心一言能夠生成實(shí)時(shí)準(zhǔn)確信息和長文本摘要,拓展了大模型能力邊界。
根據(jù)IDC最新發(fā)布的《AI大模型技術(shù)能力評估報(bào)告,2023》,百度文心大模型3.5在14個(gè)參評模型中拿下12項(xiàng)指標(biāo)的7個(gè)滿分,得到“綜合評分第一,算法模型第一,行業(yè)覆蓋第一”三個(gè)絕對第一。
Comate幫助80%百度工程師提升編程效率
已吸引100多家伙伴
王海峰在演講中展示了文心一言的問答對話、文案生成、行程規(guī)劃等能力,以及在辦公、會議、編碼等場景的應(yīng)用。
文心一言先是根據(jù)要求寫了一篇贊美“茶”的文章,全文贊美“茶”卻未出現(xiàn)“茶”字,接下來又規(guī)劃了“武漢一日游”的行程安排,確保能游覽黃鶴樓,能吃到地道的武昌魚,還創(chuàng)作了以“圖靈大會”為題的藏頭詩。
工作中,文心一言化身“超級助理”,幫助總結(jié)工作溝通要點(diǎn),實(shí)時(shí)記錄會議內(nèi)容,形成會議議題、摘要及總結(jié)等關(guān)鍵信息,可以通過各類插件完成指令任務(wù),包括查詢?nèi)粘?、?chuàng)建會議、設(shè)置待辦、申請休假等,也可以在工程師編碼過程中自動推薦和生成代碼。據(jù)悉,目前這些功能已通過智能工作平臺“如流”應(yīng)用于百度的工作流程中,Comate智能編碼伙伴幫助80%百度工程師提升編程效率,吸引100多家合作伙伴。
對于大模型的產(chǎn)業(yè)模式,王海峰表示,在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù),支撐產(chǎn)業(yè)智能化升級。
ACM圖靈大會開幕,王海峰解讀文心大模型3.5最新進(jìn)展的評論 (共 條)
