百度吳甜:大語(yǔ)言模型在應(yīng)用中成長(zhǎng),產(chǎn)業(yè)化模式已成型
8月1日,“科創(chuàng)中國(guó)”青年百人會(huì)(后文簡(jiǎn)稱(chēng)青百會(huì))聯(lián)合百度舉辦“青·創(chuàng)·匯”高端對(duì)話,圍繞人工智能技術(shù)創(chuàng)新與產(chǎn)業(yè)發(fā)展交流研討,同時(shí)正式成立“科創(chuàng)中國(guó)”青年百人會(huì)女性工作委員會(huì)。該委員會(huì)將鼓勵(lì)更多女性投身科技創(chuàng)新事業(yè),為女性科技工作者提供展示交流平臺(tái)和職業(yè)發(fā)展支持,為推動(dòng)科技經(jīng)濟(jì)融合工作貢獻(xiàn)女性力量。

圖:“科創(chuàng)中國(guó)”青年百人會(huì)女性工作委員會(huì)成立儀式
“科創(chuàng)中國(guó)”青年百人會(huì)主席團(tuán)成員、秘書(shū)長(zhǎng),中國(guó)科協(xié)科學(xué)技術(shù)傳播中心副主任陳銳在致辭中表示,青年百人會(huì)作為青年科學(xué)家、企業(yè)家和創(chuàng)投家交流合作的平臺(tái),致力于通過(guò)組織聚合、資源整合、跨界融合,推動(dòng)青年科技工作者的成長(zhǎng)進(jìn)步?!扒唷?chuàng)·匯”高端對(duì)話是青百會(huì)打造的品牌活動(dòng),一直以青年為服務(wù)對(duì)象,以青春為重點(diǎn)話題,以創(chuàng)意、創(chuàng)新、創(chuàng)造為思想指南,以匯智匯力為目標(biāo)宗旨,共同推動(dòng)科技創(chuàng)新事業(yè)發(fā)展,為實(shí)現(xiàn)科技自立自強(qiáng)貢獻(xiàn)青年力量。

圖:“科創(chuàng)中國(guó)”青年百人會(huì)主席團(tuán)成員、秘書(shū)長(zhǎng),中國(guó)科協(xié)科學(xué)技術(shù)傳播中心副主任陳銳
“科創(chuàng)中國(guó)”青百會(huì)輪值主席、百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜在現(xiàn)場(chǎng)分享了大模型產(chǎn)業(yè)實(shí)踐與文心一言的進(jìn)展。她表示,文心一言是百度在產(chǎn)業(yè)實(shí)踐中發(fā)展而來(lái)的。2019年,百度推出了文心大模型1.0,然后持續(xù)演進(jìn)到2.0、3.0版本,今年5月份升級(jí)到3.5版本。
“文心大模型3.5相比3月份的版本,效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍,這得益于飛槳與文心的協(xié)同優(yōu)化?!眳翘鸱窒淼?,在基礎(chǔ)模型訓(xùn)練方面,文心大模型3.5采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略,并采用多種策略?xún)?yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,加快了模型迭代速度,提升了模型效果和安全性。同時(shí),創(chuàng)新了多類(lèi)型多階段有監(jiān)督精調(diào)、多層次多粒度獎(jiǎng)勵(lì)模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場(chǎng)景適配能力。此外,文心大模型3.5新增插件機(jī)制,擴(kuò)增了大模型的能力邊界。

圖:“科創(chuàng)中國(guó)”青百會(huì)輪值主席、百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜
大語(yǔ)言模型在產(chǎn)業(yè)中的應(yīng)用非常廣泛,吳甜表示百度各產(chǎn)品基于文心一言重構(gòu)應(yīng)用。例如,百度智能辦公系統(tǒng)“如流”基于文心一言上線了智能總結(jié)、會(huì)議智能洞察、超級(jí)助手等多個(gè)新功能,實(shí)現(xiàn)工作模式的范式變革。再如,百度智能編碼助手Comate可根據(jù)自然語(yǔ)言的描述,生成對(duì)應(yīng)的代碼片段,支持在代碼編輯區(qū)內(nèi)根據(jù)注釋自動(dòng)生成代碼,已幫助80%百度工程師提升編程效率。
全球領(lǐng)先的IT市場(chǎng)研究和咨詢(xún)公司IDC在《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》中指出,文心大模型3.5拿下12項(xiàng)指標(biāo)的7個(gè)滿(mǎn)分,綜合評(píng)分第一,算法模型唯一滿(mǎn)分,行業(yè)覆蓋唯一滿(mǎn)分。
另?yè)?jù)近期多個(gè)公開(kāi)測(cè)評(píng)顯示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表現(xiàn);綜合能力在評(píng)測(cè)中超過(guò)ChatGPT,遙遙領(lǐng)先于其他大模型,穩(wěn)居國(guó)內(nèi)第一。
“科創(chuàng)中國(guó)”青年百人會(huì)副秘書(shū)長(zhǎng),91科技創(chuàng)始人、董事長(zhǎng)、CEO許澤瑋作《人工智能——中國(guó)彎道超車(chē)的風(fēng)口》演講,他表示人工智能從概念到現(xiàn)實(shí)引發(fā)廣泛關(guān)注,正在從專(zhuān)用智能邁向通用智能,進(jìn)入全新發(fā)展階段,也是我們推動(dòng)科技發(fā)展的重要機(jī)遇。希望通過(guò)科協(xié)等組織平臺(tái),與更多科學(xué)家一道助力科技創(chuàng)新事業(yè)。

高端對(duì)話環(huán)節(jié)設(shè)置了“青年榜樣、巾幗力量”,“技術(shù)創(chuàng)新、產(chǎn)業(yè)共振”,“科教融合、人才匯聚”三個(gè)主題方向,朗玥星光傳媒創(chuàng)始人、薪火瑞家智庫(kù)秘書(shū)長(zhǎng)張文玥,自然資源部第二海洋研究所教授唐立梅,北京數(shù)聯(lián)眾創(chuàng)科技有限公司創(chuàng)始人、CEO陳娟,杭州河貍家信息技術(shù)有限公司副總裁呂越,百度AI技術(shù)生態(tài)副總經(jīng)理周奇,中國(guó)人民大學(xué)信息資源管理學(xué)院副院長(zhǎng)錢(qián)明輝,北京航空航天大學(xué)人工智能研究院教授沙磊,廣州云創(chuàng)數(shù)據(jù)科技創(chuàng)始人盧曉晨,北京大學(xué)計(jì)算機(jī)學(xué)院研究員仉尚航,中國(guó)石化信息部副總經(jīng)理蔣楠,中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司基礎(chǔ)所副總工劉金朝等嘉賓從各自專(zhuān)業(yè)領(lǐng)域建言獻(xiàn)策、交流研討。



當(dāng)前,我國(guó)人工智能核心產(chǎn)業(yè)規(guī)模超過(guò)4000億元,擁有全球最大的應(yīng)用市場(chǎng)和最豐富的應(yīng)用場(chǎng)景。大語(yǔ)言模型與應(yīng)用場(chǎng)景結(jié)合能夠帶來(lái)顯著的落地價(jià)值。比如智能辦公、智能編程、智能營(yíng)銷(xiāo)、智能媒體、智能教育、智能金融等等。
有分析人士認(rèn)為,隨著人工智能成為各國(guó)科技創(chuàng)新的競(jìng)爭(zhēng)高地,中國(guó)的大模型也呈現(xiàn)出井噴式發(fā)展態(tài)勢(shì)。然而,真正的大模型需要深厚的技術(shù)積淀和充分的應(yīng)用反饋,不可能一蹴而就。如今,以百度文心為代表的大模型正在滲透到越來(lái)越多的領(lǐng)域,不僅能夠幫助推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)和高質(zhì)量發(fā)展,還會(huì)創(chuàng)造更大的增量?jī)r(jià)值,給產(chǎn)業(yè)發(fā)展,甚至是社會(huì)發(fā)展帶來(lái)深刻變革。