騰訊大模型的現(xiàn)實主義:在場景中解決企業(yè)“AI焦慮”
作者:郝俊慧 來源:IT時報
這是一次要靠加快語速、提高分貝才能“搶”到提問的采訪。
7月7日下午,2023世界人工智能大會·騰訊論壇舉行前,一個狹小嘈雜的會議室里,騰訊云副總裁、騰訊云智能負責(zé)人、優(yōu)圖實驗室負責(zé)人吳運聲接受了媒體群訪。近20天前,騰訊對外正式公布MaaS全景圖,以行業(yè)大模型切入火熱的“大模型賽道”,記者們迫切地想知道,同為頭部互聯(lián)網(wǎng)企業(yè),騰訊為何避開通用大模型,選擇了一條看起來更“現(xiàn)實”的道路。
“企業(yè)需要的,是在實際場景中真正解決某個問題,而不是在100個場景中解決70%-80%的問題?!眳沁\聲表示,站在公司策略角度,騰訊更專注于解決落地實際的問題,而通用大模型不能徹底解決用戶的所有問題。

擁有中國最多個人用戶的騰訊,在新一輪人工智能浪潮來臨時,將產(chǎn)業(yè)互聯(lián)網(wǎng)AI化放在了改變的第一步。
騰訊云MaaS再升級
6月19日,騰訊云首次公布騰訊云行業(yè)大模型研發(fā)進展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),并已為傳媒、文旅、政務(wù)、金融等10余個行業(yè)提供了超過50個大模型行業(yè)解決方案。
本次世界人工智能大會上,騰訊云再次公布了多項升級。
其中,最新升級的騰訊云自研星脈高性能計算網(wǎng)絡(luò),能提升40%的GPU利用率,節(jié)省30%~60%的模型訓(xùn)練成本,為AI大模型帶來10倍通信性能提升。基于騰訊云新一代算力集群HCC,可支持10萬卡的超大計算規(guī)模。騰訊云AI原生向量數(shù)據(jù)庫,最高支持10億級向量檢索規(guī)模,延遲控制在毫秒級,相比傳統(tǒng)單機插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
在應(yīng)用創(chuàng)新方面,騰訊云行業(yè)大模型能力應(yīng)用到金融風(fēng)控、交互翻譯、數(shù)智人客服等場景中,極大提升了智能應(yīng)用效率。
行業(yè)大模型加持的金融風(fēng)控解決方案,相比之前有了10倍效率提升,通過騰訊積累超過20年的黑灰產(chǎn)對抗經(jīng)驗和上千個真實業(yè)務(wù)場景,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。在數(shù)智人領(lǐng)域,今年騰訊云推出了小樣本數(shù)字人工廠,僅需少量數(shù)據(jù)、24小時內(nèi)即可復(fù)刻2D數(shù)字分身,讓企業(yè)應(yīng)用數(shù)智人服務(wù)成本大大降低。
“事實上,過去半年多的時間里,我們一直在思考和探索,大模型和各行業(yè)結(jié)合背后最本質(zhì)的邏輯是什么?其實只有兩點:一是技術(shù)的根本出發(fā)點是解決實際問題,二是如果不能深入行業(yè)探索,便不能真正解決行業(yè)面臨的問題。”真實場景對大模型帶來的“考驗”,讓吳運聲感慨頗多。
智能客服被公認是LLM(大規(guī)模語言模型)最適用的行業(yè)。此次大會,騰訊為一家線上旅游OTA公司打造了一個行業(yè)大模型,精調(diào)后的客戶專屬模型,無需配置對話流程,即可實現(xiàn)端到端解決業(yè)務(wù)問題。提升任務(wù)完成率,降低對話構(gòu)建成本。但事實上,讓大模型真正理解客戶的問題,并非想象中那么簡單。
“在溝通過程中,客戶的思維是跳躍的、變化的。比如他剛提出要定10號的酒店,但在機器還沒回答之前,突然又說,再幫我看看11號的酒店和航班,當(dāng)AI還在對第二個需求進行反饋時,他又可能說,給我看看雙床房?!眳沁\聲指出,大模型要實現(xiàn)多意圖識別,目前還是有相當(dāng)難度,通用大模型并不能簡單解決,而是需要結(jié)合場景,特別是與客戶的系統(tǒng)交互要重構(gòu)一些非常復(fù)雜的模型。
“群模共舞”時代到來
經(jīng)過初期的喧囂之后,AI大模型如何落地商業(yè)化,企業(yè)客戶如何享受這輪AI紅利,解決“AI焦慮”,成為這屆世界人工智能大會上熱議的話題。
紅杉資本中國合伙人鄭慶生從PC互聯(lián)網(wǎng)中期開始進入投資領(lǐng)域,在他看來,每個時代的勝出者,都源自那個時代的技術(shù)原生,比如PC互聯(lián)網(wǎng)時代,人們看重電子商務(wù),結(jié)果社交軟件成了最大贏家;移動互聯(lián)網(wǎng)時代開始,人們看中社交軟件、長視頻,但短視頻占據(jù)了最多的時長,“現(xiàn)在我們并不知道,哪些AI本身產(chǎn)生的原發(fā)性場景,將改變我們的基礎(chǔ)行為?!?/p>
盡管AI原生的“殺手锏”何時出現(xiàn),還不得而知,但“入局”一定是第一步。此次WAIC集中亮相的30多個大模型中,除了百度文心一言、阿里通義、訊飛星火、商湯日日新等第一輪通用大模型之外,后來者基本都聚焦于行業(yè)大模型。
“對客戶而言,參數(shù)少、投入低,見效快的企業(yè)專屬大模型,更容易被接受,買單意愿也比較明確。”一位創(chuàng)業(yè)公司展商告訴《IT時報》記者,一些已經(jīng)在用大模型改造客服系統(tǒng)的銀行客戶,通常會選擇軟硬一體的私域部署方式,用自己已有的知識圖譜和數(shù)據(jù)訓(xùn)練和實現(xiàn)推理,既確保了數(shù)據(jù)安全,投入算力成本也不會太高,“如果只需要對一個場景進行推理輸出,算力板卡甚至在個位數(shù)便可以搞定?!?/p>
“產(chǎn)業(yè)場景已經(jīng)成為最佳練兵場,”騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生,在本次WAIC全體會議-產(chǎn)業(yè)發(fā)展論壇上曾表示,選擇具有一站式行業(yè)大模型服務(wù)能力的云廠商合作,基于行業(yè)大模型,構(gòu)建自己的專屬模型,或許是企業(yè)探索大模型應(yīng)用實踐的可行路徑。

這意味著,未來將是一個“萬模共存”的時代,每個企業(yè)都將擁有自己的大模型,而騰訊決定做新時代的賦能者。
上個月騰訊云公布的MaaS服務(wù)全景圖中提出,基于騰訊云TI平臺打造行業(yè)大模型精選商店,騰訊云可提供金融、文旅、政務(wù)、醫(yī)療、傳媒、教育等10大行業(yè),50多個解決方案。同時騰訊云推出行業(yè)大模型精調(diào)解決方案,幫助模型開發(fā)者與算法工程師,一站式解決模型調(diào)用、數(shù)據(jù)與標(biāo)簽管理、模型精調(diào)、評估測試與部署等任務(wù),減輕創(chuàng)建大模型的壓力。
在這些模型和工具平臺基礎(chǔ)上,企業(yè)只用加入自己的場景數(shù)據(jù),就可以快速生成自己的“專屬模型”。
“現(xiàn)在還是大模型發(fā)展的早期階段,我個人更希望百花齊放,大家在不同的領(lǐng)域嘗試不同的可能性?!眳沁\聲認為,人工智能的發(fā)展是一項龐大的數(shù)據(jù)工程,既要有共性的知識,也需要有專業(yè)的精深的權(quán)威知識組織,需要各方合力,才能真正使技術(shù)服務(wù)行業(yè)。
AI for Science捕獲宇宙“閃爍”
當(dāng)然,除了在產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型發(fā)揮效應(yīng),騰訊云行業(yè)大模型也加速推動大模型等AI技術(shù)在科學(xué)計算領(lǐng)域的應(yīng)用。
2021年開始,騰訊、國家天文臺、復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院聯(lián)合啟動“探星計劃”,用云+AI幫助中國天眼FAST處理每天接收到的龐大數(shù)據(jù)量,通過視覺AI分析找到快速射電暴、脈沖星線索,截至目前已發(fā)現(xiàn)30顆脈沖星。
今年WAIC上,騰訊宣布探星計劃再度取得進展,首次通過AI技術(shù)發(fā)現(xiàn)2顆快速射電暴。
快速射電暴是一種神秘的天文現(xiàn)象,每1毫秒,就會放射出太陽一整年釋放的能量,“閃爍”宇宙。但它“閃爍”頻次極低、時間極短,海量數(shù)據(jù)中極易忽視、捕捉極難,直到2007年,人類才發(fā)現(xiàn)第一顆,比脈沖星的發(fā)現(xiàn)晚了40年。
與脈沖星探索相比,要在海量數(shù)據(jù)中發(fā)現(xiàn)更低頻出現(xiàn)的快速射電暴,要求AI模型具備更高的精度、以及更快的計算速度。為了提高計算速度,騰訊針對快速射電暴探索,特別設(shè)計了一套全新的,端到端的AI算法。在同等算力下,這套全新的天文數(shù)據(jù)處理范式,推動信號處理效率相對常規(guī)處理流程提速1800倍。
此前,AI識圖前,需要先對信號圖完成繁雜的天體物理預(yù)處理,比如傅立葉變換、消色散......這些工作專業(yè)而復(fù)雜?,F(xiàn)在騰訊優(yōu)圖開創(chuàng)了一種天文數(shù)據(jù)處理的“端到端AI算法”,可以跳過預(yù)處理步驟,直接進入AI識別,效率大提升。
FAST每天產(chǎn)生數(shù)百TB 數(shù)據(jù),每周產(chǎn)生幾千萬張信號圖。面對海量數(shù)據(jù),通過“多示例學(xué)習(xí)方法+注意力機制”,騰訊云可以快速定位和識別數(shù)據(jù)中有用信息,并提供強大的底層算力支撐。
如今,騰訊云和FAST正在繼續(xù)探測250萬光年外M31仙女座的射電信號,預(yù)計不久的將來,將有更多“宇宙閃爍”被捕獲。