京東大模型“言犀”亮相 布局產(chǎn)業(yè)應(yīng)用賽道
作者:沈毅斌 來源:IT時報

7月13日,2023京東全球科技探索者大會暨京東云峰會在北京舉行,京東帶著自研的大模型言犀亮相峰會。與通用大模型相比,言犀融合70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強泛化能力、更多安全保障”的優(yōu)勢。
為了夯實產(chǎn)業(yè)應(yīng)用,京東推出一套大模型的完整工具,包括支撐大模型研發(fā)的基礎(chǔ)設(shè)施——言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫、混合多云操作系統(tǒng)云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。同時,依托言犀大模型,京東還發(fā)布全新升級的優(yōu)加DaaS和言犀智能兩大服務(wù)平臺。
“大模型真正實現(xiàn)自己的價值,一定是在產(chǎn)業(yè)應(yīng)用中。”京東集團CEO許冉在會上表示,大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,當產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質(zhì)的提升后,大模型才有更重要的實際價值和意義。
實際上,京東很早就開始布局大模型。2021年,京東就推出十億級模型K-PLUG,2022年推出百億級模型Vega,本次大會則展示了千億級模型。正是這樣提早布局,讓京東形成一套大模型的完整工具鏈:言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫,以及全新升級的基礎(chǔ)設(shè)施云艦、云海和京剛。
據(jù)悉,這次推出的言犀大模型不僅具備行業(yè)知識庫,沉淀了京東自己的零售、物流、健康、金融等行業(yè)Know-How,還具備100多種訓練和推理優(yōu)化工具,能將通用模型迅速轉(zhuǎn)化為專業(yè)模型。
如果將言犀AI開發(fā)計算平臺比作大模型的“訓練營”,那么向量數(shù)據(jù)庫則是大模型的“彈藥庫”。京東從2019年開始研發(fā)向量數(shù)據(jù)庫,歷經(jīng)電商大促場景磨練,向量數(shù)據(jù)庫Vearch已經(jīng)能支撐百億級高性能檢索,延時降低到毫秒級,可用性達到99.99%,已經(jīng)服務(wù)超過100家大中型企業(yè)用戶。京東將向量數(shù)據(jù)庫用于大模型預訓練,將推理成本降低了80%。
為了保障大模型擁有強大的算力支撐,京東在重慶太陽島建立了全國首個超算中心——天琴α集群,其推理速度較過去提升6.2倍,推理成本節(jié)約90%。
大會現(xiàn)場,京東演示了將通用大模型轉(zhuǎn)化為健康產(chǎn)業(yè)大模型的操作。通常,客戶完成這套流程,從數(shù)據(jù)準備、模型訓練到模型部署,需要10余名科學家花費一周時間。但利用言犀AI開發(fā)計算平臺,只需要1-2名算法人員,在數(shù)分鐘就能完成。
在金融領(lǐng)域,使用者通過AI營銷運營平臺,進行簡單的對話后,就能一站式生成營銷活動,覆蓋運營策略制定、營銷人物調(diào)度編排、搭建活動頁面、批量生成營銷文案和素材、數(shù)字化投放等方面。過去這套流程需要產(chǎn)品、研發(fā)、算法、設(shè)計、分析師5類職能人員,如今減少到1人;過去流程需要2000次人機交互,也減少到少于50次。

值得一提的是,京東云的三個核心產(chǎn)品,此次也迎來升級:全新升級的混合多云操作系統(tǒng)云艦,將GPU/NPU的資源成本降低50%,并提供行業(yè)最高的業(yè)務(wù)連續(xù)性承諾。高性能存儲平臺云海,將單集群每秒讀寫性能提升5倍,達到千萬級;時延降低50%,達到百微秒級;使用成本則降低30%。軟硬一體的虛擬化引擎京剛,將虛擬化卸載到智能網(wǎng)卡中,虛擬化損耗降至0,網(wǎng)絡(luò)性能提升高達4倍,并支持100Gb VPC網(wǎng)絡(luò),云硬盤單實例性能突破百萬IOPS。
目前,京東云深入全渠道一盤貨、供應(yīng)鏈金融科技、產(chǎn)業(yè)協(xié)同、數(shù)據(jù)中臺、數(shù)字倉庫等20多個數(shù)字化場景,已經(jīng)服務(wù)100座城市、2500+家大型企業(yè)、944家金融機構(gòu)和超250萬家中小微企業(yè)。
對于大模型的應(yīng)用實踐,京東也有明確的“三步走”規(guī)劃。目前,京東云已經(jīng)基于內(nèi)部實踐構(gòu)建了通用大模型;到今年年底這段時間,京東將經(jīng)由高復雜場景大規(guī)模錘煉,迭代出扎實的產(chǎn)業(yè)服務(wù);預計在2024年初,會將大模型能力向外部嚴肅商業(yè)場景開放。