京東加入牌局,為何“言犀”大模型只針對數(shù)智供應鏈產(chǎn)業(yè)?
劉強東曾在2017年表示,AI不僅是一種技術,也是一種思考方式。他甚至想象過京東未來實現(xiàn)無人辦公的場景。在當前的技術大變革時期,公司的命運正處于關鍵的轉折點。劉強東意識到,大型模型這種顛覆性技術的影響是無法忽視的。那么,京東將如何應對這場技術革命呢?
面對這場底層沖擊,不同的企業(yè)采取了不同的策略。自創(chuàng)立以來,京東已經(jīng)從中關村的一個柜臺發(fā)展成為擁有5家上市公司和3家正在尋求上市的公司集團,與阿里巴巴、騰訊和字節(jié)跳動相比,京東的業(yè)務場景更加復雜和多元,涉及物流、零售、金融、健康和工業(yè)等領域。
京東的產(chǎn)業(yè)場景多元化以及天然的to B(面向商業(yè))市場特點,使其對大型模型服務產(chǎn)業(yè)的需求更加迫切。因此,京東成為了大型模型落地產(chǎn)業(yè)的最佳實踐場所,其多元化的產(chǎn)業(yè)場景和天然的to B市場使其對大型模型服務產(chǎn)業(yè)的需求更加強烈。
京東對AI的理解
2023年2月,京東宣布將發(fā)布服務產(chǎn)業(yè)的大模型,這一消息在京東集團內部引起了高度關注并被提升到了更高的優(yōu)先級,京東成立了專門的大模型項目組。
大模型的訓練需要大量的產(chǎn)業(yè)數(shù)據(jù)做預訓練,這些數(shù)據(jù)分布在京東零售、健康、物流、金融等各個產(chǎn)業(yè)線。因此,集團協(xié)調各個BG(事業(yè)群)和BU(事業(yè)部)都參與大模型項目。
何曉冬博士,京東探索研究院院長及京東科技智能服務與產(chǎn)品部總裁,同時也是京東自研“言犀大模型”的核心科學家,他指出,以零售為例,人們的購物行為通常是事件驅動的,即從“我要買什么”開始,但隨著大模型技術的應用,購物行為可能從“我要干什么”開始,這意味著購物行為包括了小紅書的種草、抖音的內容以及京東的貨架,混合了多種形態(tài)。
京東圍繞著數(shù)智供應鏈積累下的高質量原生數(shù)據(jù),而剩下70%來源于通用數(shù)據(jù)。為了處理行業(yè)數(shù)據(jù)并將其轉化為可供機器學習的格式,還需要對數(shù)據(jù)進行脫敏、分類以及加權處理。不同行業(yè)的數(shù)據(jù)加權系數(shù)也不同,例如金融領域的業(yè)務數(shù)據(jù)權重會更多一些,以幫助員工更好地把控風險;而在零售領域,又需要根據(jù)不同類型的業(yè)務單元(如倉儲、商城、社區(qū)團購、到家、超市等)對細分的業(yè)務場景的重要性進行不同的加權處理。
在基礎設施上,京東云建立了一個集成了英偉達最先進的計算和連接設備的機房,擁有超過1000張(A100)顯卡。京東還在同步采用大模型改造內部流程,發(fā)起了一個名為“效能提升”的項目,讓程序員運用大模型產(chǎn)品工具來提高敲代碼、寫注釋以及測試案例的效率。綜合評估下來,業(yè)績平均估計提升了20%以上。
在產(chǎn)品層面上,除了智能客服外,京東開始內部測試言犀大模型在諸多業(yè)務場景中的應用。比如在產(chǎn)品搜索與推薦方面,電商將很快從“萬事皆搜索”進入到“萬事皆服務”的時代。
何曉東認為生成式人工智能是一個與移動互聯(lián)網(wǎng)時代完全不同的物種。 與移動互聯(lián)網(wǎng)時代相比,京東的探索更具前瞻性,更適合商業(yè)。他預測,現(xiàn)在大型模型技術已經(jīng)到了需要通過產(chǎn)品證明其價值的階段,它提高了生產(chǎn)力,最終會服務于各個行業(yè),所以一定要到行業(yè)去。
“技術和產(chǎn)品其實是有差距的,AI技術要更貼近產(chǎn)品,更深入理解用戶需求和使用場景?!?數(shù)字經(jīng)濟應用實踐專家駱仁童博士指出,產(chǎn)品必須是從用戶的角度出發(fā),技術是從創(chuàng)新的角度出發(fā)。
這意味著,大模型與產(chǎn)業(yè)的結合越深,產(chǎn)生的價值就越大。
京東的“言犀”大模型
京東正式推出的大模型名為“言犀”,據(jù)介紹,這個模型已經(jīng)達到了千億級別的參數(shù)規(guī)模,具備了基礎層、模型層、MaaS和SaaS四層體系。內含多個行業(yè)知識庫,為企業(yè)提供百余種訓練和推理優(yōu)化工具。
其中,基礎層提供了公有云、專有云和混合云三種云計算部署方案;模型層的數(shù)據(jù)構成中,70%是通用域數(shù)據(jù),30%來自京東數(shù)智供應鏈的產(chǎn)業(yè)數(shù)據(jù);算法層面則采用了分布式訓練框架(Megatron+DeepSpeed)和京東自研向量數(shù)據(jù)庫Vearch;而MaaS層則是基于言犀大模型解耦出的底層能力。
目前京東已經(jīng)將大模型能力融入到京東零售、金融、健康等領域的成熟業(yè)務產(chǎn)品中。例如,智能客服、多模態(tài)數(shù)字人、交互式營銷、智能政務熱線、協(xié)同辦公等。京東云還提供了從10億級到千億級的大模型,以及大模型和小模型的搭配使用。
此前的發(fā)布會還公布了京東在具身智能方向的局部成果。在現(xiàn)場播放的視頻中,京東探索研究院院長何曉冬直接與一只集成具身智能的機械臂進行了多輪對話,機械臂流暢地幫何曉冬接了一杯咖啡。
同時,京東提出了大規(guī)模模型產(chǎn)業(yè)落地的“新三要素”:場景、產(chǎn)品、算力。即復雜的交互式智能場景和產(chǎn)生的動態(tài)數(shù)據(jù),從單一算法競爭到形成能夠引發(fā)系統(tǒng)性算法創(chuàng)新和突破的產(chǎn)品,以及能夠支撐這種場景和系統(tǒng)的新算力。
最后,京東還宣布“言犀”大模型將實施“三步走”戰(zhàn)略:目前,京東云已經(jīng)基于內部實踐構建了通用大模型;到今年年底這段時間,京東將經(jīng)由高復雜場景大規(guī)模錘煉,迭代出扎實的產(chǎn)業(yè)服務;預計在2024年初,會將大模型能力向外部嚴肅商業(yè)場景開放。
從目前進展來看,“言犀”的“三步走”戰(zhàn)略已經(jīng)走過了一半?;蛟S,真正的挑戰(zhàn)要等到明年京東正式向行業(yè)場景開放“言犀”大模型的能力時才會到來。
大模型的“京東模式”
國內“遍地開花”的大模型,主要有“通用模式”和“垂直模式”兩種形態(tài),然而,與通用模式和垂直模式不同的是,京東認為言犀大模型是一種“供應鏈模式”。
通用模式的大模型如ChatGPT,雖然精度高且應用廣,但對數(shù)據(jù)和算力的要求極高,成本也很高昂。這使得許多小公司難以實現(xiàn)C端的大模型變現(xiàn)路徑。同時,這些大模型也經(jīng)常出現(xiàn)“一本正經(jīng)瞎編”的現(xiàn)象,暴露了專業(yè)領域知識儲備不足的問題。因此,很多公司更傾向于有具體場景的行業(yè)大模型。
相比之下,垂直模式的大模型更適合付費能力更強的B端客戶。例如,騰訊云最近推出了金融、政府、教育等一系列行業(yè)大模型,華為也發(fā)布了面向政務、金融、制造、礦山等行業(yè)的“盤古3.0”大模型。這些垂直模式的大模型可以為行業(yè)提供更實際的商業(yè)化選擇。
數(shù)字經(jīng)濟應用實踐專家駱仁童博士表示,從ChatGPT引發(fā)科技領域的熱潮,到各類大型模型紛紛涌現(xiàn),再到產(chǎn)業(yè)落地,無論哪一種AI模型的模式,都已經(jīng)有相對應的應用場景,可以預見,新一輪的人工智能浪潮將加速滲透各行各業(yè)。
眾多業(yè)界人士都認為“所有行業(yè)都值得再次融合AI大模型”,不過實際情況是,并非所有行業(yè)都能立即采用。當前階段,要實現(xiàn)真正可用的大型模型,仍需要科技公司和行業(yè)用戶的緊密合作。京東的言犀大模型的“供應鏈模式”是基于京東在零售、物流、健康、金融等行業(yè)的知識積累,結合低門檻、高效率的生產(chǎn)平臺,為客戶提供一站式的大模型服務。
如果AI是一條河,那么各家公司的產(chǎn)品方案有的是架橋,有的是造船,各有不同,但最早AI都將加速滲透各行各業(yè)。人工智能是一項嚴肅的技術革命,誰最終越過科學研究到實際產(chǎn)品轉化,需要長期主義的心態(tài)和實踐的歷練。
附 | 其他已經(jīng)公布的大模型:
華為、字節(jié)跳動相繼入局大模型,當前的AI賽況如何?
騰訊參戰(zhàn)AI人工智能大模型,能在“百智大戰(zhàn)”的混戰(zhàn)中能殺出重圍嗎?
百度阿里、商湯華為推出AI大模型,新一輪的AI大戰(zhàn)是概念炒作還是產(chǎn)業(yè)風口?| 深度詳盤
20.65 億!王興的美團正式收購王慧文的 AI 公司光年之外
海外人工智能AI大模型的行業(yè)格局 | 深度盤點
商道童言(Innovationcases)歡迎點贊和分享哦!~~
免費電子書:結構化思維?|?荊棘商途?|?年度十詞?|?創(chuàng)新企業(yè)案例?|?區(qū)塊鏈金融
數(shù)字經(jīng)濟應用實踐專家 駱仁童主講課程
智慧應用 |《能源互聯(lián)網(wǎng)》.《新型電力系統(tǒng)》.《智慧建筑》.《智慧機場》.《智慧交通》.《煙草數(shù)字化》.《智慧城市》.《數(shù)字政府》
數(shù)字應用?|?《大數(shù)據(jù)及中臺》.《區(qū)塊鏈》.《元宇宙》
人工智能 |??《人工智能趨勢》.?《ChatGPT新紀元》
數(shù)字化轉型?|《制造業(yè)數(shù)字化》.《零售業(yè)數(shù)字化》?
金融類課程 | 《金融科技創(chuàng)新》.?《商業(yè)銀行變革》?.《數(shù)字人民幣》
思維與技能 |《數(shù)字化管理思維》.《數(shù)字化組織變革》.《用戶思維》
宏觀與趨勢 |《2023宏觀趨勢》.《數(shù)字經(jīng)濟》.《雙碳戰(zhàn)略》.《新能源汽車》
創(chuàng)新與創(chuàng)業(yè)?|《創(chuàng)業(yè)導師能力提升培訓》.《中小企業(yè)賦能》