2023中關村論壇 | 財聯社專訪「銜遠科技」創(chuàng)始人周伯文


財聯社5月29日訊(記者郭松嶠 張玉虹)5月28日,政府代表、學界大咖、產業(yè)界領袖匯聚于2023中關村論壇“人工智能大模型發(fā)展論壇”,共話新時代的發(fā)展,分享對人工智能的思考。
銜遠科技創(chuàng)始人、IEEE/CAAI Fellow、京東集團原高級副總裁、清華大學惠妍講席教授/電子系長聘教授周伯文參加了主題為“人工智能大模型技術發(fā)展與協(xié)作創(chuàng)新”的高峰對話,他認為現在的人工智能是深層次的,人和AI協(xié)同交互的,與之前的人工智能明顯不同。論壇中,周伯文接受了財聯社專訪,針對人工智能大模型發(fā)表了更深的洞見。

一、垂直大模型底座一定具備通用大模型的能力
財聯社:垂直大模型和通用大模型是人工智能的兩個主要發(fā)展方向,您如何看待這兩個不同發(fā)展方向的商業(yè)機遇與挑戰(zhàn)?
周伯文:這兩個方向有很多共同性,我覺得不應該割裂地看待。比如說銜遠做的大模型,是在具備通用能力的基礎上,特別關注如何連接產品和消費者,企業(yè)如何通過產品創(chuàng)新更好的滿足消費者。
多跳推理、基于上下文的學習能力極度增強,是大模型系統(tǒng)能夠產生社會價值和商業(yè)價值的前提之一,但是只有這個前提還不足以產生高價的場景。我們觀察一下ChatGPT這類通用大模型的回答,可以說是外行看著像內行,內行看著像外行,專家認為是剽竊,普通人認為是創(chuàng)造。ChatGPT應用范圍廣,更適用長尾場景。而長尾場景意味著低價值場景,它的價值隨著應用范圍廣度的增加呈下降趨勢。那么,如何創(chuàng)造高價值場景呢?比如針對連接產品和消費者這個專業(yè)領域,如何更好地做產品創(chuàng)新設計、如何更好地感知消費者需求、如何更好地營銷發(fā)布,既需要模型底座具有多跳推理能力,也需要專業(yè)場景里的專業(yè)知識。
所以我認為垂直大模型的底座一定具備通用大模型的能力。打個比方,假設一個大學畢業(yè)生才有能力被訓練成一個好的產品經理。大模型底座就是大學畢業(yè)生的基本素質能力,通過專業(yè)訓練可以具備更強的專業(yè)能力。
財聯社:您能否說明一下您開發(fā)的大模型底座是什么底座?產品服務更偏向于垂直還是通用?
周伯文:我們具備的是組合的能力,有一個具備通用能力的大模型,這個大模型尤其在商品和消費者連接的領域有專長。我們有37項大模型評測指標,其中2/3是推理能力、計算能力等通用能力,還有十幾項專門應用于產品和消費者的連接,以實現銜遠的使命愿景——“讓每一件商品都應需而生,讓每一個消費者都得償所愿”。
這個使命愿景源自德魯克的一句話。德魯克說企業(yè)只有兩件事要做,一是創(chuàng)造有差異化的產品,二是讓消費者認可這個差異化并愿意購買。我把這2句話拆成了5個D:
一是Discovery,發(fā)現和洞察市場上的消費趨勢。了解消費者需要什么樣的產品,供給側有哪些產品,如何滿足消費者需求;
二是Define,根據企業(yè)能力去定義產品,做出差異化;
三是Design,包括產品外觀、供給側營銷策略設計等;
四是Develop,驅動整個研發(fā)流程,將設計變?yōu)楫a品;
五是Distribute,通過營銷使消費者更高效地找到產品,擁有更好的使用體驗。
這5個D都要求有專長,比如Discover是有能力理解消費者在不同場景下與商品之間產生的互動,Design是有能力做產品定位設計等。
財聯社:這5D在實踐中具體服務對象是誰?如何進行服務?
周伯文:前4個D服務于B端,最后1個D服務于C端。先說B端服務。自有大模型去分析大量的商品參數、不同商品之間的相關性、消費者的使用場景和體驗等,形成一定理解和深刻的洞察。有了這個洞察之后,通過上下文多輪對話系統(tǒng)——ProductGPT和企業(yè)的企劃、市場、產品人員對話,分析市場趨勢、流行產品以及消費者的應用場景和體驗,啟發(fā)企業(yè)去設計更好的產品。這些問題都需要通過非常深度的頭腦風暴得出專業(yè)性結論。如果去問ChatGPT,得到的回答多半是一本正經的胡說八道,或者沒有內涵。
C端服務是幫助消費者更好地匹配想要的商品。假設消費者身處一個新城市里,我們可以幫助他理解這個城市,了解有什么特產,類似的其他消費者有什么體驗。
總結來講,我們做的大模型和ProductGPT是一個具備通用能力,又擅長在供應鏈角度理解從產品的設計創(chuàng)意、生產制造到到消費的整個環(huán)節(jié),可以幫助更高效的連接產品和消費者,助推完成供給側結構性的改革。消費者的訴求,包括對現有產品的不滿意都能夠被AI理解,并經由AI的理解傳遞給人類去設計更好的產品。企業(yè)在生產產品之時就準確知曉消費者所好,消費者與商品的匹配達到極致高效。
二、大模型壓縮世界知識并通過深層次工作重構
財聯社:要實現極致高效,您認為大模型的核心是什么?
周伯文:大語言模型(LLM)的核心是通過對下一個詞進行預測把世界知識壓縮到一個大模型內,這也是GPT3、ChatGPT在做的事。企業(yè)的大模型通過預測人和商品在各種場景下的互動,把商品品參、人的情感體驗、文化符號等壓縮成一個模型,這會導致我們對人和商品的理解與原來完全不同。過去,我們理解人是最小單元,商品也是最小單元,人和SKU做匹配。現在新的大模型將世界知識壓縮后,再通過深層次的工作重構,能夠理解很多東西。新的大模型下,人具有更多層次的、立體的、不同場景化的維度,比如周末家庭出游與日常同事相處的需求是不一樣的。在商品層面也不再是一個簡單的SKU,而是很多品參、材質、功能、文化符號的組合。只是學習消費者買了哪個SKU,這個深度是不夠的。比如說一個人口渴去買了一瓶農夫山泉飲用水,新的大模型深刻理解消費者場景體驗后得出結論:買這瓶水與品牌、包裝等都無關,這次消費只是因為爬山口渴。
三、新的人工智能時代沒有辦法做跟隨者
財聯社:自2021年底從京東離職后,您轉去學術界,擔任清華大學惠妍講席教授、電子系長聘教授。今年2月您在朋友圈發(fā)布一則AI英雄帖,招募合伙人一起打造中國版 ChatGPT。是什么契機促使您開啟AI領域的創(chuàng)業(yè)呢?您的創(chuàng)業(yè)方向以及對標產品是什么?
周伯文:此前,我長期致力于大模型領域的前沿研究。經過20年留美回到中國后,又做了很多年人工智能在實體經濟方面的應用。我深刻認識到,人工智能技術需要不斷的突破和創(chuàng)新。底層技術在不斷迭代,我們一定要有自己的思路,而不是跟在另外一家公司的后面。
原來移動互聯網時代的創(chuàng)業(yè),更多是Copy to China。國外有一個好的模式,中國通過Copy小步快跑實現快速迭代,通過更高的效率來獲得市場的成功。但現在情況不同,我們需要去思考人工智能底層技術的原理,以及需要解決什么問題。原理與實際問題要深度的融合思考。
比如要解決剛才講的德魯克提出的兩個最重要的問題,我們需要思考什么樣的人工智能技術能夠做這個事情,而不是說其他GPT可以做歌做詩,我們也跟著做。我們可以有這個能力,但那不是我們追求的。只是跟隨的話,我們永遠不可能去創(chuàng)造性的工作。如何問出好問題,如何有自己的思考,如何有差異化的技術路線是非常重要的。我認為銜遠科技既融合了我們技術的思考,也有差異化的商業(yè)化路線。
財聯社:總結一下您在做的大模型和其他大模型相比有什么特點?
周伯文:在具備通用能力的基礎上,能更好地解決專業(yè)性的問題。我們能找到深層的、真正的價值創(chuàng)造,并通過深層的價值創(chuàng)造去倒逼底層的大模型技術不斷迭代,比如說思考怎樣更好的融合多模態(tài)。
