大廠搶做ChatGPT,百度能否狂飆?


文丨光錐智能 周文斌
ChatGPT席卷全球,在中國疊加出了一個更強沖擊波。
如今,從市值千億的互聯網企業(yè)高管,到路邊賣菜的大爺大媽,大家都樂此不疲的在談論ChatGPT,比如事前讓它幫忙“算一卦”,或者聊聊誰將被優(yōu)先替代。用網友的話說,ChatGPT出現之后,就像村里來了個免費算命的。
當然,要說通用人工智能取代大部分人類的工作那肯定還比較遙遠,但它仍然在科技圈扔下了一枚原子彈。
在二級市場,包括百度、網易有道、360等幾乎所有和ChatGPT沾上邊的企業(yè),股價都在近期拔地而起。而在股價高漲的背后,企業(yè)也都在試圖搭上ChatGPT這輛快車。
2月7日開始,百度率先宣布了自家類ChatGPT產品的名字,之后網易有道宣布在教育場景研發(fā)類ChatGPT技術,阿里、騰訊、京東也都紛紛表態(tài)。
但從全球范圍來看,ChatGPT這顆原子彈還是率先在搜索引擎領域炸開。
比如微軟拿到ChatGPT之后的第一件事,就是將其和搜索引擎Bing結合,并且已經在近期展開內測;谷歌也聞訊而動,倉促發(fā)布Bard,并也表示要在搜索領域落地。在國內,百度文心一言發(fā)布后,CEO李彥宏今年一季度的OKR也被媒體扒了出來,寫著要“引領搜索體驗的代際變革”。

除了搜索之外,ChatGPT的應用也在向其他領域延伸,比如微軟計劃將其接入包括云業(yè)務在內的所有產品線。百度文心一言發(fā)布后,小度隨后發(fā)布了首款搭載ChatGPT同源技術的平板產品。除此之外,以ChatGPT為代表的大模型在自動駕駛、翻譯、文本撰寫等方面也都有落地。
顯而易見,AI將會逐漸波及到幾乎整個信息技術行業(yè)——讓所有的業(yè)務用AI重新做一遍。
而在中國,百度是第一家公布類ChatGPT的公司,也是最大的搜索引擎公司。那么,在All in AI之后的第六年,ChatGPT來了,百度將會發(fā)生哪些變化?機遇和挑戰(zhàn),哪個對百度更多一些?
01 誰能率先做出中國ChatGPT ?
2月7日,百度公布了自家類ChatGPT的產品名稱文心一言,成為ChatGPT席卷全球之后第一家跟進相關產品的國內企業(yè)。從這往后,網易有道、京東、阿里、騰訊紛紛表態(tài),相關計劃已提上日程。做一款類似ChatGPT的產品,成為當前許多企業(yè)最緊迫的一件事情。
不過,雖然現在投入類ChatGPT研發(fā)的企業(yè)如過江之鯽,但也有業(yè)內人士指出,大多數做同類產品的企業(yè)只是在原有的產品里加入了一個BOT,因為并不是每家公司都具備自己建語料庫和特征工程的能力,畢竟做這件事情不僅花錢多,而且效果還不一定好。
所以這里面其實就涉及到一個問題,即做一個類ChatGPT產品到底需要具備哪些底層能力。
比如ChatGPT基于GPT-3.5這個大語言模型訓練,使用了約45TB數據,包含約1萬億個單詞的文本內容。這些數據顯然不是從網上爬取下來就能用,有做模型訓練的工程師就提到,他們之前訓練模型時使用了某社交平臺的數據,導致該模型“除了罵人什么都不會”。
所以對于模型訓練來說,高質量且大規(guī)模的數據來源本身就是一個問題,而要訓練如此大規(guī)模的數據也太燒錢,有數據顯示,GPT-3訓練的硬件和電力成本就達到1200萬美元。
這其實也是為什么OpenAI和Anthropic會分別接受微軟和谷歌投資的原因。除了背靠大樹好乘涼之外(給到充足的資金和落地場景),微軟、谷歌都分別和OpenAI、Anthropic簽訂了大型的云計算供應合同。就像周鴻祎說的:“這個東西最終還是要拼算力的?!?/strong>

除了算力的支持,ChatGPT的訓練需要引入“人工標注數據+強化學習”來不斷Fine-tune(微調)預訓練語言模型,以此來讓大語言模型(LLM)學會理解人類的命令指令的含義,以及讓LLM學會判斷對于給定的prompt輸入指令(用戶的問題),給出什么樣的回答才是優(yōu)質的。
整體上,這都反映了ChatGPT背后,對于大語言模型、數據來源、特征工程等更具體的工程性的問題。所以就像張朝陽在節(jié)目《星空下的對話》中一直堅持的那樣,ChatGPT的產生,是從量變到質變,它積累了很多年,絕對不是一個新企業(yè)進去就能做好的技術。
那什么樣的企業(yè)更適合做中國的ChatGPT呢?周鴻祎的答案是有搜索業(yè)務的公司,他認為做搜索的公司在這方面有許多優(yōu)勢。
比如在算力方面,做搜索的公司都有服務器集群。在數據積累和自然語言處理方面,搜索引擎本身需要每天在全網爬取所有的網頁,而人類真正積累的知識庫就存在在這些網頁里;同時搜索本身就需要做大量的自然語言處理,和人類知識標注,這些都是GPT模型必備的基礎。
“GPT模型做出來之后,它實際上像剛具備學習能力的小朋友一樣,并不會馬上表現出很強悍的智能,它需要用戶不斷的使用,而搜索引擎每天有巨大的用戶流量,有用戶每天的carry,有搜索詞可以對它進行修正和持續(xù)不斷的訓練,這個飛輪才能不斷的越轉越快?!敝茗櫟t提到。
而回過頭來,從搜索業(yè)務的角度來看,國內做ChatGPT最有優(yōu)勢的自然是百度,作為看家本領,百度搜索坐擁千億級全網索引,覆蓋超50億實體的中文知識圖譜。
此外,從2017年百度宣布All in AI到今天的6年多里,百度還建立了全棧AI技術構架,百度將這樣的技術構架分為四層,分別是芯片層、框架層、模型層和應用層。

比如在底層算力層面,百度在2020年發(fā)布了第一塊專注于數據中心和云計算業(yè)務的量產AI芯片昆侖芯1代。目前,昆侖芯已經量產了兩代,并達到數萬片規(guī)模部署。
比如在框架層,百度飛槳深度學習平臺集深度學習核心框架、基礎模型庫、端到端開發(fā)套件和豐富的工具組件于一體,到2022年5月,飛槳官方支持的產業(yè)級開源算法模型超過500個,發(fā)布了23個PP系列模型。到2022年12月,飛槳已匯聚 535 萬開發(fā)者。
而基于飛槳深度學習平臺,百度訓練了文心大模型。在去年AI繪畫火熱的時候,百度基于文心大模型推出了AI繪畫平臺文心一格。
到2022年11月,文心已累計發(fā)布11個行業(yè)大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域,推動行業(yè)的智能化轉型升級,這也讓百度在大模型的應用上積累了豐富的經驗。
整體上,從算力到應用,百度在各個層面都有關鍵的自研技術,這其實也是為什么百度能在ChatGPT上線僅僅兩個月后,就能迅速宣布推出自家的類ChatGPT大模型,并給出具體上線日期的原因。
有業(yè)內頂尖的NLP專家對光錐智能表示,認為百度的NLP能力在中國是最好的,但真正做出像ChatGPT同等水平的產品,可能至少還需要一年。不過百度已經確認,文心一言“3月和大家正式見面”。
02 搜索對百度不只是防御戰(zhàn),更是一場攻堅戰(zhàn)
正如最適合做“ChatGPT”的是搜索公司一樣,ChatGPT落地的第一戰(zhàn)也將從搜索展開。
比如微軟在“拿到”ChatGPT之后,第一件事就是將其與Bing搜索相結合,緊跟著谷歌也表示將推出類似的模型,并以“搜索伴侶”的形式使用。
在國內,百度發(fā)布文心一言的第二天,有媒體就扒出來了李彥宏2023年第一季度的OKR—“引領搜索體驗的代際變革”。搜索,這個互聯網1.0時代的業(yè)務在人工智能時代被ChatGPT再次推到了風口浪尖上。

作為第一家將搜索和ChatGPT結合的企業(yè),微軟目前已經開放融合了ChatGPT的Bing的全球內測。
新版本的Bing沒有搜索欄,取而代之的是一個寫著“向我提問吧”的對話框,用戶可以在其中輸入問題并展開對話。
和傳統(tǒng)搜索只能通過關鍵詞給出結果展示,然后由用戶自己在海量信息中篩查有效內容不同,升級后的Bing可以幫助用戶完成這個信息篩選和內容整理過程。
比如根據微軟發(fā)布會上的展示,用戶可以讓新版Bing編寫一份為期五天的墨西哥城旅行行程單并且轉化成一封電子郵件,隨后發(fā)送給他的家人。除此之外,在Bing給出的示例中,還涉及到包括做計劃安排、寫詩和創(chuàng)作故事、制定菜單、提供買車建議等等生活的方方面面。
如果說上一代搜索引擎搜索的是信息,那升級后的搜索引擎搜索的就是知識,并且可以通過這種方式,成為用戶的“全職助手”。
事實上,隨著移動互聯網的發(fā)展越來越成熟,搜索作為PC互聯網時代的產品一直都面臨著許多挑戰(zhàn)。
比如移動APP將互聯網的信息割裂成一個又一個孤島,在這樣的背景下,搜索變得越來越場景化,搜索需求也在被不斷分化。比如越來越多年輕人將小紅書作為搜索的第一選擇,同時微信、今日頭條、知乎、B站都有自己的獨特的信息和展現形式。
而隨著搜索的場景和需求被逐步解構,這塊業(yè)務放在公司整體估值上也通常會被低估。而目前,無論是百度還是谷歌,搜索業(yè)務在營收中的占比都在60%左右,這其實也直接影響了百度和谷歌的估值。
但新一代產品的升級,再次讓市場對搜索引擎可以應用的場景有了更多期待,估值也自然水漲船高。一個最直接的表現是,在宣布自己類ChatGPT產品文心一言的名字之后,百度股價當時就上漲的超13%。

如今,隨著ChatGPT對傳統(tǒng)搜索能力的提升,“搜索”這個產品的定義也將被改寫,所以這不僅對百度來說是一場“老樹煥新”的機會,對于只在全球搜索市場占比2.46%的微軟必應也是難得的一次開疆擴土的機會。
所以說,推出中國版ChatGPT,然后接入搜索,對于百度來說不只是一場防御戰(zhàn),更是一場攻堅戰(zhàn)。
03 用AI將傳統(tǒng)業(yè)務再做一遍
除了百度、微軟和谷歌之外,AI對企業(yè)的影響也越來越大。
1月27日,美版頭條BuzzFeed宣布使用ChatGPT來創(chuàng)作之后,股價在兩天里暴漲了306.94%。2月8日,網易有道宣布投入到ChatGPT同源技術在教育場景的落地研發(fā),當前股價盤前漲超20%。
類似的例子還有很多,最近只要有公司宣布正在研發(fā)類ChatGPT的產品,無論是否有實際進展,股市都會先漲為敬。
雖然這種現象背后有炒作和跟風的因素,但這其實也宣告了一種潛在的變化,即二級市場的投資者對企業(yè)估值邏輯的改變。
在互聯網行業(yè)的估值邏輯里,我們通常更關注營收、用戶規(guī)模、MAU等數據及其增速,但如今投資者更關心一家企業(yè)是否具備下一代技術能力。
而在這個時代,AI已經被當成底層技術,被認為是今后推動企業(yè)發(fā)展的重要底層驅動力。

而具體到百度、微軟或者谷歌這樣的企業(yè)來說,ChatGPT要改變的顯然不只是搜索,而是所有的業(yè)務線。
以百度為例,在云業(yè)務上,百度一直強調智能云的標簽,其特點它能夠將AI的能力賦能到具體的場景中,比如實現某些具體場景的數據識別、清洗、分類的自動化等等,并以此來提高效率。
如果百度智能云與百度文心一言結合,那使用百度智能云的企業(yè)就可以直接調用文心一言的能力來解決自己場景里的具體問題。
這其實也是微軟為什么需要將ChatGPT接入它的Azure云服務中的原因。所以這其實代表一種趨勢,即在未來的云業(yè)務中,競爭將越來越聚焦智能,而不只是存儲帶寬和算力。
從最新的財報數據來看,百度2022年三季度核心收入為人民幣252億元,同比增長2%。其中,廣告收入為人民幣187億元,相比第二季度增長10%;非廣告收入為人民幣65億元,同比增長25%,主要受百度智能云及其他AI驅動業(yè)務的推動。而隨著文心一言接入百度智能云,顯然這樣的驅動力還將持續(xù)增長。
除此之外,大模型也已經成為自動駕駛能力提升的核心驅動力。
比如通過10億以上參數規(guī)模的大模型訓練小模型,能夠顯著提高自動駕駛的感知泛化能力。這種技術諸如特斯拉、毫末等自動駕駛企業(yè)都在應用。
具體到百度而言,百度自動駕駛基于文心大模型數千種物體識別能力訓練的圖文弱監(jiān)督預訓練模型,能夠大幅擴充自動駕駛語義識別數據,如特殊車輛(消防車、救護車)識別、塑料袋等,自動駕駛長尾問題解決效率指數級提升。

截至2022年第三季度末,百度Apollo自動駕駛出行服務平臺“蘿卜快跑”向公眾提供的乘車次數已累計達到140萬,是全世界最大的自動駕駛出行服務商。而隨著文心一言在百度自動駕駛方面的應用,或將加速推進百度自動駕駛的落地和服務的增長。
除了智能云和駕駛業(yè)務外,百度的一些創(chuàng)新業(yè)務也將受到類ChatGPT產品的影響。
比如小度智能音箱,根據RUNTO1月份發(fā)布的2022年中國智能音箱市場調研報告數據,2022年中國智能音箱綜合全年銷量僅2631萬臺,同比下降達 28%。
對于智能音箱,許多購買過的用戶都表示更像一個雞肋,所謂的智能更像是一個“智障”。而且相比于其他電子產品,當前不同品牌之間的智能音箱功能基本雷同,也沒有太多革命式的創(chuàng)新可以刺激消費者換代。
而類ChatGPT應用出來之后,與智能音箱結合必然會變得更加智能,而有作為私人秘書一樣的ChatGPT作為樣例,智能音箱必然也將打開更多剛性的需求場景。
比如百度旗下的小度音箱在2月8日就已經宣布推出旗下首款搭載ChatGPT同源技術的教育硬件產品—小度光學護眼學習平板。使用這款新的產品用戶可以體驗作文批改和主動潤色等AI功能。

據了解,用戶在該產品上已經可以體驗作文批改和主動潤色等AI功能,更多基于ChatGPT同源技術的功能和體驗后續(xù)將在該產品陸續(xù)上線。
就像小冰公司CEO李笛所言,對于科技企業(yè)來說,它的商業(yè)格局由它的技術創(chuàng)新所代表,這在全球范圍內都一樣。大模型的出現打破了之前已經進入瓶頸的商業(yè)格局,大模型代表一種新的思想,如果你使用,就有可能抓住未來幾年集中的創(chuàng)新,如果不使用,你就可能在這個新的時代落后了。
如今,行業(yè)結合ChatGPT已經成為一種趨勢,比如有廣告公司已經開始使用ChatGPT撰寫營銷文案,有新聞網站開始使用ChatGPT編寫新聞等等。
比如2月14日,包括澎湃新聞、每日經濟新聞、重慶日報報業(yè)集團在內的7家傳媒巨頭同時宣布將全面體驗并接入文心一言的能力。
作為文心一言首批生態(tài)合作伙伴,這些媒體或能借助AI的能力,在智慧內容、數字文傳、產教融合、智能營銷等方面實現產品和內容創(chuàng)新,并帶來顛覆式變化。而顯然,未來這樣的生態(tài)還將擴展到更多的行業(yè)。
就像20年前互聯網可以將傳統(tǒng)行業(yè)重做一遍一樣,未來AI也將重塑目前大多數行業(yè),這個過程中,許多商業(yè)價值也將得到挖掘。而當AI的潛力在具體的業(yè)務上得到發(fā)掘,如百度、微軟、谷歌等企業(yè)價值也將面臨重估。
市值排行榜或將面臨一次新的洗牌也猶未可知。