百度跟進(jìn)ChatGPT,為何業(yè)界并不看好?
ChatGPT火了也帶火一眾企業(yè),與之相關(guān)的上市企業(yè),不僅連續(xù)多日霸占A股漲幅榜前列,同時(shí)也在各大社交平臺(tái)上連續(xù)刷屏。與之同時(shí),國(guó)內(nèi)豪強(qiáng)并起,眾多企業(yè)紛紛拋出ChatGPT相關(guān)進(jìn)展,舉起ChatGPT的大旗,這當(dāng)中就包括百度。
2月7日,百度“官宣”對(duì)標(biāo)ChatGPT產(chǎn)品——文心一言將于3月測(cè)試并開放應(yīng)用,可以執(zhí)行廣泛的任務(wù),包括語言理解、語言生成以及根據(jù)文本生成圖像等。
與其他語言模型相比,文心一言能夠?qū)V泛的知識(shí)與海量數(shù)據(jù)相結(jié)合,從而產(chǎn)生理解與生成能力。目前,百度正在做產(chǎn)品上線前的沖刺,多答案回復(fù)、智能生成等一些相關(guān)功能已陸續(xù)在百度搜索內(nèi)上線或內(nèi)測(cè)。
不過就目前看,業(yè)內(nèi)對(duì)百度此舉并不看好。百度要想真正擁抱ChatGPT,拿成讓人滿意的產(chǎn)品,在業(yè)內(nèi)看來,至少有幾大鴻溝需要翻越。
1.成本鴻溝
據(jù)國(guó)盛證券研報(bào),這一在ChatGPT智能、順滑的溝通體驗(yàn)背后,其有著多達(dá)1750億個(gè)模型參數(shù),OpenAI主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。在算力方面,GPT-3.5在微軟Azure AI超算基礎(chǔ)設(shè)施(由英偉達(dá)V100GPU 組成的高帶寬集群)上進(jìn)行訓(xùn)練,總算力消耗約3640PF-days(即每秒一千萬億次計(jì)算,運(yùn)行3640個(gè)整日)。這僅僅指的是ChatGPT在訓(xùn)練階段消耗的算力。
這一算力對(duì)應(yīng)的成本有多大?小冰CEO李笛表示,如果小冰用ChatGPT的方式來運(yùn)行系統(tǒng),現(xiàn)在小冰每天承載的交互量就需要花近3億人民幣的對(duì)話成本。一年下來,就是千億元的成本。
摩根士丹利的分析師布萊恩·諾瓦克(Brian Nowak)也表示,就搜索而言,ChatGPT的每次查詢成本大約是谷歌傳統(tǒng)搜索查詢成本的七倍。如果OpenAI能夠使用微軟Azure云服務(wù)的最低價(jià)格級(jí)別,這個(gè)倍數(shù)可能會(huì)下降到四倍,但這仍然是一個(gè)很大的差距。
從這一角度考慮,由于目前國(guó)內(nèi)在大規(guī)模AI模型的訓(xùn)練與應(yīng)用方面與國(guó)外尚有差距,也意味著仍需巨大的資本投入,百度能否承受是個(gè)問題。
2.效率和質(zhì)量鴻溝
洛克資本副總裁史松坡稱:“在中文環(huán)境中,由于受到境內(nèi)外互聯(lián)網(wǎng)銜接的限制,ChatGPT尚未能升級(jí)反饋出類似其在英文環(huán)境中的高效效果?!?/p>
而據(jù)1月底已參與內(nèi)測(cè)的體驗(yàn)者來說,百度類ChatGPT產(chǎn)品的表現(xiàn)并不佳。
日前,有參與者發(fā)布《百度將發(fā)布類似ChatGPT的應(yīng)用?體驗(yàn)之后我很后悔》一文表示,百度類ChatGPT產(chǎn)品至少有四大問題:
生成速度較慢,生成200字大概需要30秒左右,生成質(zhì)量低;
中文生成質(zhì)量差強(qiáng)人意,完全不像是基于中文的NLP模型,非常像機(jī)器人;
英文生成質(zhì)量難以描述,基本上是不識(shí)別,不會(huì)寫;
使用有限制:?jiǎn)稳绽塾?jì)輸入上限為200條,歷史累計(jì)輸入上限為2000條,需要提額的話要申請(qǐng)。
3.信息的真實(shí)性和時(shí)效性鴻溝
在學(xué)術(shù)、科研等嚴(yán)謹(jǐn)?shù)膽?yīng)用場(chǎng)景中,ChatGPT提供的答案并不一定都正確。由于ChatGPT只提供純文本,不引用實(shí)際網(wǎng)站,目前并沒有辦法從ChatGPT 的輸出中分辨真?zhèn)巍?/p>
“ChatGPT對(duì)信息、數(shù)據(jù)來源無法進(jìn)行事實(shí)核查,可能存在個(gè)人數(shù)據(jù)與商業(yè)秘密泄露和提供虛假信息兩大隱患?!北本┯疲ㄉ虾#┞蓭熓聞?wù)所互聯(lián)網(wǎng)法律事務(wù)部主任謝連杰說。
相對(duì)于ChatGPT來說,搜索引擎的索引可以實(shí)時(shí)更新,更快更方便,但對(duì)于大型語言模型而言,添加新的內(nèi)容需要重新訓(xùn)練模型,耗時(shí)且成本昂貴。
4.廣告收入和有效信息間需要平衡的鴻溝
廣告是搜索引擎企業(yè)營(yíng)收的主要來源,2022年前三季度,廣告營(yíng)收占谷歌總收入的80%。百度也同樣如此,據(jù)其2022年Q3財(cái)報(bào),廣告占百度當(dāng)季營(yíng)收的57.4%。
ChatGPT 生成的結(jié)果是以信息歸納為主,利用這種搜索方式,用戶就會(huì)減少在鏈接間跳轉(zhuǎn)、瀏覽的時(shí)間,也就減少了廣告投放的空間,這會(huì)使搜索引擎的盈利模式發(fā)生根本性的變化。
百度主要以競(jìng)價(jià)排名為主,給錢最多的廣告排在前頭。如此一來,如何在有效信息和廣告推廣間找到平衡就成了百度能否維系廣告盈利的重中之重。
如果側(cè)重于廣告,所謂“文心一言”,豈不要變成“錢心一言”,給出的信息內(nèi)容全是誤導(dǎo)人的“莆田系”?如果側(cè)重于信息的有用性,又該如何讓廣告金主慷慨解囊?
所以在部分業(yè)內(nèi)人士看來,即便3月份以及將來,百度真能將ChatGPT嵌入到搜索,其服務(wù)范圍也一定是謹(jǐn)慎的有選擇性的,更多是類似“北京和上海GDP誰更高”一類封閉式問題,不過,真要如此的話,ChatGPT有魅力又何在?
5.盈利鴻溝
ChatGPT火了,但火了并不意味著盈利。事實(shí)上,OpenAI仍是一家處于虧損中的創(chuàng)業(yè)公司。
不久前,微軟宣布將對(duì)OpenAI進(jìn)行為期數(shù)年、價(jià)值數(shù)以十億計(jì)美元的投資,而在這筆投資的背后,是 OpenAI 為了訓(xùn)練人工智能和維持公司發(fā)展而產(chǎn)生的每年高達(dá) 5 億美元的虧損。
“ChatGPT目前的市場(chǎng)容量和應(yīng)用場(chǎng)景依然有限,很難盈利。要解決實(shí)際的問題,還需要足夠大的市場(chǎng)容量和場(chǎng)景去推動(dòng)?!睂?duì)此,艾媒咨詢CEO兼首席分析師張毅表示。
同時(shí)他強(qiáng)調(diào),雖然ChatGPT在短短兩個(gè)多月內(nèi)吸引了大量用戶注冊(cè)和使用,但現(xiàn)在大家還是觀賞娛樂或沖動(dòng)性使用。換言之,因?yàn)橛X得好玩,大家都想跟風(fēng)試一下,真正令人拭目以待的,是它未來在商業(yè)方面的實(shí)際應(yīng)用。
百度要想盈利,唯一的辦法是后期收費(fèi),但收取的費(fèi)用能否維持高昂的運(yùn)行成本,有多少用戶愿意為此買單都是問題。
“不管是免費(fèi)也好,付費(fèi)也好,如果不能持續(xù)有效地解決用戶問題,ChatGPT的前景令人擔(dān)憂?!睆堃阏f。
不解決上述問題,百度“文心一言”充其量只能是一個(gè)噱頭,一個(gè)跟風(fēng)笑話。