AI大模型創(chuàng)業(yè)展望(1):三類團隊面臨的共同硬核問題

AI大模型的創(chuàng)業(yè)熱潮其實剛剛開始,但又好像風云變幻了很多次,短時間內(nèi),國產(chǎn)AI大模型已經(jīng)接近100個。
在全球性的產(chǎn)業(yè)趨勢面前,較短的時間里,中國市場已經(jīng)形成了不同組織形態(tài)的創(chuàng)業(yè)團隊,它們在短時間內(nèi)發(fā)布了多款AI大模型,以及與之相關不同類型產(chǎn)品。產(chǎn)業(yè)進度如此之快,也給了行業(yè)觀察者提供了較好的觀察樣本。
基于對不同創(chuàng)業(yè)團隊的拆解,對AI大模型創(chuàng)業(yè)的關鍵硬核問題的分析,白熊觀察員(微信公眾號:Baixiong42)將通過系列稿件探討以下問題
AI大模型創(chuàng)業(yè)此刻的問題,什么是其中的硬核問題?
不同類型的創(chuàng)業(yè)團隊可能擁有的機遇和挑戰(zhàn)。

一、同一個AI夢想
風浪越大,AI大模型越多。
環(huán)球同此涼熱,這一波AI大模型創(chuàng)業(yè)已經(jīng)形成了產(chǎn)業(yè)趨勢。在美國,AI大模型相關創(chuàng)業(yè)掀起熱潮,而媒體給中國的AI大模型創(chuàng)業(yè)現(xiàn)象用的詞是“狂飆”。5月底,《中國人工智能大模型地圖研究報告》發(fā)布稱,中國目前已經(jīng)發(fā)布了AI大模型79個,幾乎每個省都有自己的AI大模型,幾乎每個大廠都有自己的大模型。中國本土的AI大模型創(chuàng)業(yè)狂飆半年,盤點當前形勢,實際上形成了三類團隊:
一是大廠團:中大型科技企業(yè)(所謂“大廠”)內(nèi)部組建的AI大模型研發(fā)部門/團隊,如百度組建的團隊發(fā)布了文心一言,該團隊為李彥宏親自帶隊;阿里云代表阿里系發(fā)布了通義千問等,而騰訊、華為、螞蟻、字節(jié)、美團的大模型據(jù)稱都已在路上。
值得注意的,除了這些市值(估值)在數(shù)千億甚至上萬億的互聯(lián)網(wǎng)大廠之外,在中國A股、港股市場上市的一些上市公司也發(fā)布了或號稱將發(fā)布AI大模型,這些公司有些是為炒作股價,暫時不做討論,有些公司我將合并到“大廠團隊”中,在后文討論。
二是獨立團:各類獨立的創(chuàng)業(yè)、融資進行AI大模型研發(fā)的團隊,這類團隊目前多數(shù)聚集在北京上海。如搜狗創(chuàng)始人王小川成立的百川智能,以及最近成為融資市場明星團隊的MiniMax。這類團隊的創(chuàng)始人多是前一波互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮中取得成功的創(chuàng)業(yè)者,身后也有一些大廠的身影。
三是學院派:它們的組織構成、戰(zhàn)略目標等企業(yè)團隊都有所區(qū)別,例如今年初就發(fā)布了MOSS大模型的復旦大學計算機學院團隊,MOSS號稱是國內(nèi)首個類ChatGPT大模型。
對于AI大模型創(chuàng)業(yè)可能遇到的困難,一般的觀點往往會將困難聚焦在算力和語問題上,但在白熊觀察員看來,這兩個問題在當前階段還不是三種創(chuàng)業(yè)團隊的核心問題?,F(xiàn)階段有一個硬核問題,將攔在AI大模型創(chuàng)業(yè)團隊面前,成為區(qū)分不同團隊能力的核心問題。

二、什么是硬核問題?
先定義一下“硬核”問題?!坝埠恕眴栴}是指在創(chuàng)業(yè)過程中難啃、難以解決,但同時又是創(chuàng)業(yè)團隊可以獨立突破的行業(yè)核心問題,某一家企業(yè)一旦突破,就能夠迅速甩開其它競爭對手。
對于AI大模型創(chuàng)業(yè)團隊而言,可能不久之后,他們就將面臨真正的硬核問題 ——?如何自主探索AI大模型領域的創(chuàng)業(yè)方向問題。
這里又包括兩個細分問題,一是如何自主探索技術路線;二是如何探索合適的商業(yè)模式、保持良好的商業(yè)化節(jié)奏等。現(xiàn)階段,大模型領域最高優(yōu)先級仍然是技術路線的探索,因為技術提升的空間仍然非常大,技術提升帶來的產(chǎn)品差異也非常大。
從創(chuàng)業(yè)的一般規(guī)律來看,在一條技術賽道上,當先行者技術路線已經(jīng)比較成熟時,雖然雙方差距較大,但追趕者完全可以學習別人的成功經(jīng)驗,即所謂“抄作業(yè)”。在這個階段,追趕者往往能迅速縮小差距,以超預期的速度將差距縮小至一代以內(nèi),創(chuàng)造看似“奇跡”的發(fā)展速度。
當差距縮小到一代以內(nèi)之后,抄作業(yè)的模式往往失效,因為即使是領先者,他所采用最新的技術路線和商業(yè)模式也包含較大探索成分,本身不一定是正確,跟追趕者的情況也很可能不適配。甚至可能最終領先者可能要自我否定多次,最終跑出來的技術路線,很可能是一開始并不被看好的。
這也意味著,從技術路線到商業(yè)模式,中國AI大模型創(chuàng)業(yè)前將充滿對未知領域的探索,在這條賽道上,真正能抄的作業(yè)不多。
目前中美的差距有多大?通過新聞能看到一些企業(yè)家的預估,如李彥宏判斷中美在AI大模型領域差距是兩三個月,剛剛賣掉搜狗又重新下場創(chuàng)業(yè)的王小川則認為中美差距達到三年,雙方還互打了口水仗。當然,最自信的是科大訊飛的董事長劉慶峰,他則認為很快就能給ChatGPT一點來自A股上市公司的震撼,甚至提出了“_今年10月將整體趕超ChatGPT”_的豪言。
不過你怎么看,反正白熊觀察員選擇在手機里看。不過總體而言,中美的差距仍有可能很快縮短(或已經(jīng)縮短)至一代以內(nèi)。這時候才真正結束熱身,切入了大模型創(chuàng)業(yè)的正賽。
最近有條值得關注的新聞,圖林獎得主、Meta的首席科學家楊立昆(Yann LeCun)多次批評自回歸模型,認為這一技術路線沒有前途。在北京舉辦的2023世界人工智能大會上,楊立昆通過視頻參會發(fā)言。他延續(xù)了之前在其它場合多次提到了觀點,認為以ChatGPT為代表的自回歸模型永遠無法解決事實錯誤、邏輯錯誤等各種錯誤,同時也不了解世界的底層事實(也就是不能真正認知世界)。楊立昆之前的PPT中旗幟鮮明地指出:自回歸模型是注定失敗的(Auto-Regressive LLMs are doomed)。
目前,對楊立昆的觀點,業(yè)界并無激烈的反對與交鋒,因為對于AI大模型未來的技術路線,行業(yè)仍在探索中,現(xiàn)在正處于“迷茫期”。
這正是沒有作業(yè)可抄的一種表現(xiàn),對于中國的創(chuàng)業(yè)者,是往GPT的方向繼續(xù)走,還是尋找新的技術路線?;蛘吒M一步說,國內(nèi)的AI大模型創(chuàng)業(yè)團隊,是否有自主探索技術路線的能力?
除了技術路線之外,商業(yè)化路線的探索也是一道硬核問題。與太平洋對岸的美國隊長Open AI類似,中國的AI大模型團隊也有不少已經(jīng)開放了API接口,可以接受用戶付費接入,但看看有些企業(yè)的價格標準,高得有點離譜,似乎只是在講某種資本故事。
最近一款名為妙鴨相機的應用出圈,這應該是國內(nèi)AI大模型領域第一款真正意義上出圈的應用。妙鴨相機采取了前置付費的模式,用戶需要先支付9.9元才能使用它的AI生成照片功能。從它的人氣來看,這一波應該收入不錯。從應用本身的玩法來看,妙鴨相機讓用戶上傳十幾張個人照片,可能是在后臺訓練了一個LoRa模型,這或是基于Stable Diffusion的技術應用。
這一波妙鴨相機的出圈算是給大模型的商業(yè)化打了樣,但顯然它跟國產(chǎn)AI大模型暫時還沒有什么關系。因為最近妙鴨相機舉行了一場媒體見面會,印證了之前外界的報道,它們正是阿里大文娛旗下孵化的創(chuàng)業(yè)團隊。不過,會后各類媒體的報道中,并沒有提到它們具體的使用的具體技術來源,重點還是介紹了一下企業(yè)的產(chǎn)品理念。如果這是一款運用了某種國產(chǎn)大模型的技術產(chǎn)品,媒體見面會的重心顯然就不會是那些內(nèi)容。
所以妙鴨相機的出圈,是否對國內(nèi)AI大模型創(chuàng)業(yè)產(chǎn)生一些啟發(fā),希望實踐中會有證明。

三、為什么其它問題不是硬核問題
“自主探索”這個問題其實比較抽象,相對而言,此前被談論最多的其實是兩個具象的問題,一個是算力問題,特別是高端顯卡問題,另一個是語料問題。這兩個問題很重要,并且在某些發(fā)展階段也會成為硬核問題,但目前仍然不是。
先說說算力問題,這是最早的熱點問題,一方面是因為目前GPU領域一家獨大,而國際關系上的問題又嚴重影響了高端顯卡的進口。目前來看,無論是解決外部國際關系的問題,還是解決GPU生產(chǎn)制造的問題,短時間內(nèi)都不太可能。因此GPU會一直制約AI大模型行業(yè)的發(fā)展,提升了大模型的訓練能力。
不過從實操來看,現(xiàn)階段仍然有辦法。一是高端顯卡仍然有替代品可用,如英偉達的H800,又如英特爾已經(jīng)發(fā)布了面向中國特供的面向中國“特供”的7nm工藝深度學習芯片Habana Gaudi2,近期AMD首席執(zhí)行官蘇姿豐也明確表示要通過定制產(chǎn)品繞開相關的出口限制,尋找機會向中國客戶提供對應的人工智能解決方案。市場競爭的壓力給了中國AI大模型創(chuàng)業(yè)團隊一絲喘息的機會,從目前國產(chǎn)大模型的普遍參數(shù)量來看,這為產(chǎn)品仍然夠用。
當然,即使是A100這樣的芯片,創(chuàng)業(yè)團隊仍然可以小批量通過各種方式購買到,而依托大廠的一些創(chuàng)業(yè)團隊,甚至可以直接在海外搭建辦公室,把算力資源放在海外。
從當前大模型的發(fā)展現(xiàn)狀來看,不管對大模型吹的有多厲害,多數(shù)團隊還處在樣本驗證階段,這一階段對算力的需求仍然是有限的,隨著模型參數(shù)量的增大,算力的需求才會不斷增大。不過,無論是大廠團隊,還是獨立創(chuàng)業(yè)的團隊,目前這些解決方案基本上是適用的。算力的制約是行業(yè)性制約,任何一種類型的頭部團隊,都有可能借助資本的力量獲得算力,而在發(fā)展過程中的落伍者,即使你身在大廠內(nèi)部,也一樣會被無情砍掉。
因此,算力問題基本上不存在說某個團隊可以單獨突破,從而形成競爭上的獨家優(yōu)勢的局面。
同樣的原因也存在于語料這個問題上。語料這個問題其實形式更為嚴峻,半年前ChatGPT剛剛爆紅的時候,語料問題就被認為是將是中文AI大模型發(fā)展的一大障礙。
對于中文語料質(zhì)量問題,目前已經(jīng)有諸多討論,這里不做進一步討論。這里想說的是,為什么中文語料問題目前暫時不被我列為國產(chǎn)AI大模型創(chuàng)業(yè)的硬核問題,主要原因仍然是上面這兩個:一是當前大模型的階段,中文語料還沒有成為死結(本人近期和朋友一起橫向評測了幾個中文大模型的能力,后續(xù)另撰文詳述);二是這個問題和顯卡問題類似,目前看不出哪家有可能單獨突破。

四、新的征程即將開始
數(shù)據(jù)顯示,5月至6月期間,OpenAI 的ChatGPT 網(wǎng)站的全球流量下降了10%,這是自2022 年11月以來的ChatGPT首次出現(xiàn)訪問量下降。
關于這個新聞有諸多原因解釋,有人認為是用戶的使用效率更高了,也有人認為用戶有更多大模型可供選擇。但在白熊觀察員(微信公眾號:Baixiong42)看來,考慮到AI大模型在全球范圍的滲透率跟各種國民級應用完全不在一個量級上,如果是用戶覺得大模型“更好用”了,那么無論如何ChatGPT作為頭部應用,只會成倍地吸引更多用戶。
在這個階段用戶數(shù)量下滑,幾乎可以說只有一個解釋,那就是那些出于嘗鮮目的使用ChatGPT的用戶興趣逐漸退潮。
當前的ChatGPT,從某種程度上很像PC互聯(lián)網(wǎng)時代的一些應用,仍然缺乏一個支點,讓它能撬動廣大普通用戶?;蛟S,正像楊立昆所說的問題,自回歸模型本身的局限,導致他還無法封裝出一個國民級應用?因此AI大模型創(chuàng)業(yè)者需要探索新的技術路線嗎?
對于大廠團、獨立團、學院派三個類型無數(shù)AI大模型創(chuàng)業(yè)團隊,這是硬核挑戰(zhàn),也是甩開競爭者的一個重大機遇。
從近期中國A股中的“AI概念股”(包括AI大模型概念、AIGC概念等)的走勢來看,一大堆這類概念股已經(jīng)舒舒服服地泡在泡沫之中,這往往也正是泡沫即將破裂的時候,至少在中國是。
正如白熊觀察員在前文《美團救場光年之外,救不了“AI概念股”,大模型炒概念時代結束,新的征程即將開始》中所述,AI大模型創(chuàng)業(yè)在經(jīng)歷了過度自信的“愚昧之巔”后,也很可能需要學會如何穿越“絕望之谷”。
討論一個問題,在說完了是什么、為什么之后,接下去就應該說“怎么辦”——三類國產(chǎn)大模型創(chuàng)業(yè)團隊,該如何面對這個硬核問題,會有怎樣的機遇與挑戰(zhàn),請關注下一篇《大模型創(chuàng)業(yè)展望(2):三類創(chuàng)業(yè)者的挑戰(zhàn)與機遇》
—————————————————————
配圖:midjourney
白熊觀察員
永遠對未來充滿好奇心的探索者