豆語星辰CEO閻鵬:極簡商業(yè)模式思考

2023年7月23日,超聲波俱樂部AI Open Day在北京舉辦,百位AI領(lǐng)域頂級創(chuàng)業(yè)者、知名投資人匯聚一堂。超聲波俱樂部成員、豆語星辰CEO閻鵬進行了一場精彩的分享,以下為閻鵬的分享整理:

分享嘉賓:閻鵬,豆語星辰CEO
分享主題:極簡商業(yè)模式思考
今天我主要是想講創(chuàng)業(yè)的問題,AI的部分講得少一點,這些都是我過去5個月的真實感受。大概2月份左右的時候,我們發(fā)現(xiàn)大模型出來了一個本質(zhì)化的版本,當時我的第一感覺就是,我好像突然不會做生意了,因為這個大模型很神奇。
我們公司內(nèi)部討論的時候有一種疑問,它是不是一個新的數(shù)碼的神?我們是不是得拜一拜,prompt就跟拜神的話術(shù)一樣,然后它就能產(chǎn)生我們想要的所有東西了?
后來我們覺得不太可能,因為我們畢竟搞了十幾年的技術(shù),知道所有的技術(shù)演進都是有線性規(guī)律的,不太可能一瞬間出現(xiàn)一個全知全能的神,所以我們當時用了很長時間去探索這個東西背后到底是什么。
所以我今天先跟大家祛魅,大模型到底是什么,大家不用那么的焦慮、興奮或者迷茫。大模型本身的技術(shù)不是今年出現(xiàn)的,甚至不是這兩年出現(xiàn)的。核心兩個技術(shù),一個技術(shù)是字符向量化,只有把所有的字符向量,包括像素,所有這些我們空間表達的東西,包括文字表達的東西,原來是結(jié)構(gòu)化的東西,向量化之后才可以進行運算,這個東西已經(jīng)出來30多年了。
字符向量化指導(dǎo)了我們過去所有NLP(神經(jīng)語言程序?qū)W)理論研究,包括我們現(xiàn)在看到的圖像化的東西,都是來自于字符向量化這個技術(shù),只是大模型把字符向量化里面的向量集變得非常非常大,這是它的第一個區(qū)別。
第二個技術(shù)是Attention機制,就是注意力機制。我們知道大模型現(xiàn)在有幾十億、上百億參數(shù)的,參數(shù)級特別大之后,實施運算的成本特別高,也很難迅速地、指向性地給出一個答案來。所以你可以這么理解注意力機制,它給了一個窗口,一個搜索和簡化向量集分析的窗口,在這個窗口下給出一些東西來,所以說有了Attention之后,它的效率達到了一種平衡。
當我們知道它核心就是這兩個技術(shù)之后,我們就淡然了,不難受了,也不焦慮了,因為這兩個技術(shù)出來很多年了,Attention機制出來也小十年時間了,我們大量的雙向LSTM(長短期記憶網(wǎng)絡(luò))包括現(xiàn)在圖像處理一些技術(shù)都是用Attention做出來的,所以這個東西不是突然出現(xiàn)的。
接著,我們就分析它到底有什么優(yōu)勢跟劣勢,到底怎么用好它。進一步分析之后發(fā)現(xiàn),它有一個獨有的能力是過去的AI不存在的,那就是實時生成的能力,因為它有大量數(shù)據(jù)集的參數(shù),能夠迅速地生成一段話。
我們用GPT的時候,會發(fā)現(xiàn)它的回答是生成出來的,不是搜索出來的,里面的文本不是先存起來放在數(shù)據(jù)庫里的,而是隨著我們的問題和我們上下文一直在改的,這是大家能看到的很大區(qū)別點,這也是它的獨有能力。
但由于剛才我們說的技術(shù)限制,這個能力有幾個優(yōu)點和缺點。優(yōu)點是什么呢?它有非常強的多樣性,因為它是生成式的網(wǎng)絡(luò),所以它有非常強的變異性、多樣性或者復(fù)雜性,因為它里面的數(shù)據(jù)集跟參數(shù)有可能來自于這兒,有可能來自于那兒,有可能上下文的結(jié)構(gòu)里面,你點到了某一個點,它作為一個條件,它就產(chǎn)生了下一個結(jié)果;你沒有說這一個條件,它就沒有下一個結(jié)果。它有非常強的多樣性能力,多樣性是這個模型非常亮眼的地方。
同時,這也是雙刃劍,這意味著它一定是不準確的,因為它是實時生成的,它只為實時生成這個結(jié)果負責,并沒有任何一個校驗過程。
我們可以做一個小游戲,比如現(xiàn)在問任何一個大模型,不管是國內(nèi)還是國外的,我說:“我今天要給我表哥寄一個禮物,是一個大熊貓,請問我是走海運好、陸運好還是空運好?”
大模型會怎么告訴我們?不管它告訴我們什么都是錯的,因為它會分析物流、運費,分析所有這些東西,甚至知道大熊貓是個活物,是個動物,怎么托運,但是它不知道不能送大熊貓,是非法的。這里面有一個Know-How或者有一個行業(yè)信息在里面,大熊貓是國家一級保護動物,這個東西知識圖譜是不知道的,它的Attention窗口里面不太可能搜索到這個信息。
大熊貓是保護動物這個事可能還稍微簡單一點,那我問另外一個問題:“我們家孩子是個熊孩子,特別討厭,最近不想要他了,請問怎么給我弟弟,讓我弟弟去養(yǎng)?”
它看到了這個文本,發(fā)現(xiàn)熊孩子、教育問題等等這些,它可能給你分析一大堆跟熊孩子教育相關(guān)的東西,但是它沒有發(fā)現(xiàn)也不知道人是不能被輕易地轉(zhuǎn)移撫養(yǎng)關(guān)系的,這也是非法的,所以有大量的信息在里面,大模型是給不了這個答案的,這兩個例子都是違法不違法的問題。
我們問另外一個問題,英國的貨幣是什么?很簡單的一個問題,大模型一定會給出準確答案嗎?不一定,因為所有的知識,即使是這么簡單的知識,它也是有時效性的,英國之前是英鎊,后來加入了歐盟變成了歐元,后來脫歐后又叫回了英鎊,它會告訴你什么時候它的貨幣是什么,因為什么事情,可能它是合理的。即使是不跟法律有關(guān)的這些Know-How,它有很多相關(guān)性的歷史事件和重要事件發(fā)生來牽連這個答案。
前兩天我在某團隊里問了一個特別簡單的問題,我說即使我們做了非常簡單的知識性大模型,比如說珠穆朗瑪峰的高度有多高,很多人都是80后,我們從小背過這個高度,8848米,大家脫口而出。我說可能是錯的,大家一查果然不對,那天查的結(jié)果好像是8844點幾米。
原因有兩個,一個是隨著全球變暖,珠峰在融化。第二個是由于全球的氣侯變化和變暖等趨勢,海平面在上升,海平線的基數(shù)也在調(diào),20年之后米數(shù)就變了,所以這也是一個很奇怪的問題,簡單的知識存儲也是會出問題的,所以這也是大模型現(xiàn)在解決不了的,它只能理解語法結(jié)構(gòu)、知識推理,但它無法給出更準確的知識信息。
剛才我說的是時效性,還有一個點是中文大模型可能比英文還要復(fù)雜、還要討厭的一個問題,因為我們過去十幾年做了很多中國傳統(tǒng)文化和文史文化的一些相關(guān)內(nèi)容,突然發(fā)現(xiàn)這里面的難點。
舉個例子,有一首杜牧寫的詩,里面有一句是這么說的:“東風不與周郎便,銅雀春深鎖二喬”,這里面的“周郎”是周瑜,我們都知道周瑜很厲害,很有名,有很多故事,但是當我們問大模型周瑜是怎么死的時候,大模型能給出我們一個中文的準確答案嗎?抱歉很難,為什么?因為周瑜這個名字在中文互聯(lián)網(wǎng)里面有不只兩個以上的明確定義,一個是由三國歷史、三國志等著作記錄下來的周瑜,歷史上的周瑜,這是真實發(fā)生的,當然也有一些歷史史記上的演繹,那是一個版本。
還有一個版本更出名,是《三國演義》這部小說里面寫的周瑜,這是一個虛構(gòu)人物,跟歷史版本的周瑜甚至跟其它版本的周瑜區(qū)別非常大,因為《三國演義》的作者是有傾向的,他本身是為了捧蜀國漢室這個價值觀,為了襯托諸葛亮這個人物傳奇,把周瑜這個人物寫得稍微貶低了一點,歪曲了一點。
但是由于《三國演義》這個著作又非常的有名,中文有大量的物料、語料是跟它相關(guān)的,即使我們看到所謂的國內(nèi)做中文大模型做得很好的,也是會有很多被《三國演義》的物料污染過的,所以大家其實很難拿它做中文的教育,出來的結(jié)果往往是不對的。
其實周瑜活得很好,為什么歷史上這些所謂的詩人甚至作家特別討厭周瑜?我八卦一下,因為周瑜這人活得太好了,長得又帥,又有才華,爸爸爺爺這輩都是東吳里面的大將軍、丞相這樣級別的官員,他受到老板的信任,自己又文武雙全,媳婦還漂亮。
所以所有的文人都羨慕嫉妒恨,因此當有小說表示,周瑜其實是一個小心眼的人,是個什么什么人的時候,大家會說好,太棒了,他果然是不行的。
所以說我們可以看到歷史的文化流變過程中有多個版本,不僅有時效性的問題,還有版本的問題,定義域的問題,這些諸多的問題會導(dǎo)致大模型沒有大家想象中那么神,它其實是一個簡單的技術(shù)工具。我今天先給大家祛魅一下,大家不要那么慌,它也沒有那么的跨時代,它只是一個技術(shù)工具而已。
不管是我們的教育也好、諸多行業(yè)也好,我們的知識領(lǐng)域也好,有大量等待我們?nèi)ソ鉀Q的問題至今沒有被解決好,大量知識的更新問題、時效性問題、版本迭代問題、版本歸屬問題、定義域問題等等至今沒有被解決好,即使是現(xiàn)在國內(nèi)最強的技術(shù)公司,他們做的所有的這些跟知識文本相關(guān)的東西,也不過是過去10年我們寫的各種專利,像PageRank等等,還沒有在知識領(lǐng)域、在信息領(lǐng)域上真正挖到它根部的難題。
所以我今天分享的第一件事情就是,不要認為今天的大模型非常牛逼,特別恐怖,沒有那么恐怖。業(yè)務(wù)中確實有很多問題等待我們?nèi)ソ鉀Q,還沒有解決好。目前的大模型跟我們理想中能解決很多問題的大模型,差距還非常大。我們研究了幾個月之后,突然發(fā)現(xiàn)好像還好,沒有那么慌了,所以今天先跟大家分析這個事情。

第二個事情,說實話也是我自己身上犯的一個錯誤。
我們是技術(shù)人,搞了十幾年的技術(shù),搞了大量的業(yè)務(wù)創(chuàng)新,遇到了一個技術(shù)紅利或者機會的時候,就一腦門扎進去了。但前些天我去復(fù)盤這個事的時候,突然想到一個問題:我們是在創(chuàng)業(yè),而不是搞技術(shù)調(diào)研,那我們應(yīng)該先找客戶再做產(chǎn)品,還是先做產(chǎn)品再找客戶?
我花了幾個月時間,做了一款產(chǎn)品,用上了很多新的技術(shù)能力,也做了很多的業(yè)務(wù)創(chuàng)新,但是突然發(fā)現(xiàn)自己陷入了一個創(chuàng)業(yè)者的錯誤里,就是閉門造車。在做出一款產(chǎn)品之后,滿世界去尋找誰能欣賞一下我的產(chǎn)品,這是很可怕的。
所以子超讓我分享經(jīng)驗的時候,我說沒有什么經(jīng)驗,全是教訓,因為我們搞了十幾年創(chuàng)業(yè),做了很多企業(yè),還是會犯這樣的錯誤,所以我說在座的各位如果沒有經(jīng)驗的話,也會犯這樣的錯誤。
其實做2C產(chǎn)品也好,還是2B產(chǎn)品也好,本質(zhì)上都是做業(yè)務(wù)、做生意。應(yīng)該尊重這個規(guī)律,先要尋找客戶??蛻粲惺裁礃拥男枨?,怎么表達的,他的認知在哪里。我們要先跟大家打成一片,讓有一部分能容忍我們的人陪我們、去迭代我們的產(chǎn)品,這才是正確的一個路子,所以說第二個事情就是分享一下我們最近的一個教訓。
第三個事情,如果大家意識到先找客戶的話,那接下來的問題就來了,也是創(chuàng)業(yè)老炮們經(jīng)常犯的錯誤:客戶在哪里,還是去哪里推廣客戶、推廣產(chǎn)品。聽起來很像,但不是一個東西。
到2022年年底為止,短視頻行業(yè)獲取了大量的用戶時間。其實用戶的使用習慣跟場景已經(jīng)發(fā)生遷移了,有大量的用戶在短視頻里面、在直播里面。按照我們的創(chuàng)業(yè)經(jīng)驗,我們找用戶不會去泛娛樂的大賣場或者是大秀場里面,我們大概率搞個公眾號,去市場上面推廣一下,搞裂變等等都是這么想的。
其實又會陷入到另外一個矛盾里,是尊重用戶在哪里我們?nèi)ツ睦?,還是我們做了一個類似的產(chǎn)品或相關(guān)的產(chǎn)品之后去推廣用戶。
后來我們就看了一個案例,這個案例蠻有意思的,這是一個小的數(shù)字形象,這個數(shù)字形象的號大概啟動了三四個月的時間,已經(jīng)上千萬用戶了,雖然不是付費用戶,只是粉絲,但是它的起量速度快是很多人類主播都達不到的。

我們又研究了一下它背后到底怎么搞起來的,其實是一個動補系統(tǒng),沒有我們想象中那么牛逼,以為是一個自適應(yīng)AI,能理解語音,其實根本沒有,它其實只是包了一個殼,就做成了這個樣子,然后有大量的用戶去咨詢有沒有類似的APP,有沒有類似玩法的東西,甚至有沒有2B的合作機會來做這個事情。
然后我們就發(fā)現(xiàn)之前的很多經(jīng)驗對我們來說都是枷鎖,我們不應(yīng)該按傳統(tǒng)的2C去找APP推廣路徑,應(yīng)該尊重用戶在哪里這件事情,現(xiàn)在用戶絕大多數(shù)時間都在抖音、視頻號等這些短視頻平臺上。用戶已經(jīng)被遷移過去了,這些大公司花了幾年時間,用了很大的成本把用戶遷移過去了。
而我們找用戶不應(yīng)該去自己找,我們應(yīng)該把自己的產(chǎn)品力,我們自己的核心主張,我們自己的很多應(yīng)用能力轉(zhuǎn)化成能在這些平臺上火起來的東西,這是我們最近另外一個思考,拋棄掉了很多肉身。我們的創(chuàng)業(yè)伙伴跟我們也很多年了,上來就說:“閻總,三個月之內(nèi)必須給你搞套APP出來?!蔽耶敃r蠻開心的,現(xiàn)在想想好可怕,APP搞完怎么辦,APP搞完之后和用戶還是隔得非常遠,用戶根本不知道我們在干什么。
傳統(tǒng)的產(chǎn)品推廣路徑ROI已經(jīng)非常低了,目前沒有公眾號的紅利了,也沒有應(yīng)用市場的紅利了,早就沒有了,我們現(xiàn)在習慣的推廣路徑其實都不太好用了。以上是我的第三個思考。
這句話還蠻欺負人的,“一個客戶不是一個人”,為什么這么說?當我們說尋找客戶的時候,很多同學跟我反饋的意見是,閻總,客戶都被劃分沒了,滿世界那么多APP,每個手機里裝了那么多APP,平均每個人用20多個APP,時間已經(jīng)占用光了,如果按人計算,早就沒有客戶了。真的是這樣嗎?一看這個結(jié)論就是反常識的,很多新的優(yōu)秀的產(chǎn)品都能獲取到客戶,怎么可能沒有客戶了呢。
其實這里面有一個本質(zhì)問題,一個需求就是一個客戶,每一個人是由非常多的需求組合起來的復(fù)雜體,今天我們在這兒演講渴了有喝水的需求,一會兒演講結(jié)束之后出去有打車的需求,回到家里面吹空調(diào)吃冷飲,需求是非常豐富的,一個人是分時復(fù)用的,分場景復(fù)用的。
一個人身上有這么多復(fù)雜的場景,大家可能都沒有意識到。我們在看競品的時候也要意識到,這些產(chǎn)品對用戶來說只是一個過客、一個工具而已,我們不要太擔心人們有沒有已經(jīng)被哪些產(chǎn)品獲取到了這件事情,其實對我們來說不重要。
這是我們在業(yè)務(wù)推廣時候的教訓,我們的推廣同學、運營同學在看到巨型公司產(chǎn)品的時候傻掉了,覺得沒有推廣空間了,獲客很難了。其實不是的,本質(zhì)上是我們的需求沒有找準,并沒有想好產(chǎn)品模式,需要滿足什么東西,只是看表面的用戶已經(jīng)沒有了。
剛剛分享了三個教訓,這三個教訓我們想通了之后,就有一個非常重要的課題擺在我們面前,也是所有創(chuàng)業(yè)的同學可能會遇到的問題。那就是,我們的產(chǎn)品模式到底是什么模型?不是剛剛說的LLM,不是大語言模型這種東西,是商業(yè)模型,我們到底選擇什么樣的商業(yè)模型?

這個PPT蠻具有欺騙性的,我經(jīng)常問大家想要什么樣的商業(yè)模型。常見的免費模型,周總最開始推廣的免費,我記得他還寫了一本書,非常厲害,免費獲客、推廣的互聯(lián)網(wǎng)模式;月租的模型是騰訊視頻、愛奇藝等,這些做得非常成功;還有買斷模型,買斷模型是一次性交付的商品模型。這里面的截圖是有年代感的,大家可能看不懂,比如Windows XP Proffesional安裝程序里面的輸密鑰的界面。每個模型都能讓業(yè)務(wù)轉(zhuǎn)起來,那我們用什么樣的模型?
我見過很多的分析,很多互聯(lián)網(wǎng)老炮兒跟我講:“老閻,我跟你說,這個模型是倒過來的,越往左邊,越先進越好,你就用最左邊的模型就好了?!闭娴氖沁@樣嗎?不好說。
我們做了十幾家公司后感覺,其實每一個模型沒有什么好壞區(qū)分,只是看你擅長解決什么問題。免費模型是轉(zhuǎn)化,因為它的早期推廣成本相對低一點,推廣后,就會享有非常好的DAU,非常好的用戶時長,但有一個非常難受的問題是成本居高不下,但是轉(zhuǎn)化率好不好,有多少人轉(zhuǎn)化成付費用戶、忠實用戶,這是一個很常見的互聯(lián)網(wǎng)產(chǎn)品的轉(zhuǎn)化問題。
至于選擇月租模型的,不用看他們現(xiàn)在的用戶數(shù)多高或者新增多少,核心解決的問題是續(xù)費問題。先舉個例子,最近我們知道愛奇藝跟騰訊一直在PK新的電視劇的上線,為什么?假設(shè)一個平臺連續(xù)一年沒有任何爆的電視劇上線,這個平臺就沒有續(xù)費了,所以不要看這么大的公司,這么大的公司命門也是在一個位置上了,非??膳拢@是一個無盡的續(xù)費循環(huán)。所以大家作為內(nèi)容也好,作為版權(quán)也好,炒IP也好都是為了解決一個問題就是續(xù)費問題。
買斷模型好像又不用續(xù)費,又不用轉(zhuǎn)化,一次性都解決掉了,但是這個模型沒有未來,買完之后銷售結(jié)束了,分完錢之后明年呢?關(guān)門嗎?要看新增,這個模型的難處是無盡的新增壓力,市場空間就這么大,如何獲得更多的原來不認識我們的用戶。所以不同的模型沒有優(yōu)劣之分,新的勝負手不一樣,看我們的團隊和產(chǎn)品力,所以每一個模型都有它命門的地方。

我希望大家做AI的時候,或者創(chuàng)業(yè)的時候,能先預(yù)見到我們選擇的模型最難的那個點搞不搞得定。如果搞不定的話,像剛剛子超說的,盲目的看一下DAU和早期數(shù)據(jù)沒什么意義,會死的。
這是今天的最后一頁,我們最近的思考和反思是這樣的,如果一個大模型不能在業(yè)務(wù)的勝負手位置產(chǎn)生新的生產(chǎn)力,那么這個大模型最后還是一個效率型的技術(shù)應(yīng)用。就像我最開始說的,大模型是個技術(shù)應(yīng)用,已經(jīng)很清楚了,它沒那么神,主要看大家怎么用。
怎么用還是得看創(chuàng)業(yè)的部分,在我們的業(yè)務(wù)模型里面,到底是哪個是最大的業(yè)務(wù)問題?這個業(yè)務(wù)問題能不能被大模型有效地解決掉,如果能,那恭喜你,你抓到了一個風口,可以讓你的業(yè)務(wù)突飛猛進脫胎換骨;如果不能,可能只是一些云廠商的機會,最后賣給我們一些云服務(wù),僅此而已,謝謝大家。