未來(lái)的錢該往哪流?大概率不是 OpenAI

“未來(lái) AI 領(lǐng)域可能不再是一家公司的獨(dú)大,而是由各種開(kāi)源項(xiàng)目和大模型共同構(gòu)建的多元化生態(tài)。在這個(gè)新的格局中,利潤(rùn)最豐厚的環(huán)節(jié)可能并非大模型本身,而是 AI 產(chǎn)品的應(yīng)用端。能靈活運(yùn)用和定制這些模型的創(chuàng)業(yè)公司,無(wú)疑獲得了極大的發(fā)展機(jī)會(huì)......”

世界格局的宏觀預(yù)測(cè)?
一、國(guó)際格局將發(fā)生巨大改變
AI 的興起,可能會(huì)導(dǎo)致世界進(jìn)一步割裂,分為能使用 GPT 的國(guó)家和不能使用的國(guó)家,這種割裂將極大地改變國(guó)際競(jìng)爭(zhēng)的態(tài)勢(shì)。
對(duì)于不支持 GPT 的國(guó)家,即便人數(shù)占優(yōu)勢(shì),實(shí)際的生產(chǎn)力可能也無(wú)法對(duì)應(yīng)增長(zhǎng)。以程序員為例,假設(shè)使用 GPT 的國(guó)家,能讓其300萬(wàn)程序員效率翻倍。相對(duì)而言,未使用 GPT 的國(guó)家,盡管程序員數(shù)量達(dá)到700萬(wàn),其戰(zhàn)力可能只等同于使用 GPT 的300萬(wàn)程序員。
當(dāng)然,這只是一個(gè)簡(jiǎn)化的比喻,因?yàn)槌绦騿T的主要工作并非僅僅編寫代碼,而且 GPT-4 對(duì)不同領(lǐng)域的程序員提供的幫助程度也不同。然而,這個(gè)例子能夠提供一個(gè)角度,讓我們大致理解 AI 技術(shù)在提升工作效率方面的潛力。
而且,與互聯(lián)網(wǎng)時(shí)代不同的是,AI 有潛力滲透到各個(gè)行業(yè),對(duì)整個(gè)經(jīng)濟(jì)格局產(chǎn)生深遠(yuǎn)影響,大多數(shù)行業(yè)未來(lái)都可能需要依賴 AI 技術(shù)。
因此,如果一個(gè)國(guó)家未能充分利用 AI 技術(shù),導(dǎo)致其一些關(guān)鍵行業(yè)的生產(chǎn)力降低到原來(lái)的一半甚至更低,那么這將無(wú)疑對(duì)該國(guó)的全球競(jìng)爭(zhēng)地位構(gòu)成嚴(yán)重威脅。
AI 被視為新一輪工業(yè)革命的引擎,這已經(jīng)成為業(yè)界共識(shí)。無(wú)論是個(gè)體還是國(guó)家,最早采用 AI 的一方將會(huì)獲得巨大的先發(fā)優(yōu)勢(shì),就像英國(guó)在工業(yè)革命時(shí)期那樣。
二、我國(guó)在 AI 領(lǐng)域不會(huì)被“卡脖子”
我之前擔(dān)心過(guò),我國(guó) AI 發(fā)展可能會(huì)被卡脖子?,F(xiàn)在看來(lái),這種想法可以推翻了,主要原因有以下幾點(diǎn):
1、國(guó)內(nèi)公司的投入大
國(guó)內(nèi) AI 熱潮正持續(xù)升溫。無(wú)論是百度、騰訊、阿里還是科大訊飛等頭部科技公司,都在重金投入 AI 大模型的研發(fā)和部署。
2、開(kāi)源力量的推動(dòng)
越來(lái)越多的開(kāi)源產(chǎn)品在不斷豐富著 AI 領(lǐng)域的生態(tài),開(kāi)源本身也在推動(dòng)著技術(shù)進(jìn)步。
3、GPU 進(jìn)貨問(wèn)題不大
英偉達(dá)為了繞過(guò)美國(guó)政府對(duì)中國(guó)公司的銷售限制,專門推出為中國(guó)“特供”的 A800 芯片,作為 A100 芯片的替換版本(兩者都是專門用于訓(xùn)練大模型的 AI 芯片),這無(wú)疑是給中國(guó)的 AI 企業(yè)打了一針強(qiáng)心劑。

在大模型訓(xùn)練和推理兩個(gè)環(huán)節(jié),我們也都已經(jīng)擁有了自己的 GPU,盡管性能只有英偉達(dá)的10%-20%,應(yīng)用范圍也相對(duì)狹窄。但是,我們已經(jīng)有了起步,這就是關(guān)鍵,半導(dǎo)體行業(yè)的競(jìng)爭(zhēng)并非只在于誰(shuí)做得更好。我們現(xiàn)在雖然只有對(duì)手幾分之一的速度,但他們卻無(wú)法真正封鎖我們,我們也只不過(guò)速度慢了一些。如果他們拒絕向我們出售,反而會(huì)喪失潛在的利潤(rùn)。
綜合上面的原因,我認(rèn)為在一年內(nèi),我們自己也能訓(xùn)練出 ChatGPT 類似的產(chǎn)品,達(dá)到 GPT-3.5 的水平。
在這個(gè)過(guò)程中,各大廠商重復(fù)創(chuàng)造輪子是在所難免的,但對(duì)于創(chuàng)業(yè)團(tuán)隊(duì),如果沒(méi)有特別的優(yōu)勢(shì)或積累,從零開(kāi)始研發(fā)是不必要的,因?yàn)楹芸赡茏詈蟮慕Y(jié)果,還不如已有的開(kāi)源項(xiàng)目效果好。
盡管我們可能不會(huì)被卡脖子,但當(dāng)我們達(dá)到 GPT-3.5 的水平時(shí),別人可能已經(jīng)開(kāi)始研發(fā) GPT-5,先發(fā)優(yōu)勢(shì)依然明顯。

未來(lái) AI 行業(yè)預(yù)測(cè)?
一、OpenAI 未必是最終贏家
當(dāng)前,普遍觀點(diǎn)認(rèn)為 OpenAI 與其背后的微軟是贏家。然而,我認(rèn)為 OpenAI 的勝利尚未確定。主要原因有以下幾點(diǎn):
1、OpenAI 欠缺大公司的技術(shù)和用戶優(yōu)勢(shì)
盡管 OpenAI 在技術(shù)方面展現(xiàn)出了顯著的領(lǐng)先地位,但這并不表明,其優(yōu)勢(shì)就如表面上看起來(lái)的那樣巨大。
首要的挑戰(zhàn)是來(lái)自于其他大公司的威脅。比如 Google,作為全球領(lǐng)先的科技公司,其研發(fā)能力和技術(shù)積累是可以開(kāi)發(fā)出 ChatGPT 同等級(jí)的產(chǎn)品。然而,作為一個(gè)商業(yè)組織,Google 需要考慮更為全面的商業(yè)利益和市場(chǎng)布局。
目前,Google 的核心盈利模式依然是搜索引擎廣告業(yè)務(wù),這是一塊經(jīng)過(guò)多年積累,已經(jīng)相當(dāng)穩(wěn)定和盈利的市場(chǎng)。如果急于推出大模型產(chǎn)品,可能會(huì)對(duì)現(xiàn)有的穩(wěn)定收入產(chǎn)生沖擊,甚至威脅到 Google 的主營(yíng)業(yè)務(wù)。
在這種情況下,Google 更有可能采取謹(jǐn)慎的策略,堅(jiān)守現(xiàn)有的盈利模式,同時(shí)在適當(dāng)?shù)臅r(shí)機(jī),有策略地推出與相關(guān)產(chǎn)品,而不是著急“跟風(fēng)”大模型,自己革自己的命。
其次,用戶群體是一大關(guān)鍵。移動(dòng)互聯(lián)網(wǎng)時(shí)代的用戶,大部分都在 Google、Apple 這樣的傳統(tǒng)廠商手中。相較之下,像 ChatGPT 和 Midjourney 這類新興的 AI 應(yīng)用產(chǎn)品,雖然表現(xiàn)出強(qiáng)大的潛力和創(chuàng)新性,但目前還只有一部分人在使用,其用戶群體相對(duì)較小,產(chǎn)品和商業(yè)模式也相對(duì)單一。
所以,我覺(jué)得將 AI 融入擁有大量用戶的傳統(tǒng)產(chǎn)品中,可能會(huì)開(kāi)辟出更大的市場(chǎng)。
2、手機(jī)語(yǔ)音助手是最好的應(yīng)用場(chǎng)景
如果 Apple 或 Google 能在其操作系統(tǒng)中內(nèi)置一個(gè)自己的 GPT,再融入語(yǔ)音助手,OpenAI 可能難以抗衡。國(guó)內(nèi)的手機(jī)制造商也可以在這方面嘗試創(chuàng)新,這可能會(huì)成為一個(gè)巨大的增長(zhǎng)點(diǎn)。
因?yàn)?,?dāng)前的技術(shù)足以實(shí)現(xiàn),關(guān)于監(jiān)管問(wèn)題也會(huì)有應(yīng)對(duì)方案,最重要的交互問(wèn)題也可以解決:比如,可以設(shè)計(jì)讓 AI 在執(zhí)行操作前請(qǐng)求用戶確認(rèn),像現(xiàn)在流行的 AutoGPT 在操作前會(huì)問(wèn)用戶“Yes or No”。手機(jī)廠商也可以采取類似的保守策略。

二、未來(lái)的 AI 將是一超多強(qiáng)的局面
未來(lái)將是多家強(qiáng)大的 AI 公司競(jìng)爭(zhēng)的局面,而非 OpenAI 一家獨(dú)大。這些公司可能會(huì)分為開(kāi)源和閉源兩個(gè)陣營(yíng)。我對(duì)開(kāi)源產(chǎn)品充滿信心,原因有以下幾點(diǎn):
1、開(kāi)源項(xiàng)目可以滿足非常強(qiáng)的定制化需求
以 Stable Diffusion 和 Midjourney 為例,雖然 Stable Diffusion 的效果可能比 Midjourney 差一些,但 Stable Diffusion 能做到 Midjourney 無(wú)法實(shí)現(xiàn)的事情——開(kāi)源產(chǎn)品可以讓用戶自定義訓(xùn)練和優(yōu)化。
比如,一個(gè)廠商在做國(guó)風(fēng)的品牌,他可以自己訓(xùn)練或下載現(xiàn)成的國(guó)風(fēng) checkpoint,借助 Stable Diffusion 設(shè)計(jì)出眾多符合自身品牌定位的產(chǎn)品,提高自己的生產(chǎn)力。這對(duì)于一些特定的行業(yè)和特殊的需求,開(kāi)源項(xiàng)目無(wú)疑提供了巨大的幫助。它不僅提供了極高的定制化能力,還允許用戶根據(jù)特定的專業(yè)和用途進(jìn)行訓(xùn)練,打破了 Midjourney 等閉源項(xiàng)目在交互和功能上的限制。
所以,我覺(jué)得開(kāi)源產(chǎn)品只要能達(dá)到閉源產(chǎn)品70%的水平,應(yīng)用場(chǎng)景就會(huì)非常廣泛。
在 Twitter 上,有位開(kāi)發(fā)者用清華大學(xué)的開(kāi)源模型 ChatGLM,創(chuàng)建了一個(gè)本地部署的 ChatPDF,雖然 ChatGLM 在文字生成能力上相較 GPT-3.5 有所不足,但它足以滿足基本需求。用戶只需將 PDF 論文輸入模型,便可通過(guò) AI 進(jìn)行深入的學(xué)習(xí)和分析。這種創(chuàng)新的方式開(kāi)啟了 AI 改變傳統(tǒng)教育方式的新可能性,展現(xiàn)了在教育領(lǐng)域中 AI 的巨大潛力。

2、閉源產(chǎn)品的“越獄”需求很大
用戶對(duì)于“越獄”閉源產(chǎn)品的需求也異常旺盛,即通過(guò)各種手段突破閉源公司對(duì) AI 的限制。
| NSFW的需求
互聯(lián)網(wǎng)的發(fā)展受到許多因素的推動(dòng),其中一個(gè)不可忽視的因素是"NSFW"(Not Safe For Work)的內(nèi)容需求。這是一個(gè)專門用來(lái)標(biāo)注可能不適合在工作場(chǎng)所瀏覽的內(nèi)容的縮寫。
我介紹過(guò)一種被稱為"語(yǔ)音房"的產(chǎn)品。這些產(chǎn)品提供了一種"軟性"的 NSFW 內(nèi)容,它們有很高的盈利能力,因?yàn)檫@種需求在現(xiàn)實(shí)生活中非常普遍,并且是合法的。然而,AI 文本生成模型如 ChatGPT 并不能生成 NSFW 內(nèi)容。
然后讓我們想象一下,如果有了開(kāi)源的文字生成產(chǎn)品,人們會(huì)如何使用它?
同樣,盡管 Stable Diffusion 已經(jīng)更新到了2.x 的版本,但仍有很多人堅(jiān)持使用1.5的版本,主要原因是1.5的版本能生成一些"小姐姐"的圖片,而更新的版本不能。

| 隱私的需求
在一些敏感行業(yè)中,人們可能不愿意將數(shù)據(jù)交給 ChatGPT 等閉源公司,因?yàn)檫@會(huì)涉及到一定的風(fēng)險(xiǎn),例如數(shù)據(jù)的濫用或泄露。因此,在本地部署的開(kāi)源產(chǎn)品成為一種更安全的選擇。盡管這些開(kāi)源產(chǎn)品在功能上略顯不足,但它們至少能夠滿足基本的安全要求,使數(shù)據(jù)得到保護(hù)。
3、強(qiáng)大的開(kāi)源力量
Stable Diffusion 從2022年8月開(kāi)源到現(xiàn)在,其相關(guān)微調(diào)方法的生態(tài)已經(jīng)枝繁葉茂了。
開(kāi)源者們貢獻(xiàn)了海量的 LoRA(Low-Rank Adaptation of Large Language Models,一種用于大型語(yǔ)言模型的優(yōu)化方法,通過(guò)減少參數(shù)數(shù)量和計(jì)算復(fù)雜度,提高模型的訓(xùn)練效率和適應(yīng)性)、checkpoint(在計(jì)算機(jī)科學(xué)和深度學(xué)習(xí)中指的是程序執(zhí)行的標(biāo)記點(diǎn)或保存點(diǎn),用于記錄程序狀態(tài)和數(shù)據(jù),以實(shí)現(xiàn)中斷恢復(fù)、穩(wěn)定訓(xùn)練和模型選擇等功能。),以及 extension(為現(xiàn)有軟件添加額外功能或特性的模塊或插件,比如 ChatGPT 的 Summarize)。

包括文本生成方面,從 Meta 公司開(kāi)發(fā)的大型語(yǔ)言模型技術(shù) LLaMa(Large Language Model Meta ?AI )到其衍生品 Alpaca(斯坦福在 LLaMa-7B 的基礎(chǔ)上監(jiān)督微調(diào)出來(lái)的模型),都是因?yàn)殚_(kāi)源的力量。
我相信在短短一年內(nèi),依靠開(kāi)源力量,一些產(chǎn)品就能達(dá)到 GPT-3.5 的水平。包括現(xiàn)在,我們看到一些模型,在某個(gè)特定領(lǐng)域使用起來(lái)比 ChatGPT 更高效。所以,AI 技術(shù)并不會(huì)被“卡脖子”,我們應(yīng)該感謝開(kāi)源精神,這種無(wú)國(guó)界的精神真正推動(dòng)了全球的進(jìn)步。

根據(jù)以上對(duì) AI 行業(yè)的討論,我們可以得出三個(gè)關(guān)鍵預(yù)測(cè),同時(shí)也是三個(gè)重要的推論:
第一,技術(shù)和數(shù)據(jù)不會(huì)被單一的公司壟斷
未來(lái)很可能形成開(kāi)源陣營(yíng)與閉源陣營(yíng)對(duì)立的局面,實(shí)現(xiàn)一個(gè)超級(jí)強(qiáng)者與多個(gè)有力競(jìng)爭(zhēng)者并存的格局。在這樣的環(huán)境下,各個(gè)領(lǐng)域的優(yōu)質(zhì)開(kāi)源產(chǎn)品都將有很大的發(fā)展空間。
第二,應(yīng)用端會(huì)成為最有利潤(rùn)的環(huán)節(jié)
未來(lái),大模型將像云服務(wù)一樣普及,但并不會(huì)成為行業(yè)中利潤(rùn)最豐厚的部分。
技術(shù)愛(ài)好者可能會(huì)欣賞到現(xiàn)在這個(gè)時(shí)代的純粹性,例如 ChatGPT、Midjourney 等純技術(shù)驅(qū)動(dòng)的成功案例,因?yàn)樗鼈儾⒉恍枰ㄙM(fèi)大量精力在產(chǎn)品開(kāi)發(fā)上,也不需要過(guò)多考慮商業(yè)模式和策略優(yōu)化。
然而,我認(rèn)為隨著 AI 技術(shù)的日益成熟,價(jià)值最終還是會(huì)回歸到應(yīng)用端和產(chǎn)品化的能力,發(fā)現(xiàn)需求和留住用戶的能力會(huì)變得越來(lái)越重要。
第三,創(chuàng)業(yè)公司需要保持靈活性
創(chuàng)業(yè)公司可以采用"大模型中立"的策略,隨時(shí)接入和切換不同的大模型。隨著大廠的參與和各種開(kāi)源產(chǎn)品的發(fā)展,大模型的市場(chǎng)也將出現(xiàn)多元化的競(jìng)爭(zhēng)局面。在這種環(huán)境下,使用 API 的價(jià)格不會(huì)過(guò)高,創(chuàng)業(yè)公司也能夠保持相當(dāng)?shù)撵`活性。

創(chuàng)業(yè) & 投資的建議?
一、開(kāi)源項(xiàng)目產(chǎn)品化是“低垂的果實(shí)”
無(wú)論是創(chuàng)業(yè)還是投資,我認(rèn)為一個(gè)明確的方向就是將開(kāi)源項(xiàng)目產(chǎn)品化。開(kāi)源項(xiàng)目通常在產(chǎn)品化方面的能力較弱,很難實(shí)際落地,而創(chuàng)業(yè)公司可以填補(bǔ)這個(gè)空白。
比如 Stable Diffusion,2022年8月到現(xiàn)在開(kāi)源這么久了,仍然不是一個(gè)普通人可以玩的一個(gè)產(chǎn)品。
再比如 AutoGPT,我用它去完成一些復(fù)雜的任務(wù),但在數(shù)小時(shí)的嘗試之后,我遇到了各種報(bào)錯(cuò)和死循環(huán),最終什么都沒(méi)輸出出來(lái)。當(dāng)然,最近也有人給 AutoGPT 做 UI 層的產(chǎn)品,雖然很好看,但都沒(méi)有解決 AutoGPT 的根本問(wèn)題:工作不穩(wěn)定。
現(xiàn)在很多人為了蹭熱度,急于推出一個(gè)產(chǎn)品,短期內(nèi)可能吸引了一些眼球,但從長(zhǎng)期看,這些產(chǎn)品的使用效果可能并不好。但是,如果能夠把 AutoGPT 思路提煉出來(lái),并真正投入時(shí)間和精力去開(kāi)發(fā)一個(gè)可靠且好用的產(chǎn)品,那么這將會(huì)有非常大的前景。
二、平衡開(kāi)發(fā)速度與產(chǎn)品力
將一個(gè)原本只有極客們玩得轉(zhuǎn)的東西,轉(zhuǎn)變?yōu)檫m合大眾使用的產(chǎn)品,需要強(qiáng)大的產(chǎn)品化能力。在這個(gè)過(guò)程中,如果你做得太快,產(chǎn)品可能做得不夠好;如果做得太慢,你可能錯(cuò)過(guò)了熱度。因此,平衡好速度與產(chǎn)品力之間的關(guān)系非常重要。
大公司往往在這方面會(huì)顯得比較遲緩和保守,這為創(chuàng)業(yè)公司提供了許多機(jī)會(huì)。
總之,這些開(kāi)源的產(chǎn)品就是“低垂的果實(shí)”。而且,Twitter 和 Github 上很火爆的極客產(chǎn)品,在技術(shù)和市場(chǎng)驗(yàn)證上都完成了從0到1的突破,只是最后的產(chǎn)品環(huán)節(jié)沒(méi)做好。如果創(chuàng)業(yè)者能夠?qū)a(chǎn)品化的最后一公里走好,可能會(huì)取得非常大的成功。

視頻已經(jīng)于4月19日發(fā)布,此篇文章并未對(duì)內(nèi)容進(jìn)行過(guò)多的增刪。值得注意的是,僅僅在過(guò)去的兩個(gè)月左右的時(shí)間里,我們已經(jīng)可以看到一些預(yù)測(cè)正在逐步成為現(xiàn)實(shí)。
我曾經(jīng)在社群中提到過(guò)某頭部金融機(jī)構(gòu)發(fā)布的報(bào)告,他們嘗試預(yù)測(cè)未來(lái)一年的十大重要事件,結(jié)果卻有八個(gè)出現(xiàn)了誤判。這說(shuō)明預(yù)測(cè)未來(lái)是一項(xiàng)極其復(fù)雜的事情,需要考慮的變量太多,而且未來(lái)的發(fā)展往往超出我們的想象。
此外,我在文章中提出的一些觀點(diǎn)與主流意見(jiàn)存在一定的差異。這些預(yù)測(cè)是否會(huì)被事實(shí)打臉,或者是否會(huì)成為現(xiàn)實(shí),可能需要一個(gè)更長(zhǎng)的時(shí)間去檢驗(yàn)。
歡迎關(guān)注公眾號(hào)「李自然說(shuō)」,及時(shí)獲取最新動(dòng)態(tài)和文章內(nèi)容!
