行業(yè)報(bào)告丨生成式 AI 海內(nèi)外公司布局梳理(上)——海外篇:微軟彎道超車,谷歌蓄勢(shì)待
原創(chuàng) | 文 BTF機(jī)器人

01?微軟
(1)老牌PC 軟件巨頭,近年以云業(yè)務(wù)為核心,Azure 市占率不斷提升
當(dāng)前微軟的核心業(yè)務(wù)包括智能云(Azure、Windows Server、GitHub等)、生產(chǎn)力與企業(yè)流程(Office365、領(lǐng)英、Dynamics 365)與個(gè)人計(jì)算業(yè)務(wù)(Windows、搜索廣告、游戲、設(shè)備)。其中云業(yè)務(wù)是近年來(lái)公司的核心,22財(cái)年收入為752億美元,收入占比近40%。

(2)19 年起布局 AI 領(lǐng)域,5 年內(nèi)不斷加深對(duì) OpenAI的投資、合作
2000 年以來(lái)微軟發(fā)展大致經(jīng)歷3 個(gè)階段:
2000s:錯(cuò)失移動(dòng)互聯(lián)網(wǎng)發(fā)展時(shí)機(jī),股價(jià)大幅下挫;
2010s 至今:推出Azure云服務(wù)快速提振業(yè)績(jī);
2019 年以來(lái):布局人工智能領(lǐng)域,包括先后投資人工智能公司OpenAI、Nuance,2023年宣布追加對(duì)OpenAI的投資,且雙方的合作進(jìn)入到第三階段。

(3)投資OpenAI :底層算法平臺(tái),AI 應(yīng)用開發(fā)的“安卓系統(tǒng)”
除 22 年收購(gòu)蘋果“ “Siri” ”司 背后的對(duì)話式人工智能公司Nuance外,微軟在生成式AI 領(lǐng)域最核心的布局就是對(duì)OpenAI 的投資與合作 。
OpenAI 是一家大型人工智能研究公司,15 年成立之初為非營(yíng)利機(jī)構(gòu)。OpenAI在2015年由馬斯克等人出資10億美元?jiǎng)?chuàng)立,研發(fā)人員包括世界著名AI專家,AI開發(fā)水平處于第一梯隊(duì);2022年6月,量子計(jì)算專家、ACM計(jì)算獎(jiǎng)得主Scott Aaronson宣布將加盟公司,公司以實(shí)現(xiàn)安全的通用人工智能(AGI)為核心宗旨。
19年、21 年微軟進(jìn)行投資,一線風(fēng)投也積極入局。19年、21年OpenAI分別接受微軟10億美元投資,由非營(yíng)利機(jī)構(gòu)轉(zhuǎn)為以盈利為目標(biāo)的公司。除微軟外,投資者還包括紅杉資本、老虎全球管理公司、Bedrock Capital等一線風(fēng)投機(jī)構(gòu)。據(jù)TheInformation,OpenAI 21年估值已達(dá)200億美元,我們預(yù)計(jì)OpenAI當(dāng)前估值或接近300億美元。
23 年初微軟表示將在未來(lái)繼續(xù)對(duì)OpenAI 投資數(shù)十億美元,并進(jìn)入第三階段合作。

當(dāng)前各類生成式AI 創(chuàng)業(yè)公司中,OpenAI 估值最高:通用型底層算法平臺(tái),類似人工智能應(yīng)用開發(fā)的 “ 安卓系統(tǒng) ”。
目前,專注底層系統(tǒng)的公司估值更高。雖然相較應(yīng)用研發(fā)商,基礎(chǔ)設(shè)施研發(fā)商的商業(yè)模式尚未成熟,多數(shù)還在探索階段,但因其應(yīng)用場(chǎng)景更廣,且掌握核心技術(shù)能力,在未能實(shí)現(xiàn)穩(wěn)定盈利的情況下,估值相對(duì)更高。但同樣可見,海外除底層算法開發(fā)公司以外,初創(chuàng)公司基于開源技術(shù),仍可開發(fā)應(yīng)用并開展To C業(yè)務(wù),具有一定商業(yè)化潛力,因此我們預(yù)計(jì),國(guó)內(nèi)盡管頭部互聯(lián)網(wǎng)公司已積極布局,但中小型公司仍有業(yè)務(wù)開展余地。

(4)投資OpenAI:技術(shù)迭代,產(chǎn)品出圈,23 年 GPT4 有望發(fā)布
OpenAI 發(fā)布多款底層算法,并推出相關(guān)應(yīng)用API:
GPT-3(語(yǔ)義)在NLP任務(wù)中實(shí)現(xiàn)重大突破,能夠完成絕大多數(shù)NLP任務(wù),入選《麻省理工科技評(píng)論》21年“十大突破性技術(shù)”,目前GPT-3已開源,注冊(cè)人數(shù)超100萬(wàn),基于該算法已經(jīng)出現(xiàn)Jasper、Copy.ai和Copysmith等。
GPT-3.5(升級(jí))GPT-3.5 是一系列模型,21年Q4混合使用文本和代碼進(jìn)行訓(xùn)練。近期出圈的ChatGPT 則是GPT-3.5 的微調(diào)版本 。
CLIP(跨模態(tài))與微軟合作發(fā)布,能夠?qū)D像映射到文本描述的類別中,跨越了文字語(yǔ)義與圖像語(yǔ)義的鴻溝,目前已開源,Disco Diffusion、MidJourney均基于CLIP架構(gòu)及生成算法實(shí)現(xiàn)。
Codex(文字→代碼)具有將自然語(yǔ)言輸入變成代碼、代碼自動(dòng)補(bǔ)全等功能,是Github Copilot的底層支持。
DALL-E 2(文字→圖片)基于CLIP和Diffusion,實(shí)現(xiàn)了有文本生成高質(zhì)量圖片,兩個(gè)半月注冊(cè)人數(shù)突破100萬(wàn),公司今年7月正式開始出售DALL-E 2 的圖像生成軟件許可,目前用戶超過150萬(wàn),每天生成200多萬(wàn)張圖片。GPT-4 可能于 23 年發(fā)布:據(jù)theverge 報(bào)道,外界預(yù)期 GPT-4 會(huì)在 23 年第一季度或上半年問世 。


ChatGPT 能力強(qiáng)大 & 用戶友好,發(fā)布短期DAU 破千萬(wàn),引起更大層面關(guān)注。
ChatGPT不僅在對(duì)話、檢索、創(chuàng)作、代碼等領(lǐng)域展現(xiàn)出強(qiáng)大的能力,還支持直接通過網(wǎng)站試用該文本對(duì)話模型,而不是需要專業(yè)編程技能試用,且用戶界面友好,大大降低了用戶門檻,推動(dòng)了其在全球范圍的廣泛傳播,發(fā)布5天用戶便突破了100萬(wàn),發(fā)布40天內(nèi)用戶數(shù)即超過了1000萬(wàn)。
計(jì)劃推出無(wú)限制、性能更高的專業(yè)付費(fèi)版本。1月11日,OpenAI 總裁兼聯(lián)合創(chuàng)始人 Greg Brockman 在 Twitter?上發(fā)布 ChatGPT專業(yè)版問卷鏈接,目前已有早期獲得訪問權(quán)限用戶分享專業(yè)付費(fèi)版本截圖,暫定價(jià)為42美元/月。
據(jù)路透社報(bào)道,OpenAI 預(yù)計(jì)今年的收入將達(dá)到 2 億美元,到 2024 年將達(dá)到 10 億美元。ChatGPT 的專業(yè)付費(fèi)版可能是其增收的嘗試之一。


(5)小結(jié):通過OpenAI彎道超車,微軟旗下各產(chǎn)品有望“智能升級(jí)”
微軟在人工智能領(lǐng)域進(jìn)行系統(tǒng)性布局的時(shí)間并不算早(2019年),但把握住對(duì) 【 生成式 AI 龍頭公司】OpenAI的投資與合作,一定程度上實(shí)現(xiàn)了彎道超車。
通過與 OpenAI 更加深度的綁定,我們展望微軟旗下各產(chǎn)品體驗(yàn)均有望 “ 智能升級(jí) ”
企業(yè)級(jí)云計(jì)算領(lǐng)域:或?qū)椭髽I(yè)級(jí)客戶更加自主、安全、方便地開發(fā)AI應(yīng)用;
個(gè)人生產(chǎn)效率方面:此前微軟提到計(jì)劃將ChatGPT整合進(jìn)旗下搜索引擎必應(yīng)(Bing,同時(shí)Chat-GPT功能引入Office,用于部分文本的生成和問答等,這些都將提升個(gè)人用戶的生產(chǎn)效率;
娛樂交互領(lǐng)域:此前微軟計(jì)劃收購(gòu)動(dòng)視暴雪,疊加在云游戲的布局,若能引入生成式AI模型,有望在游戲的生產(chǎn)、分發(fā)與最終體驗(yàn)方面進(jìn)一步升級(jí)。

02?谷歌
(1)搜索引擎龍頭,廣告為核心,AI 布局更早、更深
谷歌是全球搜索引擎龍頭 , 以搜索廣告為主要收入來(lái)源 , 同時(shí)也較早在AI 領(lǐng)域布局大規(guī)模投資
廣告為核心收入:據(jù)statcounter,2022年12月,谷歌在全球搜索引擎市占率絕對(duì)領(lǐng)先,為92.6%,遠(yuǎn)高于第二名的微軟搜索引擎必應(yīng)Bing,后者僅3.0%。憑借高效的算法及海量的用戶觸達(dá),谷歌搜索為公司貢獻(xiàn)高額廣告收入,2021年達(dá)1490億美元,近5年收入占比基本在60%左右。
在 AI 方面的投入較早 、 較大:谷歌從14年就開始系統(tǒng)性布局人工智能。據(jù)23年1月投資者商業(yè)周刊引用美國(guó)銀行的數(shù)據(jù),自2016年谷歌在人工智能、云計(jì)算領(lǐng)域累計(jì)投資金額已超1200億美元,涵蓋互聯(lián)網(wǎng)廣告/搜索、云計(jì)算、醫(yī)療、服裝設(shè)計(jì)、無(wú)人駕駛等領(lǐng)域。
(2)AI 布局最早追溯至06 年,14 年收購(gòu)Deepmind
AI 技術(shù)積累深厚 ,購(gòu) 收購(gòu)Deepmind 加速技術(shù)突破。早在2006年,谷歌及開始AI領(lǐng)域布局,并在2009年開始無(wú)人駕駛的嘗試,2011年成立AI部門并推出可自我學(xué)習(xí)的人腦模擬軟件谷歌大腦,2015年即將AI運(yùn)用到搜索中
2014 年谷歌收購(gòu)關(guān)鍵的AI 研發(fā)機(jī)構(gòu)Deepmind , 從此谷歌的AI 布局加速 。在2016宣布將發(fā)展戰(zhàn)略由Mobile First轉(zhuǎn)向AI First,同年AlphaGo擊敗韓國(guó)圍棋冠軍李世石,2018年推出蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)AI模型AlphaFold,2022年發(fā)布人工智能聊天機(jī)器人Sparrow,23年初測(cè)試Apprentice Bard等類ChatGPT產(chǎn)品。
(3)DeepMind :有底層模型Gopher/Chinchilla ,也有AlphaGo
DeepMind 為谷歌關(guān)鍵的AI 研發(fā)機(jī)構(gòu)。Deepmind是一家英國(guó)的人工智能企業(yè),由人工智能程序師兼神經(jīng)科學(xué)家戴密斯·哈薩比斯(Demis Hassabis)等人于2010年聯(lián)合創(chuàng)立,在2014年被Google收購(gòu)。與OpenAI代表性的GPT-3/GPT 3.5類似,Deepmind也有底層的大語(yǔ)言模型Gopher和Chinchilla。
DeepMind 建立高性能算法 , 延伸到模擬 、 生物科研 、 游戲操作 、 聊天 等領(lǐng)域 。其代表算法產(chǎn)品如打敗圍棋世界冠軍的AlphaGo,實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的AlphaFold,戰(zhàn)勝電競(jìng)職業(yè)玩家的AlphaStar,智能聊天機(jī)器人Sparrow等。
(4)ChatGPT來(lái)勢(shì)洶洶,谷歌或蓄勢(shì)待發(fā)我們認(rèn)為 ChatGPT 已經(jīng)引起了谷歌的較高重視,基于此前谷歌在生成式 AI 領(lǐng)域的巨大投入,有望蓄勢(shì)待發(fā):
谷歌搜索業(yè)務(wù)或受影響:憑借較強(qiáng)的內(nèi)容生成能力,23年1月中旬據(jù)ARK風(fēng)險(xiǎn)投資公司,ChatGPT在上線不到兩個(gè)月內(nèi)實(shí)現(xiàn)日活超1200萬(wàn)。據(jù)澎湃新聞,微軟正考慮將ChatGPT引入搜索引擎必應(yīng)(Bing)中,或?qū)雀杷阉鳂I(yè)務(wù)產(chǎn)生沖擊。據(jù)紐約時(shí)報(bào),近期桑達(dá)爾邀請(qǐng)了谷歌創(chuàng)始人拉里佩奇和謝爾蓋布林參會(huì),會(huì)議標(biāo)題為“一個(gè)聰明的人工智能產(chǎn)品,可能是幾十年來(lái)對(duì)谷歌搜索業(yè)務(wù)的第一個(gè)顯著威脅”。
谷歌核心廣告收入或受影響:前谷歌廣告團(tuán)隊(duì)負(fù)責(zé)人Sridhar Ramaswamy表示,ChatGPT一定程度上阻止了用戶點(diǎn)擊谷歌中帶有廣告的鏈接。據(jù)MORKETING Global統(tǒng)計(jì),美國(guó)前十大互聯(lián)網(wǎng)公司中,谷歌廣告收入在2Q21/2Q22均排第一,在十家公司中占比約45%,為微軟的約3-4倍。
谷歌內(nèi)部已迅速反應(yīng)反饋:據(jù)CNBC,谷歌首席執(zhí)行官桑達(dá)爾皮查伊在22年底參加了多次圍繞谷歌人工智能戰(zhàn)略的會(huì)議,并指示公司的許多團(tuán)隊(duì)重新集中精力,著力解決ChatGPT對(duì)其搜索引擎業(yè)務(wù)構(gòu)成的威脅。谷歌已于23年1月底開始測(cè)試Apprentice Bard等類ChatGPT產(chǎn)品。(
5)生成式 AI 產(chǎn)品矩陣豐富,其中 Sparrow 等有望對(duì)標(biāo) ChatGPT
?生成式AI 產(chǎn)品矩陣豐富,Sparrow 、Apprentice Bard 等或有望對(duì)標(biāo)ChatGPT 。目前谷歌在生成式AI領(lǐng)域已經(jīng)推出多款產(chǎn)品,涵蓋基于文字生成圖片、視頻、音樂等內(nèi)容的AIGC產(chǎn)品,用于智能聊天的Sparrow,用于生物科研的AlphaFold,以及AlphaGo、 AlphaStar等產(chǎn)品。據(jù)《紐約時(shí)報(bào)》,谷歌內(nèi)部會(huì)議表示,谷歌今年計(jì)劃推出20多款新產(chǎn)品,并展示一款具有聊天機(jī)器人功能的搜索引擎。而Sparrow、Apprentice Bard等作為類似ChatGPT的智能聊天機(jī)器人模型,或?qū)⒂糜谂c搜索引擎結(jié)合,從而與ChatGPT抗衡。
(6)Sparrow:智能聊天機(jī)器人,23 年有望推出測(cè)試
Sparrow:類似于ChatGPT,Sparrow是DeepMind于22年9月提出的智能聊天機(jī)器人模型,或會(huì)在23年晚些時(shí)候進(jìn)入測(cè)試階段。
其也采取了基于人類反饋的強(qiáng)化學(xué)習(xí)框架,為用戶的提問給出合理、有用、符合語(yǔ)境、合規(guī)的解答,并利用谷歌搜索出的相關(guān)信息作為支撐證據(jù)。據(jù)紐約時(shí)報(bào),谷歌計(jì)劃在今年進(jìn)行的聊天機(jī)器人搜索演示中表示,正確掌握事實(shí)、確保安全和消除錯(cuò)誤信息是首要任務(wù),而目前,Sparrow已有一套規(guī)則模型,來(lái)訓(xùn)練其避免回答違反規(guī)則的問題。
Sparrow Vs ChatGPT :參數(shù)更少,但訓(xùn)練集更大,垂類內(nèi)準(zhǔn)確度有望更高
運(yùn)作原理:基于數(shù)據(jù)和參數(shù)生成結(jié)果。Sparrow是基于谷歌自有的大型語(yǔ)言模型Chinchilla進(jìn)行訓(xùn)練的聊天機(jī)器人,通過學(xué)習(xí)眾多的數(shù)據(jù)讓模型的參數(shù)更加確定、模型更加成熟。模型成型后,用戶輸入的數(shù)據(jù)與參數(shù)結(jié)合,則將生成相應(yīng)的回答。
在較多語(yǔ)音任務(wù)中回答結(jié)果更準(zhǔn)確:根據(jù)新智元,在幾乎所有的語(yǔ)音任務(wù)中,Sparrow基于的Chinchilla模型所得到的結(jié)果,在準(zhǔn)確性上優(yōu)于GPT-3以及Gopher等模型,得到的結(jié)果與期望得到的結(jié)果更接近,性能更高。
參數(shù)量更小,所需算力小:模型的參數(shù)越多,消耗算力越大,輸出結(jié)果所消耗的資源和時(shí)間更多。相比其他大型語(yǔ)言模型,Chinchilla使用的參數(shù)有700億個(gè),明顯少于GPT-3、Gopher等模型,能降低推理成本,并促進(jìn)模型在較小硬件上的下游使用。
訓(xùn)練數(shù)據(jù)更多:訓(xùn)練數(shù)據(jù)越多,有助于提升模型的性能、輸出結(jié)果的質(zhì)量。根據(jù)DeepMind,Chinchilla的訓(xùn)練數(shù)據(jù)量為1.4萬(wàn)億,遠(yuǎn)多于其他模型。
Apprentice Bard VS ChatGPT:時(shí)效性或更強(qiáng)
Apprentice Bard 或較 ChatGPT 有更強(qiáng)時(shí)效性。據(jù)CNBC1月31日消息,谷歌還在開發(fā)另一款類ChatGPT產(chǎn)品?Apprentice Bard,是基于谷歌人工智能語(yǔ)言模型LaMDA的對(duì)話機(jī)器人。用戶向其提問后,該產(chǎn)品可反饋詳細(xì)的回答,用戶可進(jìn)一步反饋。Apprentice Bard的回答包含了近期發(fā)生的事件,相比ChatGPT或有更強(qiáng)的時(shí)效性,例如在回答“谷歌是否近期會(huì)有新一輪裁員”時(shí),Apprentice Bard 的回答引用了于23年1月谷歌開展的解雇12000名員工的事件。
其他類ChatGPT 產(chǎn)品也在推進(jìn)中。除了Apprentice Bard,據(jù)CNBC,谷歌還在測(cè)試項(xiàng)目,例如云計(jì)算部門下開展名為Atlas的項(xiàng)目以應(yīng)對(duì)ChatGPT,以及一個(gè)可能使用問答形式的備用搜索頁(yè)面。
(7)AlphaGo 與AlphaStar在圍棋、游戲比賽中可戰(zhàn)勝人類選手
AlphaGo:2014年發(fā)布,為DeepMind開發(fā)的人工智能圍棋機(jī)器人,借助神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、蒙特卡洛樹搜索法,實(shí)現(xiàn)對(duì)圍棋棋盤局面、定位的智能處理和推演。2016年3月,AlphaGo以4比1的總比分擊敗職業(yè)九段棋手李世石, 2017年5月以3比0的總比分擊敗排名世界第一的世界圍棋冠軍柯潔。
AlphaStar:2019年發(fā)布,為DeepMind開發(fā)的利用強(qiáng)化學(xué)習(xí)技術(shù)設(shè)計(jì)的一款A(yù)I代理程序,通過自我學(xué)習(xí)策略,掌握了即時(shí)戰(zhàn)略游戲《星際爭(zhēng)霸 2》的玩法,實(shí)現(xiàn)了在游戲中采用多種制勝策略、基于不完善的信息進(jìn)行戰(zhàn)略規(guī)劃等。據(jù)人民日?qǐng)?bào),2019年1月, AlphaStar以5:0戰(zhàn)勝了兩位《星際爭(zhēng)霸 2》職業(yè)選手,且在游戲中, AlphaStar展現(xiàn)的每分鐘操作的次數(shù)(APM)與人類職業(yè)選手相近。
(8)AlphaFold實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)三維模型的預(yù)測(cè)
Deepmind 在2018 年發(fā)布蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)AI 模型AlphaFold,并在2020 年迭代至第二代 。通過在數(shù)據(jù)庫(kù)中搜尋目標(biāo)氨基酸的相關(guān)序列,提取學(xué)習(xí)相鄰“共進(jìn)化”氨基酸的信息,從而在三維空間對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測(cè),相較傳統(tǒng)預(yù)測(cè)方法節(jié)約了大量時(shí)間和資金。Deepmind 2022 年 7 月 28 日發(fā)布的最新版本數(shù)據(jù)庫(kù)擴(kuò)展到了2 億多個(gè)蛋白質(zhì)結(jié)構(gòu),包括科學(xué)界已知的幾乎所有蛋白質(zhì)。AlphaFold團(tuán)隊(duì)因此獲得了2023年生命科學(xué)突破獎(jiǎng)(Breakthrough?Prize in Life Sciences),這是迄今科研領(lǐng)域里獎(jiǎng)金最高的生物學(xué)及醫(yī)學(xué)獎(jiǎng)項(xiàng)。
(9)Gato(通才)—— 集成百種指令響應(yīng)
2022年由DeepMind推出的“通才”AI模型,能夠根據(jù)指令完成注釋圖像、交互式聊天、玩小游戲、關(guān)節(jié)力矩控制、在現(xiàn)實(shí)中使用機(jī)械臂堆疊積木、在模擬 3D 環(huán)境中導(dǎo)航等數(shù)百種任務(wù)。相較于Adobe Sensei,Gato 不僅集成了生成式AI,而是具備了未來(lái)集成通用人工智能的虛擬人的內(nèi)核 。
(10)AIGC 產(chǎn)品:生成文本、音樂、圖片、視頻等
Text-to-Speech:文字轉(zhuǎn)語(yǔ)音 。2017 年基于DeepMind的語(yǔ)音合成專業(yè)技術(shù)打造的文字轉(zhuǎn)語(yǔ)音模型,支持40多種語(yǔ)言、220多種語(yǔ)音和參數(shù)調(diào)整,并且支持用戶上傳自己錄制的音頻來(lái)訓(xùn)練自定義語(yǔ)音模型。
AlphaCode:高效代碼生成。發(fā)布于2022年,根據(jù)DeepMind官方的描述, AlphaCode定位主要是軟件開發(fā)者的助手,尤其是幫助無(wú)編程基礎(chǔ)的用戶寫代碼。用戶將代碼要求以注釋形式輸入后,AlphaCode能夠?qū)⑵渥R(shí)別并完成代碼的編寫、篩選和輸出。據(jù)機(jī)器之心pro,AlphaCode針對(duì)10項(xiàng)編程挑戰(zhàn)進(jìn)行了測(cè)試,總體排名位于前54.3%,擊敗了46%的人類參賽者,且首次通過率達(dá)66%。
Dramatron :劇本輔助編寫。發(fā)布于2022年,是一個(gè)交互式的劇本輔助編寫工具,基于大型語(yǔ)言模型生成長(zhǎng)而連貫的文本,能夠從一句話表述的戲劇沖突中生成劇本標(biāo)題、角色、場(chǎng)景、對(duì)話等,主要用于合著劇本的創(chuàng)作場(chǎng)景,可以為創(chuàng)作者的編譯與修改提供支持。據(jù)DeepMind發(fā)表的一項(xiàng)定量研究顯示,超過65%的體驗(yàn)者認(rèn)為Dramatron創(chuàng)作的劇本出人意料、有趣且獨(dú)特,超過75%的體驗(yàn)者認(rèn)為Dramatron使用體驗(yàn)良好,能夠幫助創(chuàng)作者傳達(dá)創(chuàng)造性想法,可以在創(chuàng)作過程中發(fā)揮重要作用。
Wordcraft:?故事生成。2021年由谷歌推出,作者和AI以對(duì)話的形式共同編輯故事,支持續(xù)寫、擴(kuò)寫、改寫、生成大綱等功能,能夠極大提升寫作效率,激發(fā)創(chuàng)作者靈感。
MusicLM:音樂生成。谷歌于23年1月發(fā)布了基于文本生成音樂的AI模型MusicLM,用戶輸入描述曲風(fēng)、播放時(shí)長(zhǎng)、使用樂器等的文本,或圖片和標(biāo)題的組合,將生成對(duì)應(yīng)風(fēng)格的音樂。
Imagen:圖片生成。谷歌于2022年五月推出了由文本生成高清圖像的模型Imagen,并在11月谷歌AI@年度會(huì)議上宣布首次開放測(cè)試,其官網(wǎng)宣稱Imagen 生成的圖像已經(jīng)全線超越了OpenAI的同類模型DALL-E 2。Imagen已開放提供城市夢(mèng)想家和Wobble兩個(gè)功能。
城市夢(mèng)想家:用戶可以用文字命令創(chuàng)建樣本建筑和地塊(城市廣場(chǎng)、公寓樓、機(jī)場(chǎng)等),從而建造不同主題的城市。
Wobble:用戶可以創(chuàng)造一個(gè)小怪物,并設(shè)計(jì)其材質(zhì)(粘土、毛氈、橡膠等)、衣服,并讓小怪物“跳舞”。
更多精彩內(nèi)容請(qǐng)關(guān)注公眾號(hào):BFT機(jī)器人
本文為原創(chuàng)文章,版權(quán)歸BFT機(jī)器人所有,如需轉(zhuǎn)載請(qǐng)與我們聯(lián)系。若您對(duì)該文章內(nèi)容有任何疑問,請(qǐng)與我們聯(lián)系,將及時(shí)回應(yīng)。