最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

國產(chǎn)大模型行業(yè)分析:競爭格局、發(fā)展現(xiàn)狀及應(yīng)用端

2023-10-17 14:27 作者:行業(yè)研究君  | 我要投稿

前不久首批大模型產(chǎn)品陸續(xù)通過《生成式人工智能服務(wù)管理暫行辦法》備案,正式上線面向公眾提供服務(wù)。其中包括:百度文心一言、抖音云雀大模型、智譜AI的GLM大模型、中科院的紫東太初大模型、百川智能的百川大模型、商湯的日日新大模型、MiniMax的ABAB大模型、上海人工智能實驗室的書生通用大模型、科大訊飛星火大模型,以及華為、騰訊的大模型產(chǎn)品,共計11家。同時,商湯“商量Sense Chat”、智譜AI智能助手“智譜清言”,百度“文心一言”,百川智能“百川大模型”已經(jīng)宣布全面向用戶開放服務(wù)。首批大模型產(chǎn)品完成備案,并陸續(xù)向用戶開放服務(wù),使得大模型能夠大量獲得真實用戶數(shù)據(jù)反饋,加快大模型迭代速度,進而不斷提升用戶體驗,同時基于大模型的ToB、ToC應(yīng)用落地進程也有望加快。

01

大模型概述


1.什么是大模型?

大模型是大規(guī)模語言模型(Large Language Model)的簡稱。大模型主要指具有數(shù)十億甚至上百億參數(shù)的深度學(xué)習(xí)模型,其具備較大容量、海量參數(shù)、大算力等特點。大模型由早期的單語言預(yù)訓(xùn)練模型發(fā)展至多語言預(yù)訓(xùn)練模型,再到現(xiàn)階段的多模態(tài)預(yù)訓(xùn)練模型,可實現(xiàn)處理多任務(wù)的目標(biāo)。?

大型語言模型是一種深度學(xué)習(xí)算法,可以使用非常大的數(shù)據(jù)集來識別、總結(jié)、翻譯、預(yù)測和生成內(nèi)容。大語言模型在很大程度上代表了一類稱為Transformer網(wǎng)絡(luò)的深度學(xué)習(xí)架構(gòu)。Transformer模型是一個神經(jīng)網(wǎng)絡(luò),通過跟蹤序列數(shù)據(jù)中的關(guān)系(像這句話中的詞語)來學(xué)習(xí)上下文和含義。

2.Transformer架構(gòu)的提出,開啟了大語言模型快速發(fā)展的新時代

谷歌的BERT首先證明了預(yù)訓(xùn)練模型的強大潛力;OpenAI的GPT系列及Anthropic的Claude等繼續(xù)探索語言模型技術(shù)的邊界。越來越大規(guī)模的模型不斷刷新自然語言處理的技術(shù)狀態(tài)。這些模型擁有數(shù)百億或上千億參數(shù),可以捕捉語言的復(fù)雜語義關(guān)系,并進行人類級別的語言交互。

解鎖大模型時代的鑰匙——Transformer的注意力機制。Transformer模型最大的創(chuàng)新在于提出了注意力機制,這一機制極大地改進了模型學(xué)習(xí)遠(yuǎn)距離依賴關(guān)系的能力,突破了傳統(tǒng)RNN和CNN在處理長序列數(shù)據(jù)時的局限。

在Transformer出現(xiàn)之前,自然語言處理一般使用RNN或CNN來建模語義信息。但RNN和CNN均面臨學(xué)習(xí)遠(yuǎn)距離依賴關(guān)系的困難:RNN的序列處理結(jié)構(gòu)使較早時刻的信息到后期會衰減;而CNN的局部感知也限制了捕捉全局語義信息。這使RNN和CNN在處理長序列時,往往難以充分學(xué)習(xí)詞語之間的遠(yuǎn)距離依賴。

Transformer注意力機制突破了RNN和CNN處理長序列的固有局限,使語言模型能在大規(guī)模語料上得到豐富的語言知識預(yù)訓(xùn)練。該模塊化、可擴展的模型結(jié)構(gòu)也便于通過增加模塊數(shù)量來擴大模型規(guī)模和表達(dá)能力,為實現(xiàn)超大參數(shù)量提供了可行路徑。Transformer解決了傳統(tǒng)模型的長序列處理難題,并給出了可無限擴展的結(jié)構(gòu),奠定了大模型技術(shù)實現(xiàn)的雙重基礎(chǔ)。

3.參數(shù)量的倍數(shù)增長是大模型最根本的特點

大模型代表了一種新的預(yù)訓(xùn)練-微調(diào)范式,其核心是先用大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練一個極大的參數(shù)模型,然后微調(diào)應(yīng)用到具體任務(wù)。這與傳統(tǒng)的單任務(wù)訓(xùn)練形成了對比,標(biāo)志著方法論的重大變革。參數(shù)量的倍數(shù)增長是大模型最根本的特點,從早期模型的百萬量級,發(fā)展到現(xiàn)在的十億甚至百億量級,實現(xiàn)了與以往數(shù)量級的突破。

Transformer架構(gòu)的提出開啟了NLP模型設(shè)計的新紀(jì)元,它引入了自注意力機制和并行計算思想,極大地提高了模型處理長距離依賴關(guān)系的能力,為后續(xù)大模型的發(fā)展奠定了基礎(chǔ)。正是由于Transformer架構(gòu)的成功,研究者們意識到模型的架構(gòu)設(shè)計在處理復(fù)雜任務(wù)和大規(guī)模數(shù)據(jù)中發(fā)揮著舉足輕重的作用。這一認(rèn)識激發(fā)了研究者進一步擴大模型參數(shù)量的興趣。雖然之前也曾有過擴大參數(shù)量的嘗試,但因受限于當(dāng)時模型本身的記憶力等能力,提高參數(shù)數(shù)量后模型的改進并不明顯。

GPT-3的成功充分驗證了適度增大參數(shù)量能顯著提升模型的泛化能力和適應(yīng)性,由此掀起了大模型研究的熱潮。它憑借過千億參數(shù)量和強大的語言生成能力,成為參數(shù)化模型的典范。GPT-3在許多NLP任務(wù)上表現(xiàn)亮眼,甚至在少樣本或零樣本學(xué)習(xí)中也能取得驚人的效果。

4.大模型優(yōu)勢及應(yīng)用前景

與早期的人工智能模型相比,大型模型在參數(shù)量上取得了質(zhì)的飛躍,導(dǎo)致了在復(fù)雜任務(wù)的建模能力整體上的提升:1)學(xué)習(xí)能力增強:以應(yīng)對更復(fù)雜的任務(wù);2)泛化能力加強:以實現(xiàn)更廣泛的適用性;3)魯棒性提高;4)具備更高層次認(rèn)知互動能力:可模擬某些人類能力等。

應(yīng)用前景:復(fù)雜性、高維度、多樣性和個性化要求使得大型模型在某些任務(wù)上更易獲得出色的建模能力;多模態(tài)傳感器數(shù)據(jù)的融合分析,尤其涉及到時序數(shù)據(jù)的處理,如自動駕駛;雜且動態(tài)的目標(biāo),需要模型從大規(guī)模多樣化的數(shù)據(jù)模式中學(xué)習(xí),如金融領(lǐng)域中的量化交易策略優(yōu)化;涉及異構(gòu)數(shù)據(jù)源的高維輸入空間,如醫(yī)學(xué)圖像和報告;需要為不同用戶或場景進行個性化建模的定制化需求,如智能助理。

5.大模型商業(yè)模式

目前大模型商業(yè)應(yīng)用尚處早期,以API、PaaS、MaaS三種模式為主。當(dāng)前全球大模型產(chǎn)業(yè)落地仍處于早期探索階段,需要與下游場景企業(yè)合作建立大模型商業(yè)模式,但下游企業(yè)目前對于大模型的理解相對有限,所需要的資源支撐比較薄弱??偟膩碚f,大模型落地可以通過API接口調(diào)用付費、或者大廠提供落地所需的開發(fā)工具、云平臺、服務(wù)等的PaaS模式,更進一步是直接提供相關(guān)定制好的模型調(diào)用的MaaS模式。

02

國內(nèi)外大模型發(fā)展現(xiàn)狀及競爭格局


1.全球:中美領(lǐng)先發(fā)展,但行業(yè)格局或?qū)⑾鄬Κ毩?/strong>

從全球范圍來看,中美在大模型領(lǐng)域引領(lǐng)全球發(fā)展。其中,基于在算法模型研發(fā)上的領(lǐng)先優(yōu)勢,美國大模型數(shù)量居全球首位,根據(jù)中國科學(xué)技術(shù)信息研究所、科技部新一代人工智能發(fā)展研究中心聯(lián)合發(fā)布的《中國人工智能大模型地圖研究報告》,截至2023年5月,美國已發(fā)布100個參數(shù)規(guī)模10億以上的大模型。中國亦積極跟進全球大模型發(fā)展趨勢,自2021年以來加速產(chǎn)出,如2021年6月北京智源人工智能研究院發(fā)布1.75萬億參數(shù)量的悟道2.0、2021年11月阿里M6大模型參數(shù)量達(dá)10萬億等。截至2023年5月,我國已發(fā)布79個大模型,在全球范圍占據(jù)先發(fā)優(yōu)勢。但考慮到數(shù)據(jù)安全、隱私合規(guī)以及科技監(jiān)管等因素,中美的大模型市場有望形成相對獨立的行業(yè)格局。

2.海外:OpenAI及谷歌雙龍頭+Meta開源追趕+垂類特色廠商的格局已較為清晰

從海外大模型格局來看,目前已經(jīng)形成較為清晰的雙龍頭領(lǐng)先+Meta開源追趕+垂類繁榮的格局。同時,基于通用大模型能力已相對成熟可用,其上的應(yīng)用生態(tài)已逐漸繁榮。

得益于對先進算法模型的集成以及較早的產(chǎn)品化,OpenAI不僅展現(xiàn)了GPT在人機對話中的超預(yù)期表現(xiàn),同時基于GPT的應(yīng)用生態(tài)也已逐漸繁榮,微軟數(shù)款產(chǎn)品(Bing、Windows操作系統(tǒng)、Office、瀏覽器、Power Platform等)、代碼托管平臺GitHub、AI營銷創(chuàng)意公司Jasper等均已接入GPT。

谷歌在人工智能領(lǐng)域持續(xù)投入,其提出的IeNet卷積神經(jīng)網(wǎng)絡(luò)模型、Transformer語言架構(gòu)、BERT大語言模型等均對全球人工智能產(chǎn)業(yè)產(chǎn)生重要推動。但由于公司團隊變動及更謹(jǐn)慎的產(chǎn)品化落地的態(tài)度,谷歌前期尚未大規(guī)模推出面向C端的AI產(chǎn)品。在ChatGPT快速流行的帶動下,谷歌亦推出聊天機器人Bard及PaLM2,并將接入谷歌的協(xié)作與生產(chǎn)力工具Workspace以及與Spotify、沃爾瑪、UberEats等外部應(yīng)用融合。

Meta通過開源方式快速追趕,7月發(fā)布最新開源大模型LLaMA2,使用2萬億tokens訓(xùn)練,上下文長度翻倍,實現(xiàn)了更強大的表現(xiàn)能力和更廣泛的應(yīng)用場景。

此外,Anthropic、Cohere、Hugging Face等基于各自的垂類特色和定制化服務(wù)也在海外AI市場中扮演著重要角色。

3.國內(nèi):互聯(lián)網(wǎng)巨頭有望保持領(lǐng)先地位,中小廠商或?qū)⒚媾R路徑選擇

ChatGPT獲得良好用戶反響并在全球范圍引發(fā)關(guān)注以來,中國頭部科技企業(yè)(阿里、百度、騰訊、華為、字節(jié)等)、新興創(chuàng)業(yè)公司(百川智能、MiniMax等)、傳統(tǒng)AI企業(yè)(科大訊飛、商湯科技等)以及高校研究院(復(fù)旦大學(xué)、中科院等)亦加速大模型領(lǐng)域投入。當(dāng)前國內(nèi)大模型仍處研發(fā)和迭代的早期階段,各個大模型的性能差異及易用性仍在市場檢驗的過程當(dāng)中,預(yù)計國內(nèi)大模型領(lǐng)域競爭格局的明晰仍需一定時間,但是互聯(lián)網(wǎng)巨頭在AI領(lǐng)域積累已久,具備先發(fā)優(yōu)勢。

綜合上述分析,結(jié)合行業(yè)競爭要素,并參考海外當(dāng)前競爭格局,國內(nèi)大模型賽道有望形成與海外相似的產(chǎn)業(yè)趨勢,兼具技術(shù)、資金、人才和場景優(yōu)勢的頭部互聯(lián)網(wǎng)企業(yè)有望成為大模型領(lǐng)域的重要玩家,而中小廠商或?qū)⒚媾R路徑選擇。一方面,中小廠商可以利用自身在垂類場景和數(shù)據(jù)層面積累的優(yōu)勢,成為聚焦垂類的核心特色玩家;另一方面,基于訓(xùn)練和用戶調(diào)用帶來的算力需求的激增,考慮到資源優(yōu)勢和經(jīng)濟性,中小廠商或?qū)で笤茝S商的支持和合作。

03

國內(nèi)大模型競爭壁壘


技術(shù)投入、核心人才和應(yīng)用場景構(gòu)成大模型競爭的核心壁壘。大模型是一個重資源稟賦、高進入門檻的賽道,其對算法模型的有效性、高質(zhì)量的數(shù)據(jù)、算力的支撐能力均有極高要求,模型的優(yōu)化迭代亦有賴于資金和人才的持續(xù)投入。此外,大模型的實際落地和行業(yè)應(yīng)用能力也是市場檢驗的重要標(biāo)準(zhǔn)。

1.算法模型:追隨海外技術(shù)進展,研發(fā)突破是競爭關(guān)鍵

從技術(shù)路線來看,國內(nèi)大模型主要追隨海外進展?;诠雀柙谌斯ぶ悄茴I(lǐng)域更高的影響力以及BERT開源代碼,前期我國企業(yè)在大模型領(lǐng)域的探索更多參考BERT路線。隨著ChatGPT在人機對話領(lǐng)域的超預(yù)期表現(xiàn)驗證了高質(zhì)量數(shù)據(jù)+反饋激勵(大模型預(yù)訓(xùn)練+小數(shù)據(jù)微調(diào))的有效性,國內(nèi)大模型技術(shù)路線也逐漸向GPT方向收斂。

盡管模型架構(gòu)設(shè)計的不同對特定任務(wù)上的表現(xiàn)有一定影響,但國內(nèi)大模型廠商在技術(shù)上基本同源,從而導(dǎo)致了現(xiàn)階段較為相似的模型能力,而下一階段對于GPT方向的研發(fā)突破將是競爭關(guān)鍵。

2.算力:互聯(lián)網(wǎng)廠商在算力資源上具備優(yōu)勢

隨著模型參數(shù)和復(fù)雜度的提升,大模型對算力的需求也在加速增長。當(dāng)前國內(nèi)已發(fā)布的大模型中,參數(shù)規(guī)模達(dá)到千億及以上的廠商僅為10個左右,一定程度上體現(xiàn)出各廠商之間算力能力的差異?;ヂ?lián)網(wǎng)廠商在算力資源上具備相對優(yōu)勢,主要原因包括:1)互聯(lián)網(wǎng)企業(yè)業(yè)務(wù)布局多元,用戶基數(shù)龐大,海量數(shù)據(jù)高頻更新,使得互聯(lián)網(wǎng)企業(yè)自身對算力有大量需求,阿里、字節(jié)、百度、騰訊等頭部互聯(lián)網(wǎng)企業(yè)是全球芯片及服務(wù)器領(lǐng)域的重要客戶;2)阿里云、百度云、騰訊云等為國內(nèi)頭部云廠商,在云計算中心、AI算力平臺、超算中心等新型高性能計算基礎(chǔ)設(shè)施上布局領(lǐng)先,如阿里云推出PAI靈駿智算服務(wù),提供覆蓋AI開發(fā)全流程的平臺和分布式異構(gòu)計算優(yōu)化能力;騰訊云發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計算集群,算力性能較前代提升高達(dá)3倍。

3.數(shù)據(jù):優(yōu)質(zhì)開源中文數(shù)據(jù)集稀缺,自有數(shù)據(jù)及處理能力構(gòu)成模型訓(xùn)練壁壘

得益于開源共創(chuàng)的互聯(lián)網(wǎng)生態(tài),海外已有大量優(yōu)質(zhì)、結(jié)構(gòu)化的開源數(shù)據(jù)庫,文本來源既包含嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)寫作、百科知識,也包含文學(xué)作品、新聞媒體、社交網(wǎng)站、流行內(nèi)容等,更加豐富的語料數(shù)據(jù)能夠提高模型在不同情景下的對話能力。而受制于搭建數(shù)據(jù)集較高的成本以及尚未成熟的開源生態(tài),國內(nèi)開源數(shù)據(jù)集在數(shù)據(jù)規(guī)模和語料質(zhì)量上相比海外仍有較大差距,數(shù)據(jù)來源較為單一,且更新頻率較低,從而導(dǎo)致模型的訓(xùn)練效果受限。因此,大模型廠商的自有數(shù)據(jù)和處理能力構(gòu)成模型訓(xùn)練效果差異化的核心。受益于移動互聯(lián)網(wǎng)時代積累的海量用戶、應(yīng)用和數(shù)據(jù),互聯(lián)網(wǎng)企業(yè)在自有數(shù)據(jù)上更具特色化和獨占性,疊加更強大的數(shù)據(jù)處理能力,從而能夠通過數(shù)據(jù)優(yōu)勢帶來模型訓(xùn)練成果的差異。例如,阿里在研發(fā)M6時,構(gòu)建了最大的中文多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集M6-Corpus,包含超過1.9TB圖像和292GB文本,涵蓋百科全書、網(wǎng)頁爬蟲、問答、論壇、產(chǎn)品說明等數(shù)據(jù)來源,并設(shè)計了完善的清潔程序以確保數(shù)據(jù)質(zhì)量。百度ERNIE模型的訓(xùn)練數(shù)據(jù)集中也運用了大量百度百科、百度搜索以及百度知識圖譜等生態(tài)內(nèi)數(shù)據(jù),通過更高質(zhì)量的數(shù)據(jù)保障了模型的訓(xùn)練效果。

4.資源投入:互聯(lián)網(wǎng)廠商重研發(fā)投入,資金及人才實力領(lǐng)先

大模型的訓(xùn)練需要較高且可持續(xù)的研發(fā)投入,頭部互聯(lián)網(wǎng)企業(yè)兼具高資本密度和高人才密度優(yōu)勢。資金方面,2022年,騰訊/阿里/百度研發(fā)費用達(dá)614/567/233億元,明顯領(lǐng)先于行業(yè)相關(guān)公司。人才方面,根據(jù)脈脈人才庫,在計算機視覺、深度學(xué)習(xí)、語音識別、自然語言處理4個人工智能重要的技術(shù)方向上,互聯(lián)網(wǎng)大廠是人才儲備最豐富的企業(yè)。持續(xù)的高研發(fā)投入以及極高的人才密度有望驅(qū)動頭部互聯(lián)網(wǎng)企業(yè)保持在AI及大模型領(lǐng)域的領(lǐng)先優(yōu)勢。

5.場景:業(yè)務(wù)豐富多元,互聯(lián)網(wǎng)廠商天然具備落地實踐場景

考慮到數(shù)據(jù)隱私和安全合規(guī),初期通用大模型在行業(yè)落地時可能會面臨一定的信任問題,從而導(dǎo)致較高的獲客成本。而頭部互聯(lián)網(wǎng)平臺基于自身在電商、搜索、游戲、金融等領(lǐng)域豐富的業(yè)務(wù)積累,天然具備落地實踐場景。在提高產(chǎn)品效率的同時,也有望率先形成示范效應(yīng),從而有助于外部客戶和應(yīng)用的拓展。

04

國內(nèi)主要大模型及應(yīng)用端梳理


通過橫向?qū)Ρ雀鲬?yīng)用在完成不同細(xì)分領(lǐng)域任務(wù)時的效果,以及體驗各應(yīng)用的特色功能,認(rèn)為各應(yīng)用間存在差異化的定位:

1)綜合能力強:百度文心一言、訊飛星火為“六邊形戰(zhàn)士”型,在眾多細(xì)分應(yīng)用場景有垂類AI助理解決特定任務(wù);通義千問劃分相應(yīng)垂類AI助理,但數(shù)量少于前兩者;騰訊混元也劃分眾多細(xì)分場景,但仍在內(nèi)測階段,關(guān)注其正式上線節(jié)奏。

2)擅長特定類型任務(wù):智譜清言、豆包分別偏向于辦公效率工具、日常生活助手;商量是商湯多模態(tài)模型系列日日新中的文本對話應(yīng)用,系列內(nèi)其他應(yīng)用具備圖像、視頻、3D模態(tài)的生成能力;百川智能功能則相對較少,主要圍繞文本。

1.百度文心一言大模型

(1)文心一言向全社會開放,生成式AI商用漸進

2023年8月31日,文心一言率先向全社會全面開放。用戶可以在應(yīng)用商店下載“文心一言APP”或登陸“文心一言官網(wǎng)”體驗。此外,百度還將開放一批經(jīng)過全新重構(gòu)的AI原生應(yīng)用,讓廣大用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。

(2)深耕人工智能,具備全棧自研及豐富下游場景

百度深耕人工智能領(lǐng)域,近10年累計研發(fā)投入超1400億元,具備應(yīng)用、模型、框架、芯片四層全棧布局、并在各層都有領(lǐng)先的關(guān)鍵自研技術(shù)。1)底層AI芯片:昆侖芯片,前身為百度智能芯片及架構(gòu)部門,后2021年完成獨立融資,目前有昆侖心1/2兩代量產(chǎn)產(chǎn)品。2)深度學(xué)習(xí)框架:飛槳平臺,集核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件于一體。截至2023年8月,飛槳平臺開發(fā)者數(shù)已達(dá)800萬、模型數(shù)超80萬。3)模型層:“文心一言”為“文心大模型ERNIE”版圖中一員。4)應(yīng)用層:包含搜索等豐富下游場景,可將文心等模型應(yīng)用于具體場景或嵌入具體工具。

(3)文心大模型持續(xù)迭代,AI引領(lǐng)商業(yè)化變革

今年上半年百度文心大模型更新至3.5版本,年底將推出4.0版本。期待百度文心大模型持續(xù)迭代,并在AI應(yīng)用拓展道路上進行率先探索,預(yù)計中長期將對百度的核心競爭力做出貢獻。

文心一言首日用戶數(shù)破百萬。據(jù)百度官網(wǎng),8月31日起,用戶可在APP或登陸官網(wǎng)體驗。據(jù)百度官方,文心一言APP發(fā)布首日用戶數(shù)突破100萬。從體驗來看,文心一言主要有以下特色功能/體驗,有望提高用戶粘性:

1)匯集眾多細(xì)分場景的問答功能

在“發(fā)現(xiàn)”頁面,文心一言就諸多場景提供特定任務(wù)的智能問答功能,如學(xué)習(xí)、情感、娛樂等,其中“學(xué)習(xí)”內(nèi)就可為用戶提供翻譯、大綱生成、復(fù)習(xí)助手等。

2)有社區(qū)生態(tài)與指令模板,降低使用門檻

APP端用戶可分享與文心一言的對話,供其他用戶查看,從而互相學(xué)習(xí)指令以獲得靈感;網(wǎng)頁端內(nèi),“一言百寶箱”提供各應(yīng)用場景提供參考的指令。

3)發(fā)布插件生態(tài)平臺,引入第三方能力

9月1日,文心一言插件生態(tài)“靈境矩陣”開啟內(nèi)測邀請,首批已有近百家企業(yè)入駐,如攜程、WPSAI、愛奇藝、汽車之家、貓眼電影、懂球帝等。

目前,文心一言PC端已正式開放3個插件,為說圖解圖(基于圖片進行文字創(chuàng)作)、E言易圖(基于數(shù)據(jù)提供洞察及圖表制作)、覽卷文檔(基于文檔的摘要與問答)。

2. 科大訊飛星火認(rèn)知大模型2.0版本

2023年8月15日,科大訊飛發(fā)布星火認(rèn)知大模型2.0版本,該版本下大模型各項能力均持續(xù)提升,重點展示了代碼能力和多模態(tài)能力的提升,即根據(jù)文字或語音要求,自動生成和理解代碼、圖片的能力。科大訊飛宣布將這些功能同步到其多個產(chǎn)品和業(yè)務(wù)中,應(yīng)用領(lǐng)域?qū)⒉粩嗤茝V:發(fā)布iFlycode智能編程助手,升級訊飛星火語伴2.0,發(fā)布星火教師助手,提供模型的私有化部署能力。

星火大模型2.0提升了代碼編寫過程中代碼生成、代碼補全、代碼糾錯和單元測試生成功能。在發(fā)布會現(xiàn)場測試中,通過一句話編寫代碼,便可通過python編寫貪吃蛇小游戲,代碼生成能力性能卓越。訊飛星火的代碼生成和補齊能力已經(jīng)超過了ChatGPT,其他各項能力正在快速追趕。公司也給出了代碼能力進步的明確目標(biāo),今年10月24日各個代碼緯度能力都會超過ChatGPT,明年上半年要對標(biāo)GPT4。為了讓研發(fā)人員更好的應(yīng)用星火大模型的代碼能力,同時發(fā)布了全新產(chǎn)品智能編程助手iFlyCode1.0。根據(jù)訊飛內(nèi)部研發(fā)效能平臺對2000余名員工在1個月內(nèi)測試使用iFlyCode1.0的成效數(shù)據(jù)統(tǒng)計,代碼采納率達(dá)30%,編碼效率提升30%,綜合效率提升15%。

訊飛星火首日用戶數(shù)破百萬,兼具細(xì)分應(yīng)用劃分、插件功能。據(jù)科大訊飛公眾號,訊飛星火模型于9月5日正式對公放開,用戶通過訊飛星火APP或官網(wǎng)體驗,上線首日14小時用戶數(shù)量超100萬。

(1)有多模態(tài)能力及多個應(yīng)用場景

訊飛星火劃分出約15個細(xì)分應(yīng)用領(lǐng)域,提供文案創(chuàng)作摘要、文生圖、基于圖片生成描述類故事、代碼糾錯與生成乃至文生視頻等能力。

(2)有插件生態(tài)

訊飛星火也與戰(zhàn)略伙伴共同研制插件生態(tài),據(jù)體驗截至9月中旬APP內(nèi)已有簡歷生成、PPT生成、文檔問答共3個插件。

允許并鼓勵用戶自行開發(fā)AI助手,數(shù)量已破萬。訊飛星火的特色功能之一,是允許用戶通過PC網(wǎng)頁端,自行創(chuàng)建解決特定任務(wù)的AI助手。9月上旬,科大訊飛也發(fā)起現(xiàn)金激勵計劃,活動結(jié)束后助手熱度前十的創(chuàng)作者可瓜分10萬元。據(jù)科大訊飛公眾號,訊飛星火已有約1.4萬款助手應(yīng)用,覆蓋營銷、創(chuàng)作、編程、聊天、學(xué)習(xí)等豐富場景,有助于吸引用戶。

應(yīng)用場景涵蓋多個ToC、ToB終端,關(guān)注后續(xù)迭代升級。C端方面,包括科大訊飛AI學(xué)習(xí)機、訊飛智能辦公本、訊飛聽見、星火語伴等C端軟硬件應(yīng)用和產(chǎn)品;B端方面,訊飛星火目前已經(jīng)與超過1萬家企業(yè)合作對接。到今年10月24日,訊飛星火認(rèn)知大模型將實現(xiàn)對標(biāo)ChatGPT3.5的目標(biāo)(中文超越,英文相當(dāng)),明年上半年對標(biāo)GPT-4。關(guān)注后續(xù)迭代表現(xiàn)。

3.智譜清言

2023年8月31日,北京智譜華章科技有限公司(以下簡稱“智譜AI”)正式上線首款生成式AI助手——智譜清言。該助手基于智譜AI自主研發(fā)的中英雙語對話模型ChatGLM2,用戶可通過蘋果商店AppStore、安卓主流應(yīng)用市場(華為、OPPO、vivo、應(yīng)用寶及小米)下載或搜索微信小程序進行體驗。

作為基于中英雙語對話模型ChatGLM2研發(fā)而成的生成式AI助手,智譜清言通過萬億字符的文本與代碼預(yù)訓(xùn)練,結(jié)合有監(jiān)督微調(diào)技術(shù),以通用對話的產(chǎn)品形態(tài)成為更懂用戶的智能助手,在工作、學(xué)習(xí)和日常生活中賦能用戶,解答用戶各類問題,滿足用戶問詢需求。

智譜AI致力于打造新一代認(rèn)知智能大模型,專注于做大模型的中國創(chuàng)新。公司于2020年底開始研發(fā)GLM預(yù)訓(xùn)練架構(gòu),并訓(xùn)練了百億參數(shù)模型GLM-10B,2021年利用MoE架構(gòu)成功訓(xùn)練出萬億稀疏模型,于2022年合作研發(fā)了雙語千億級超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,并基于此千億基座模型打造大模型平臺及產(chǎn)品矩陣。

今年6月智譜AI將千億模型ChatGLM升級到二代,效果大幅提升,模型支持的上下文長度擴展到32K,并大幅提高推理速度?;诨P湍芰Φ脑鰪?,智譜清言已具備更強大的性能,在多輪對話當(dāng)中,作為一個“有知識、有記憶”的AI助手,智譜清言對上下文理解長度已從2K拓展至32K,儲備了包括科學(xué)、技術(shù)、歷史、文化、藝術(shù)、商業(yè)和其他垂直領(lǐng)域的豐富知識,以此保障用戶人機對話體驗,持續(xù)暢聊無壓力。目前產(chǎn)品已具備通用問答、多輪對話、創(chuàng)意寫作、代碼生成以及虛擬對話等豐富能力,未來還將開放多模生成能力。

(1)指令模板功能優(yōu)化用戶使用體驗

據(jù)體驗,智譜清言具備指令模板功能,可以基于用戶簡單的文字指令,生成最適用的指令模板,或直接就特定場景提供參考模板,用戶根據(jù)提示增改條件描述后,就能生成更符合需求的回答。

(2)智譜完成B4輪融資,阿里騰訊參投

由AI初創(chuàng)公司智譜華章打造,基于自研的千億級ChatGLM2模型。據(jù)36氪,智譜華章于9月中旬完成B4輪融資,騰訊戰(zhàn)投、阿里巴巴戰(zhàn)投等多家機構(gòu)參與投資,投后估值達(dá)到約10億美金。

(3)首個通過分眾梯媒投放廣告的原生AI應(yīng)用

據(jù)分眾傳媒官方視頻號,智譜清言通過分眾電梯LCD投放品牌廣告,主打“寫文案寫代碼寫周報”功能、提高辦公效率。

大模型投放品牌廣告,拉開了大模型之間搶奪新用戶、搶占用戶心智的序幕。密切關(guān)注其他生成式AI應(yīng)用通過分眾梯媒等媒體投放廣告的進展。

4.豆包

2023年8月17日,字節(jié)跳動公測基于云雀大模型開發(fā)的AI對話產(chǎn)品“豆包”,有網(wǎng)頁端、iOS和安卓客戶端,預(yù)置了英語學(xué)習(xí)助手和寫作助手兩個功能。

云雀大模型的定位是一個自然語言內(nèi)容生成和內(nèi)容理解的AI大模型,該模型基于字節(jié)機器學(xué)習(xí)平臺開發(fā),它可以通過自然語言處理技術(shù)與用戶進行對話,回答用戶的問題,提供相關(guān)的信息和建議。

除了語言產(chǎn)品“豆包”,字節(jié)研究團隊還曾公布一個多模態(tài)大模型的學(xué)術(shù)研究項目BuboGPT,該模型能夠處理包括文本、圖像和音頻在內(nèi)的多模態(tài)輸入,即指,不僅可以理解圖像、音頻和文本,并將這些理解與文本輸入和輸出相結(jié)合,還可以定位和描述圖像中的物體以及聲音的來源。

8月31日,字節(jié)旗下AI對話應(yīng)用“豆包”APP正式對公眾放開。據(jù)體驗,豆包主要具備以下特點:

(1)應(yīng)用場景更偏生活化

豆包應(yīng)用功能相對簡約,功能也更偏向生活場景,主要圍繞情感陪伴、旅行規(guī)劃、日常寫作等,應(yīng)用場景較文心一言、訊飛星火也較少。

(2)為生成的事實性內(nèi)容提供索引,提高可信度

根據(jù)用戶需求,若生成的內(nèi)容對真實性要求較高,豆包會在生成結(jié)果末尾附帶引用鏈接,以便用戶確認(rèn)信息真實性,如專業(yè)術(shù)語、現(xiàn)實世界的事件或地理位置等;若用戶的需求僅以聊天、聯(lián)想為主,則豆包不會生成引用鏈接,讓聊天互動盡可能不古板。

5.商湯大模型

(1)商湯發(fā)布“日日新”大模型體系,構(gòu)建面向AGI核心能力

2023年4月10日,商湯舉行技術(shù)交流日,發(fā)布“日日新SenseNova”大模型體系,展示了問答、代碼生成、2D/3D數(shù)字人生成、3D場景/物體生成等AI模型應(yīng)用能力。在落地場景方面,商湯語言大模型在專業(yè)文本理解、代碼生成和輔助初步醫(yī)療問診領(lǐng)域展現(xiàn)出較強的能力,生成式AI在電商、廣告、文旅等領(lǐng)域潛力較大。從商湯大模型體系中,可以看到垂直領(lǐng)域的豐富數(shù)據(jù)對于大模型落地至關(guān)重要,看好具備豐富數(shù)據(jù)的行業(yè)率先通過AI大模型落地實現(xiàn)降本增效。商湯開放自然語言生成、圖片生成等API,以及數(shù)據(jù)標(biāo)注、模型訓(xùn)練及微調(diào)等一系列MaaS(Modelasa Service)服務(wù),我們認(rèn)為從“賣算力”走向“賣模型”可能是大模型企業(yè)發(fā)展的一條新商業(yè)模式。

(2)1800億參數(shù)“商量”大模型賦能專業(yè)知識、代碼生成、醫(yī)療等垂直場景

商湯發(fā)布1800億參數(shù)“商量”語言大模型,主要能力包括:1)長文本理解,相比ChatGPT,SenseChat支持財務(wù)、法務(wù)等專業(yè)領(lǐng)域超長文本知識理解,能夠基于用戶上傳的長文本pdf進行理解和對話。2)代碼生成,Visual Studio Code接入SenseChat插件,根據(jù)用戶指令直接生成代碼,在humaneval測試集上,一次通過率為40.2%,據(jù)商湯表示該數(shù)據(jù)高于Copilot;3)賦能行業(yè),已落地新華醫(yī)院“便捷就醫(yī)服務(wù)”,輔助初步問診、就醫(yī)掛號建議等。

(3)大模型+生成式平臺,有望驅(qū)動垂直行業(yè)降本增效

商湯在生成式AI領(lǐng)域耕耘已久,而“商量”大模型進一步賦能原有的生成式平臺:1)“秒畫”文生圖創(chuàng)作平臺,支持類似Midjourney的提示詞生成圖片,用戶能夠以20張左右圖片,單卡A100在5分鐘內(nèi)定制小模型;2)“如影Sense Avatar”AI數(shù)字人視頻生成平臺,通過五分鐘的手機搜集圖片及音頻信息即可生成支持多語言、多風(fēng)格的數(shù)字人;3)“瓊宇SenseSpace”3D空間生成平臺,將原有1萬人?天級別的人工建模工作量縮減到2天即可呈現(xiàn),涵蓋文旅、電商等領(lǐng)域;4)“格物SenseThings”3D物體生成平臺,能夠完成實時渲染交互,賦能廣告、地產(chǎn)等場景。

(4)商業(yè)模式:MaaS模式可能成為重要新趨勢

商湯日日新大模型開放API體系包含自然語言生成API、圖片生成API、視覺通用感知任務(wù)API和標(biāo)注API。此外,商湯還提供了數(shù)據(jù)標(biāo)注、模型訓(xùn)練及微調(diào)等一系列MaaS服務(wù)。近期,英偉達(dá),百度,商湯等企業(yè)都提出了類似MaaS的新商業(yè)模式,其核心是利用自己已經(jīng)擁有的通用大模型,幫助企業(yè)以專有數(shù)據(jù)創(chuàng)建專有模型。其中,英偉達(dá)提供基于其文字、圖像和生物醫(yī)藥模型的大模型訓(xùn)練服務(wù)AlFoundations,百度推出文心千帆大模型平臺,表示未來云計算商業(yè)模式會變成MaaS。擁有大模型的企業(yè),從“賣算力”走向“賣模型”可能成為AI企業(yè)發(fā)展的一條新商業(yè)模式。

(5)多模態(tài)能力獲得業(yè)內(nèi)廣泛認(rèn)可

1)自然語言應(yīng)用商量

已對接眾多垂直行業(yè)。商量于8月31日正式面向廣大用戶開放服務(wù),底層模型為書生?浦語InternLM-123B,由商湯聯(lián)合多家國內(nèi)頂級科研機構(gòu)發(fā)布。商量具備較強的自然語言處理能力,能完成邏輯推理、規(guī)劃建議、內(nèi)容創(chuàng)作、情感分析等任務(wù),已經(jīng)在金融、醫(yī)療、汽車、地產(chǎn)、傳媒、工業(yè)制造等眾多垂直行業(yè),同超500家客戶建立深度合作。

2)涉及多模態(tài),通過算法備案

其他AI模型均列入9月1日《第二批深度合成服務(wù)算法備案信息清單》中。

其中:數(shù)字人視頻生成平臺如影APP:能幫助用戶輕松創(chuàng)作數(shù)字人短視頻,與播報文字實現(xiàn)同步的口型、表情和動作;3D內(nèi)容生成平臺瓊宇:為杭州亞運會所有AR應(yīng)用提供技術(shù)支持;3D內(nèi)容生成平臺格物:能應(yīng)用于三維場景的圖像生成,預(yù)計也將有APP產(chǎn)品。

6.阿里通義千問?

2022年9月阿里發(fā)布最新“通義”大模型系列,其中通用模型層包含通義-M6、通義-AliceMind和通義-CV三類模型,覆蓋多模態(tài)、自然語言處理、計算機視覺,專業(yè)模型層深入電商、醫(yī)療、法律、金融、娛樂等行業(yè)。

2023阿里云峰會召開,此次大會大規(guī)模語言模型(LLM)“通義千問”正式發(fā)布,成為第四個通用模型。通義千問支持多輪交互及復(fù)雜指令理解、多模態(tài)融合以及外部增強API,應(yīng)用包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等。目前“通義千問”開啟正式的限量邀請體驗。

阿里云將致力于讓AI更普及。對于阿里內(nèi)部,阿里所有產(chǎn)品將接入通義千問大模型全面升級。目前,釘釘、天貓精靈等產(chǎn)品已接入通義千問測試。對于開發(fā)者和企業(yè),1)通義提供多種模型接入和調(diào)入方式,基于靈駿平臺,其支持各種模型一鍵部署云上服務(wù),靈活A(yù)PI調(diào)用、支持模型微調(diào)和定制化。2)推出通義千問-企業(yè)專屬大模型產(chǎn)品,可以通過Web界面或者專屬API開發(fā)。

(1)劃分細(xì)分應(yīng)用場景,但數(shù)量較少

9月13日,阿里云宣布通義千問大模型已首批通過備案,并正式向公眾開放,用戶可通過官網(wǎng)體驗;其中“百寶袋”界面可完成娛樂、效率、生活相關(guān)特定領(lǐng)域任務(wù),但相較文心一言、訊飛星火的數(shù)量較少。目前通義千問暫不支持圖像、音視頻等多模態(tài)能力。

(2)相較于通義千問網(wǎng)站,更應(yīng)重視同名大模型在千行百業(yè)中的應(yīng)用

1)率先開源底層同名模型,關(guān)注后續(xù)在通用、視覺、VR等領(lǐng)域應(yīng)用。8月,阿里云在AI模型社區(qū)魔搭陸續(xù)開源了模型Qwen-7B、Qwen-7B-Chat、Qwen-VL,分別為通用、對話、視覺語言模型,成為國內(nèi)首家發(fā)布開源大模型的互聯(lián)網(wǎng)大廠。Qwen-VL可用于圖像標(biāo)題生成、圖像問答、視覺定位、圖像中文字理解等場景,我們認(rèn)為有望對標(biāo)META的圖像分割模型SAM,為國內(nèi)應(yīng)用廠商提供更容易獲取的模型工具,助力VR/AR應(yīng)用開發(fā)門檻降低。

2)阿里全產(chǎn)品將接入通義千問,賦能集團生態(tài)。據(jù)今年4月阿里云峰會,阿里巴巴所有產(chǎn)品未來將接入通義千問大模型,進行全面改造,如釘釘、淘寶等,有望推動AI體驗快速鋪開。

7.騰訊混元大模型

2023年9月15日,騰訊云宣布,騰訊混元大模型首批通過備案,將正式上線,并陸續(xù)面向公眾開放。騰訊混元大模型是由騰訊全鏈路自研的實用級大模型,擁有超千億參數(shù)規(guī)模、預(yù)訓(xùn)練語料超2萬億tokens,已深度應(yīng)用到多個業(yè)務(wù)場景中,包括騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等在內(nèi)的超百個業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試。

騰訊作為中國最大的軟件服務(wù)商,社交有微信、QQ兩個10億用戶級的產(chǎn)品,游戲占中國市場四成甚至更多的市場份額,旗下還有著中國前兩大的支付工具,前三大的視頻平臺,前三大的短視頻平臺,以及中國最大的音樂App、網(wǎng)文App,此外在辦公領(lǐng)域,騰訊會議、騰訊文檔、企業(yè)微信等產(chǎn)品也有著領(lǐng)先的市場份額?;煸竽P捅晨框v訊,擁有眾多潛在的應(yīng)用場景,落地的場景越多,用戶產(chǎn)生的商業(yè)價值、數(shù)據(jù)也就越多,通用大模型的訓(xùn)練成本及推理成本隨之降低,但模型能力卻會更強,從而形成飛輪效應(yīng)。

(1)混元公開發(fā)布,但仍在內(nèi)測中,重視模型的可靠性與成熟度

9月7日,騰訊自研的通用大語言模型混元正式亮相,擁有超千億參數(shù)規(guī)模,通過騰訊云對公眾開放,但需要申請內(nèi)測名額。據(jù)騰訊,混元能夠做到優(yōu)于業(yè)內(nèi)其他模型的可靠性和成熟度,表現(xiàn)在“胡言亂語”的現(xiàn)象相比主流開源大模型降低了30%至50%,也能識別陷阱問題等。

(2)有多個細(xì)分應(yīng)用場景

在“靈感發(fā)現(xiàn)”功能中,用戶可讓混元解決多個細(xì)分領(lǐng)域的創(chuàng)作需求,包括編程、營銷、角色扮演等。

(3)已接入騰訊的多個B端、C端應(yīng)用

據(jù)騰訊副總裁蔣杰,騰訊將全面擁抱大模型,目前已有超過50個騰訊業(yè)務(wù)和產(chǎn)品接入混元大模型測試,并取得初步效果,如面向B端的騰訊云、騰訊廣告、騰訊金融科技,也有面向C端的騰訊游戲、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等,AI問答助手微信混元助手小程序也開啟內(nèi)測申請。

憑借微信、騰訊會議等高月活應(yīng)用,騰訊有望快速普及自身的AI應(yīng)用,但同時也非常重視產(chǎn)品最終呈現(xiàn)效果,關(guān)注混元及相關(guān)服務(wù)公開節(jié)奏。

8.百川智能

2023年9月6日,百川智能正式發(fā)布微調(diào)后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本,均為免費可商用的開源大模型。目前在主流中英文通用榜單上,Baichuan2性能領(lǐng)先于Meta于7月19日發(fā)布的Llama2,其在中文對話理解方面表現(xiàn)優(yōu)異,且在開源商用上更加徹底。Baichuan不僅在GitHub、HuggingFace等國際開源社區(qū)中上線,最新的Baichuan2也已經(jīng)上線了國內(nèi)的魔塔社區(qū)、昇思社區(qū),在過去的一個月內(nèi),Baichuan系列的下載量超過300萬次,為當(dāng)月下載量最高的開源大模型,Baichuan為大模型開源生態(tài)發(fā)展貢獻了重要力量。未來開源和閉源大模型相互競爭、相互促進,隨著Baichuan等開源大模型的進一步發(fā)展,將加速技術(shù)的迭代與應(yīng)用的拓展。

(1)聚焦文本,功能較少

8月31日,百川智能對公開放,用戶可登錄官網(wǎng)體驗百川大模型,獲得知識問答、文本創(chuàng)作等體驗,目前功能相對較少。

(2)國內(nèi)首發(fā)開源模型,文本能力表現(xiàn)較好

今年6-8月內(nèi),百川相繼發(fā)布了3個參數(shù)級別的通用大模型,其中70億、130億參數(shù)模型開源可商用,為國內(nèi)首家開源模型,在Huggingface下載量已突破三百萬,Baichuan-13BChat(V2)位列8月SuperClue中國產(chǎn)大模型榜首;而530億的模型則在知識性上表現(xiàn)優(yōu)異,擅長知識問答、文本創(chuàng)作等,未來將開放API。

(3)開發(fā)團隊已獲得業(yè)內(nèi)廣泛認(rèn)可

百川智能成立于23年4月10日,由前搜狗公司CEO王小川創(chuàng)立,核心團隊多來自搜狗、百度、華為等頭部互聯(lián)網(wǎng)公司的AI人才。據(jù)官網(wǎng),百川智能已經(jīng)有諸多合作伙伴,涉及騰訊、阿里、字節(jié)等互聯(lián)網(wǎng)大廠,順豐、農(nóng)行等知名企業(yè)。

9.其他AI應(yīng)用梳理:百度輸入法、給麥、筑夢島

后續(xù)有多個AI功能將上線,可關(guān)注相關(guān)產(chǎn)品體驗。9月1日,網(wǎng)信辦發(fā)布第二批境內(nèi)深度合成服務(wù)算法備案信息(2023年8月),共有110個算法獲得備案,不僅涉及文心一言、智譜清言等原生AI應(yīng)用,也有主流互聯(lián)網(wǎng)產(chǎn)品,如抖音、快手、淘寶、愛奇藝、美圖秀秀等。我們認(rèn)為,除了原生AI應(yīng)用,也應(yīng)關(guān)注AI功能在現(xiàn)有互聯(lián)網(wǎng)產(chǎn)品中的引入,有望在現(xiàn)有用戶中快速普及,優(yōu)化現(xiàn)有產(chǎn)品體驗同時提高用戶對AI體驗的認(rèn)知。

下面梳理了近期引入AI功能的主流互聯(lián)網(wǎng)產(chǎn)品,百度輸入法、盛天網(wǎng)絡(luò)給麥、閱文瀟湘書院筑夢島。

(1)百度輸入法:AI輔助日常溝通,關(guān)注其他百度生態(tài)應(yīng)用升級

百度輸入法借文心一言實現(xiàn)全面升級,提高日常溝通效率。文心一言向公眾開放的同日,百度輸入法也全面升級,12小時使用人數(shù)破百萬。本次更新主要上線“超會寫”功能,可以幫助用戶撰寫、潤色文案、輔助創(chuàng)作,提高用戶在日常、工作溝通,或?qū)懺u論、社媒創(chuàng)作中的效率。

后續(xù)還將以AI重構(gòu)搜索、文庫等應(yīng)用。百度還將開放一批經(jīng)過全新重構(gòu)的AI原生應(yīng)用,包括百度搜索、百度APP、百度文庫、百度電商等產(chǎn)品,讓廣大用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。我們認(rèn)為,文心一言的放開將加速上述應(yīng)用的上新節(jié)奏。

(2)給麥&帶帶電競:以AI豐富社交體驗

盛天網(wǎng)絡(luò)近期正式上線音樂社交APP“給麥”。給麥為95后音樂愛好者提供一系列新型社交玩法,如連麥、K歌合唱/練歌、AI聲音進化、推理社交游戲、語音開黑交友等,用戶也可以為主播打賞、一對一私聊等,滿足音樂娛樂及社交需求。帶帶電競連通給麥,提供游戲付費陪玩及社交體驗。

帶帶電競為公司2015年發(fā)布的游戲社交APP,據(jù)體驗,其與給麥APP實現(xiàn)打通,二者共享直播間,用戶通過直播間與主播互動、打賞以外,還可以在帶帶電競獲得游戲社交、陪練、技能分享體驗,用戶需為不同的游戲、時長、陪玩用戶下單不等金額。

給麥推出“AI歌聲進化”功能,實現(xiàn)人聲AI合成。該功能類似“AI孫燕姿”,據(jù)體驗,用戶按APP提示錄制約1分鐘的聲音,“給麥”通過AI模型算法訓(xùn)練后,生成用戶自己的聲音要素,讓用戶嘗試不同語種、風(fēng)格的歌曲。據(jù)觀察目前可合成的歌曲有13首,仍在不斷擴充。

給麥后續(xù)將上線AI歌手、AI-DM等體驗。據(jù)中國證券網(wǎng),給麥還將推出AI歌手/主播功能,讓用戶對歌手做個性化配置,實現(xiàn)千人千面千音體驗;也將推出推理社交海龜湯游戲及在線劇本殺的AI-DM(劇本殺主持人),借助AI多輪對話記憶、邏輯推理能力,讓用戶隨時隨地暢玩。盛天網(wǎng)絡(luò)還表示,后續(xù)還將推出全民演唱會和元宇宙音樂節(jié)等AI社交玩法。帶帶電競也在探索AI虛擬陪伴等體驗,關(guān)注后續(xù)進展。

(3)筑夢島:定位AI情感陪伴體驗,關(guān)注閱文集團AI布局

類似Glow,筑夢島提供AI情感陪伴體驗。閱文集團旗下女生向網(wǎng)文平臺瀟湘書院App,于8月11日開啟內(nèi)測“筑夢島”AI聊天功能,體驗類似于Glow,用戶可以自行創(chuàng)建虛擬人的人設(shè)、性格、頭像,乃至創(chuàng)建特定的背景故事,從而與虛擬人進行更具代入感的對話,獲得情感陪伴體驗。

關(guān)注閱文集團AI布局進展。據(jù)晚點LatePost對閱文CEO侯曉楠的采訪,AI是閱文甚至整個產(chǎn)業(yè)都從沒有面對過的新機會。閱文集團已經(jīng)在多個領(lǐng)域開啟AIGC的內(nèi)測或內(nèi)部效率上的應(yīng)用,如作家可以用作家助手輔助創(chuàng)作,用戶可以和IP角色對話,以及漫畫有聲等開發(fā)環(huán)節(jié),已經(jīng)看到不錯的效果。


05

國內(nèi)大模型未來發(fā)展方向


1. 大模型正在成為推動新一輪科技創(chuàng)新、產(chǎn)業(yè)升級、生產(chǎn)力躍遷的重要力量

隨著前沿技術(shù)推動產(chǎn)業(yè)全鏈條升級,未來從田間到產(chǎn)線,從實驗室到便利店,大模型可能會無處不在。從大模型應(yīng)用類型來看,國外研發(fā)的大模型主要以通用大模型為主,而我國國產(chǎn)大模型更加貼近產(chǎn)業(yè)端,呈現(xiàn)出行業(yè)大模型占比較高的發(fā)展形態(tài)?!耙源竽P蜕杉夹g(shù)為核心,人工智能正在成為下一輪數(shù)字化發(fā)展的關(guān)鍵動力,為解決產(chǎn)業(yè)痛點帶來了全新的思路。

大模型的價值在于應(yīng)用,要在多樣化的實際應(yīng)用場景中賦能智能經(jīng)濟與智能社會的發(fā)展。除了對話、寫詩、作畫等應(yīng)用之外,要將大模型切實投入到城市發(fā)展、金融科技、生物醫(yī)藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,在實體產(chǎn)業(yè)落地,為社會經(jīng)濟帶來實實在在的價值。事實上,利用大模型加速千行百業(yè)的數(shù)字化、智能化轉(zhuǎn)型,深耕實體經(jīng)濟行業(yè),正在成為業(yè)界的共同選擇。

2. 加快布局大模型及其相關(guān)產(chǎn)業(yè),盡快實現(xiàn)關(guān)鍵性突破,建議從算力、數(shù)據(jù)等方面進一步夯實國產(chǎn)大模型根基

大模型的性能主要受算力、數(shù)據(jù)、算法三方面因素影響。在算法方面,國產(chǎn)大模型與國際先進水平相比沒有根本性差異,基本都是圍繞深度神經(jīng)網(wǎng)絡(luò)、注意力機制、人工調(diào)優(yōu)等基礎(chǔ)算法上進行模型結(jié)構(gòu)或局部算法優(yōu)化,而在算力、數(shù)據(jù)等方面則與國際先進水平存在差距。

加快布局大模型及其相關(guān)產(chǎn)業(yè),盡快實現(xiàn)關(guān)鍵性突破,建議從算力、數(shù)據(jù)等方面進一步夯實國產(chǎn)大模型根基。

(1)加快推進算力基礎(chǔ)設(shè)施建設(shè)

推進國家重大算力基礎(chǔ)設(shè)施建設(shè),并以此為基礎(chǔ)進一步形成覆蓋全國的算力網(wǎng)絡(luò),使得算力的供給與使用像電網(wǎng)、水網(wǎng)一樣觸手可及。此外,建設(shè)技術(shù)創(chuàng)新中心、生態(tài)實驗室等平臺,加強中試與驗證,帶動產(chǎn)業(yè)鏈上下游企業(yè)共同攻關(guān)突破新技術(shù)、研發(fā)新產(chǎn)品。

(2)建立可信數(shù)據(jù)聯(lián)盟

為國產(chǎn)大模型訓(xùn)練提供安全的高質(zhì)量數(shù)據(jù),組建面向人工智能大模型的可信數(shù)據(jù)聯(lián)盟,提供高質(zhì)量的豐富中文語料庫,打造數(shù)字時代“四庫全書”。

(3)打造關(guān)鍵領(lǐng)域大模型建設(shè)的標(biāo)桿示范工程

發(fā)揮標(biāo)桿示范工程的引領(lǐng)帶動作用,帶動各行業(yè)積極融入大模型發(fā)展進程,加快形成一批符合國家需求的軟硬件產(chǎn)品和解決方案,形成需求牽引供給、供給創(chuàng)造需求的良性循環(huán)。


國產(chǎn)大模型行業(yè)分析:競爭格局、發(fā)展現(xiàn)狀及應(yīng)用端的評論 (共 條)

分享到微博請遵守國家法律
二连浩特市| 庆安县| 五常市| 葫芦岛市| 通山县| 长乐市| 河南省| 宣恩县| 宣汉县| 余干县| 拉孜县| 固始县| 宜兰县| 奎屯市| 广元市| 博乐市| 苍南县| 泽州县| 古浪县| 渭南市| 永吉县| 武穴市| 马关县| 太谷县| 辽中县| 扎兰屯市| 莱芜市| 雅安市| 张家界市| 同德县| 晋州市| 务川| 辉南县| 楚雄市| 鄂托克旗| 温宿县| 余庆县| 祁东县| 莱州市| 河间市| 西乡县|