最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

ChatGPT開(kāi)啟AI新紀(jì)元,AIGC投資梳理

2023-02-26 09:06 作者:餅干俠cookie  | 我要投稿

一、ChatGPT 開(kāi)啟 AI 新紀(jì)元,指明 NLP 生成領(lǐng)域的技術(shù)方向

ChatGPT 指明了 NLP 生成領(lǐng)域的技術(shù)方向。預(yù)訓(xùn)練語(yǔ)言模型對(duì)于 NLP 理解領(lǐng)域以及生 成領(lǐng)域的問(wèn)題都是相當(dāng)有效的,在過(guò)去幾年里,發(fā)展出的主要模型有 Bert 和 GPT。從文本對(duì)話的過(guò)程來(lái)看,理解到生成之間的連接是一個(gè)關(guān)鍵問(wèn)題。然而,Bert 在 NLP 理解領(lǐng)域獲得了巨大的成功,但是在 NLP 生成領(lǐng)域卻表現(xiàn)不佳,這是由于 Bert 訓(xùn)練時(shí)所采用的語(yǔ)言模型所決定的。Bert 采用的是 DAE 語(yǔ)言模型,只學(xué)習(xí)到了詞的上下文表征的能力,即理解語(yǔ)言的能力,但沒(méi)有學(xué)習(xí)到如何組織語(yǔ)言的能力。而 chatGPT 成功解決了這個(gè)問(wèn)題,可以說(shuō) ChatGPT 指明了 NLP 生成領(lǐng)域的技術(shù)方向。

ChatGPT 從技術(shù)本源上加速 AIGC 發(fā)展。AIGC 的底層技術(shù)主要有 NLP、GAN、擴(kuò)散模 型等,其中的代表就是語(yǔ)言生成中的 chatGPT 和圖像生成中的擴(kuò)散模型(Diffusion Model)。2022 年 8 月 StabilityAI 宣布開(kāi)源 Stable Diffusion 模型,AI 圖像生成成本迅速下降,并且能獲得驚人的高質(zhì)量繪畫作品,達(dá)到學(xué)習(xí)幾年、十幾年的畫師同等水平。而 2022 年 11 月 OpenAI 發(fā)布的 chatGPT 雖然是自然語(yǔ)言生成領(lǐng)域的產(chǎn)品,但是可以生成 AI 繪畫提示詞,或生成調(diào)用計(jì)算引擎,從而進(jìn)一步加速 AI 繪畫、AI 游戲、AI 音視頻領(lǐng)域的應(yīng)用。

我們認(rèn)為,ChatGPT 對(duì) AIGC 發(fā)展的意義在于:一方面,GPT 作為 NLP 生成領(lǐng)域模型 的突破,將迅速解決 AI 文本生成、AI 代碼生成等領(lǐng)域的痛點(diǎn);另一方面,AI 文本生成、AI 代碼生成作為 AI 音視頻、游戲等其他領(lǐng)域的技術(shù)基礎(chǔ),其突破發(fā)展也將加速 AIGC 在音視頻、游戲等場(chǎng)景中的滲透(比如生成 AI 繪畫提示詞,或生成調(diào)用計(jì)算引擎)。

(一)ChatGPT 通過(guò)引入 RLHF 技術(shù)解決生成模型的核心問(wèn)題,大大提高類人成熟度

ChatGPT 是在 GPT 3.5 大語(yǔ)言模型(LLM,即 Large Language Model)的基礎(chǔ)上,加入“基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF,Reinforcement Learning from Human Feedback)”來(lái)不斷微調(diào)?(Fine-tune)預(yù)訓(xùn)練語(yǔ)言模型,使得 LLM 模型學(xué)會(huì)理解不同類型的命令指令,并通過(guò)多重標(biāo)準(zhǔn)合理判斷基于給定的 prompt 輸入指令,輸出的是否為優(yōu)質(zhì)信息(這些標(biāo)準(zhǔn)包括:富含信息、內(nèi)容豐富、對(duì)用戶有幫助、無(wú)害、不包含歧視信息等)。因此,ChatGPT 使得人機(jī)對(duì)話更加人性化,更富有邏輯性,大大提高了 AI 的類人成熟度。

ChatGPT 的技術(shù)發(fā)展路徑:從 GPT-1 到 InstructGPT,數(shù)據(jù)量與參數(shù)量不斷增加,模型 精度和語(yǔ)言能力提升。

1)2018 年,在自然語(yǔ)言處理領(lǐng)域(NLP)剛興起時(shí),OpenAI 就推出了 初代 GPT,它的運(yùn)行邏輯是:先通過(guò)無(wú)標(biāo)簽數(shù)據(jù)學(xué)習(xí)生成語(yǔ)言模型,并能夠運(yùn)用于一些與有監(jiān)督任務(wù)無(wú)關(guān)的 NLP 任務(wù)中。此后再根據(jù)特定的下游任務(wù)進(jìn)行有監(jiān)督的微調(diào),提高其泛化能力。

2)2019 年推出的 GPT-2 擴(kuò)展了網(wǎng)絡(luò)參數(shù)和數(shù)據(jù)集,進(jìn)行多任務(wù)學(xué)習(xí),可以在數(shù)據(jù)量足夠豐富且模型容量足夠大時(shí),通過(guò)訓(xùn)練語(yǔ)言模型就能夠完成有監(jiān)督學(xué)習(xí)的任務(wù)。

3)對(duì)比 GPT-2,2020 年推出的 GPT-3 最顯著的特征是龐大的數(shù)據(jù)量和參數(shù)投入,整體訓(xùn)練過(guò)程耗資 1200 萬(wàn)美元,投入數(shù)據(jù)量達(dá)上萬(wàn)億,模型參數(shù)量達(dá)到 1750 億。GPT-3 延續(xù)了前兩代 GPT 的技術(shù)架構(gòu),但改變了“大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練+下游數(shù)據(jù)標(biāo)注微調(diào)”的方式,采用情境學(xué)習(xí)(in-context learning)來(lái)提高模型對(duì)話輸出的性能。GPT-3 的規(guī)模和語(yǔ)言能力幾乎是最強(qiáng)大的。它能在不做微調(diào)的情況下,在一些傳統(tǒng)的 NLP 任務(wù)中表現(xiàn)得更好,包括實(shí)現(xiàn)閉卷問(wèn)答、模式解析、純語(yǔ)言建模、機(jī)器翻譯等;在新的領(lǐng)域,GPT-3 將 NLP 的應(yīng)用擴(kuò)展到缺乏足夠訓(xùn)練數(shù)據(jù)的領(lǐng)域,例如在開(kāi)發(fā)程序代碼、文章生成和信息檢索領(lǐng)域取得了實(shí)質(zhì)性的進(jìn)展。然而,GPT-3 在推理和理解能力上還有較長(zhǎng)的路要走,在自然語(yǔ)言推理(NLI)任務(wù)中表現(xiàn)不佳。

ChatGPT 在 InstructGPT 模型上做改進(jìn),實(shí)現(xiàn)更好地遵循用戶意圖、更少的虛假信息。OpenAI在2022年3月發(fā)布了InstructGPT。該語(yǔ)言模型通過(guò)“基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)和監(jiān)督學(xué)習(xí)”來(lái)提高輸出質(zhì)量。雖然 InstructGPT 的參數(shù)量?jī)H為 13 億左右,相比于 GPT-3 縮小 了 100 倍以上;但在遵循指令方面,能夠更好地遵循用戶意圖,將有害的、不真實(shí)或者有偏差的信息輸出最小化。在優(yōu)化的模型上,ChatGPT 基于 InstructGPT 進(jìn)一步改進(jìn),在模型結(jié)構(gòu)和訓(xùn)練流程上遵循上述方式,但收集和標(biāo)注數(shù)據(jù)的方式上發(fā)生了變化,通過(guò)采取監(jiān)督學(xué)習(xí)的方式讓模型學(xué)習(xí)人類排序的方式。

(二)ChatGPT 商業(yè)化規(guī)劃及仍需討論的問(wèn)題

ChatGPT 成為史上最快達(dá)到 1 億月活躍用戶的應(yīng)用。ChatGPT 在 1 月達(dá)到 1 億月活躍用戶,平均每天有 1300 多萬(wàn)訪客。目前 OpenAI 已推出每月 20 美元(約合 135 人民幣)的 ChatGPT 用戶個(gè)人訂閱計(jì)劃,即使在軟件的使用高峰時(shí)段,訂閱用戶也可以優(yōu)先使用 AI 聊天機(jī)器人。

在 Gartner 發(fā)布的 2022 年新興技術(shù)成熟度曲線中,生成性 AI 處于技術(shù)萌芽期并加速發(fā) 展中。Gartner 將生成性 AI 列為 2022 年五大影響力技術(shù)之一,預(yù)測(cè)到 2025 年生成性 AI 所創(chuàng)造的數(shù)據(jù)可占到所有已生產(chǎn)數(shù)據(jù)的 10%。

ChatGPT 的能力目前幾乎可以涵蓋各個(gè)自然語(yǔ)言交互領(lǐng)域,例如聊天機(jī)器人、對(duì)話系統(tǒng)、智能客服、信息檢索、主題建模、文本生成和總結(jié)、NLP 作為服務(wù)的翻譯、轉(zhuǎn)錄、總結(jié)等等,未來(lái)應(yīng)用領(lǐng)域?qū)⒚嫦蛩{(lán)海。例如,在聊天機(jī)器人領(lǐng)域,目前 ChatGPT 已經(jīng)能基本滿足用戶的提供個(gè)性化需求和信息提供服務(wù);在需要智能客服的電商、金融、醫(yī)療、教育、政務(wù)等垂直領(lǐng)域等,ChatGPT 能夠結(jié)合行業(yè)特點(diǎn)和需求,構(gòu)建自動(dòng)應(yīng)答系統(tǒng),為客戶提供快速、準(zhǔn)確的問(wèn)題解答。除此外,在傳媒、娛樂(lè)、設(shè)計(jì)和影視領(lǐng)域,ChatGPT 能夠協(xié)助完成一些較低層次的任務(wù),包括文稿生成、采訪助手、摘要總結(jié)等,或?qū)⑻岣咝袠I(yè)的運(yùn)行效率。

ChatGPT 存在的缺陷之一:目前 ChatGPT 在精準(zhǔn)性、真實(shí)性、重復(fù)率和依賴性等問(wèn)題 上尚待改善。第一、由于技術(shù)實(shí)現(xiàn)的問(wèn)題,ChatGPT 會(huì)不可避免地寫出一些似是而非、或者荒謬的答案,這將導(dǎo)致植入虛假數(shù)據(jù)和誤導(dǎo)用戶的風(fēng)險(xiǎn)。ChatGPT 依然沒(méi)有完全克服大型語(yǔ)言模型(LLM)的這一常見(jiàn)缺點(diǎn);第二、在較長(zhǎng)的會(huì)話中,由于訓(xùn)練數(shù)據(jù)的偏差和過(guò)度修正,ChatGPT 會(huì)過(guò)度強(qiáng)調(diào)某些短語(yǔ)或者句子,導(dǎo)致重復(fù)性高的問(wèn)題;第三、ChatGPT 的強(qiáng)大能力依賴語(yǔ)料庫(kù)、數(shù)據(jù)量的抓取和復(fù)雜的訓(xùn)練過(guò)程。ChatGPT 模型依賴于大規(guī)模離線語(yǔ)料進(jìn)行訓(xùn)練,往往不能充分接受并采用在線提供的即時(shí)信息,難以理解對(duì)話中提及的因果關(guān)系,也無(wú)法基于已有信息進(jìn)行推測(cè),這距離人類舉一反三的能力相差較遠(yuǎn)。

ChatGPT 存在的缺陷之二:其應(yīng)用過(guò)程中安全性、倫理約束、權(quán)責(zé)界定以及知識(shí)產(chǎn)權(quán)等 相關(guān)法律問(wèn)題尚未解決。一方面,由于 RLFH 并不能完全避免 ChatGPT 訓(xùn)練庫(kù)中學(xué)習(xí)到的不道德或有偏見(jiàn)的回答,也會(huì)導(dǎo)致在模糊提示或引導(dǎo)回答的過(guò)程中讓 ChatGPT 輸出一些有害信息,導(dǎo)致輸出結(jié)果的安全性降低,有可能產(chǎn)生權(quán)責(zé)無(wú)法界定的法律問(wèn)題。另一方面,在創(chuàng)造性、創(chuàng)作倫理和知識(shí)產(chǎn)權(quán)等方面并未形成有效界定。在數(shù)據(jù)挖掘、大規(guī)模計(jì)算、統(tǒng)計(jì)、多線程工作等數(shù)據(jù)處理分析領(lǐng)域,人工智能有著人類不可比擬的優(yōu)勢(shì),但是以“創(chuàng)新和感知”為基礎(chǔ)的創(chuàng)造過(guò)程是機(jī)器學(xué)習(xí)和模型難以訓(xùn)練的。目前 ChatGPT 能夠在用戶的引導(dǎo)下快速生成小說(shuō)、詩(shī)歌、散文、編程等需要?jiǎng)?chuàng)造力的內(nèi)容,或許將對(duì)創(chuàng)作者和以版權(quán)為基礎(chǔ)的行業(yè)造成沖擊。文本生成的過(guò)程是基于數(shù)據(jù)庫(kù)內(nèi)容的學(xué)習(xí),這是否會(huì)構(gòu)成對(duì)被抓取作品的侵權(quán),ChatGPT 生成的文本內(nèi)容是否具有著作權(quán),是否屬于該用戶等一系列問(wèn)題的答案尚不明確。

(三)全球巨頭爭(zhēng)相追趕,與 ChatGPT 水平尚存一定差距

國(guó)外公司中,谷歌發(fā)布的聊天機(jī)器人 Bard 具有與 ChatGPT 接近的技術(shù)水平,可能相差 半年左右。2023 年 2 月 6 日,Google CEO 發(fā)布了與 ChatGPT 對(duì)標(biāo)的產(chǎn)品 Bard。Bard 是基于由 Google 于兩年前就開(kāi)始的 LaMDA(Language Model for Dialogue Applications,用于對(duì)話應(yīng)用的語(yǔ)言模型)模型的輕量級(jí)版本。LaMDA 和 GPT-3 本質(zhì)上是非常類似的模型,都是使用 Transformer 架構(gòu)的大語(yǔ)言模型配以 RLHF,已公開(kāi)的 LaMDA 最大的版本是 1370 億參數(shù)的模型,比 GPT-3 略少。

從谷歌 22 年發(fā)布的 LaMDA 的論文來(lái)看,LaMDA 關(guān)注三個(gè)關(guān)鍵目標(biāo):?質(zhì)量、安全和憑據(jù),從這三個(gè)關(guān)鍵目標(biāo)來(lái)看的話,Google 相比于 OpenAI 還是謹(jǐn)慎了很多,這可能也是 Bard 遲遲未推出的原因。國(guó)內(nèi)公司中,百度、華為、字節(jié)跳動(dòng)、阿里、騰訊等巨頭均在大模型方向布局,整體發(fā)展水平與 ChatGPT 相差大概一到兩年左右,約達(dá)到接近 GPT-3 的水平。其中,百度進(jìn)展比較突出,百度的文心一言應(yīng)用是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品,將于 2023 年 3 月完成內(nèi)測(cè),面向公眾開(kāi)放。文心大模型的參數(shù)量已經(jīng)達(dá)到 2600 億,已經(jīng)超過(guò) GPT-3 水平。從 GPT 模型發(fā)展三要素算力、數(shù)據(jù)、模型來(lái)看,國(guó)內(nèi)巨頭與 ChatGPT 的主要差距體現(xiàn)在模型結(jié)構(gòu)的設(shè)計(jì)上,由于 GPT3.5 缺少相關(guān)論文,也沒(méi)有開(kāi)源,國(guó)內(nèi)在代碼的訓(xùn)練及推理上仍缺積累。

二、AIGC 多場(chǎng)景應(yīng)用處于爆發(fā)前夜,千億市場(chǎng)打開(kāi)

(一)AIGC 發(fā)展痛點(diǎn)逐步解除,亟待爆發(fā)

AIGC 并非新興概念,只是過(guò)往受限于優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)不足、高額的算力成本或是模型算法 難題,AIGC 發(fā)展較慢,僅限于實(shí)驗(yàn)范圍。在人工智能尚不具備完整表達(dá)和生成內(nèi)容能力的時(shí)期,人工智能生成內(nèi)容僅能用于簡(jiǎn)單的 AI 問(wèn)答和聊天機(jī)器人領(lǐng)域,受限于模型算法,生成內(nèi)容沒(méi)有創(chuàng)新,也較為呆板。但隨著算力成本下降、數(shù)據(jù)形態(tài)和數(shù)量更加豐富,在不同領(lǐng)域 AIGC 都得到了飛速發(fā)展。

1. AI 文本生成領(lǐng)域:痛點(diǎn)在于上下文關(guān)聯(lián)、自然語(yǔ)言生成的能力

文本生成領(lǐng)域是 AIGC 最早觸及的領(lǐng)域。除了較早進(jìn)行探索的智能客服和聊天機(jī)器人領(lǐng) 域,早期文本生成主要應(yīng)用于輔助寫作或者結(jié)構(gòu)化寫作。此前的文本生成一直面臨的巨大挑戰(zhàn)在于:(1)上下文關(guān)聯(lián)能力;(2)自然語(yǔ)言生成能力;(3)邏輯能力。由于傳統(tǒng)的聊天機(jī)器人采用“基于模板”或者“基于規(guī)則”的算法,開(kāi)發(fā)人員通過(guò)預(yù)設(shè)一些較為固定的規(guī)則和模板后,AI 根據(jù)用戶輸入的內(nèi)容在已有模板中進(jìn)行認(rèn)知識(shí)別和匹配,然后生成回復(fù)。這種方法效率高、訓(xùn)練難度較低,但是訓(xùn)練后的模型缺乏普適性和靈活度,且難以支持復(fù)雜程度較高的會(huì)話任務(wù),也不能進(jìn)行上文記憶。因此人們?cè)谂c傳統(tǒng)聊天機(jī)器人對(duì)話時(shí)會(huì)感覺(jué)到“答非所問(wèn)”、“車輪式對(duì)話”。對(duì)于通用性內(nèi)容的文本生成來(lái)說(shuō),語(yǔ)言流暢性、思維深度和原創(chuàng)性是評(píng)價(jià)文章內(nèi)容的標(biāo)準(zhǔn)。人工智能輸出文字的本質(zhì)在于計(jì)算機(jī)語(yǔ)言對(duì)于人類自然語(yǔ)言的模擬,創(chuàng)造來(lái)源于人工智能基于邏輯的計(jì)算和判斷,此前人工智能無(wú)法生成流暢文本的重要原因在于訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量都較小。GPT 模型的“有監(jiān)督微調(diào)”和“對(duì)齊”的技術(shù)架構(gòu)提高了模型對(duì)數(shù)據(jù)的理解能力,也相應(yīng)提高了結(jié)果匹配精度,在語(yǔ)句搭配的選擇上更具優(yōu)勢(shì),因此生成文本的可讀性有了大幅提升。

2. AI 繪畫領(lǐng)域:痛點(diǎn)在于高額的算力成本

AI 學(xué)習(xí)繪畫的實(shí)質(zhì)過(guò)程是通過(guò)對(duì)已有畫作的訓(xùn)練數(shù)據(jù),通過(guò)模型和參數(shù)迭代輸出有規(guī)律 的像素組合。由于圖片所包含的信息量遠(yuǎn)高于文字包含的信息量,像素點(diǎn)位置、色彩、數(shù)量等共同組成龐大的參數(shù)組,因此深度學(xué)習(xí)該參數(shù)組需要足量的算力。目前 AI 繪畫根據(jù)文字提示輸出圖片需要經(jīng)歷兩個(gè)過(guò)程:理解文字提示所包含的信息,再匹配生成相應(yīng)的圖像。此前一直難以發(fā)展的原因在于:(1)繪畫細(xì)節(jié)不足、分辨率低;(2)參數(shù)量過(guò)大導(dǎo)致渲染時(shí)間過(guò)長(zhǎng);?(3)算力和內(nèi)存不足。此后,新的深度學(xué)習(xí)模型 CLIP(Contrastive Language-Image Pre-Training),通過(guò)優(yōu)化采樣的方式將完成了“文字-圖片”匹配的跨越,而計(jì)算機(jī)視覺(jué)模型 Diffusion 的模型降維優(yōu)化降低了對(duì)顯卡的需求,加上算力成本的逐漸降低,AI 繪畫應(yīng)用迅速崛起。

3. AI 音視頻、游戲等其他領(lǐng)域:需要 AI 文本生成和 AI 繪畫提供技術(shù)基礎(chǔ)

輔助在 AI 文本生成和 AI 繪畫有所發(fā)展的技術(shù)基礎(chǔ)上,音頻、視頻、2/3D 建模、游戲等等領(lǐng)域才逐步被 AI 所滲透。以音頻領(lǐng)域?yàn)槔磥?lái) AIGC 將在語(yǔ)音合成和音樂(lè)合成領(lǐng)域有所進(jìn)展。但由于一段音頻包括的數(shù)據(jù)量相較于文字和圖片都更大,也更抽象,因此目前還難以找到很好的訓(xùn)練方式。同理,以交互和實(shí)時(shí)反饋為基礎(chǔ)的游戲領(lǐng)域也是如此。游戲制作過(guò)程中涉及的每一個(gè)輪次在未來(lái)都將有相應(yīng)的生成式 AI 模型發(fā)展,從 2/3D 建模、對(duì)話生成、對(duì)話語(yǔ)音封裝等等,需要前期在文字、圖像和音頻領(lǐng)域有堅(jiān)實(shí)的技術(shù)積累。

(二)ChatGPT 助力,文本、代碼、圖像生成有望率先成熟,視頻、游戲緊隨其后

大模型輔以新架構(gòu),推動(dòng) AIGC 進(jìn)入殺手級(jí)應(yīng)用涌現(xiàn)階段。在 2015 年前,人工智能發(fā)展 以小模型為主導(dǎo)地位,能夠較好地適應(yīng)在垂直領(lǐng)域的分析任務(wù),但是在通用交互相關(guān)的任務(wù)上,由于表達(dá)和理解能力欠缺,無(wú)法完成生成類的任務(wù)。但隨著計(jì)算機(jī)深度學(xué)習(xí)模型的進(jìn)展,人們開(kāi)發(fā)出新型神經(jīng)網(wǎng)絡(luò)架構(gòu) transformer、擴(kuò)散模型 diffusion 等新技術(shù),同時(shí)算力成本降低,開(kāi)發(fā)人員才逐漸開(kāi)始探索并訓(xùn)練大語(yǔ)言模型(Large Language Model,即大模型)。我們認(rèn)為,ChatGPT 對(duì) AIGC 發(fā)展的意義在于:一方面,GPT 作為 NLP 生成領(lǐng)域模型的突破,將迅速解決 AI 文本生成、AI 代碼生成等領(lǐng)域的痛點(diǎn);另一方面,AI 文本生成、AI 代碼生成作為 AI 音視頻、游戲等其他領(lǐng)域的技術(shù)基礎(chǔ),其突破發(fā)展也將加速 AIGC 在音視頻、游戲等場(chǎng)景中的滲透(比如生成 AI 繪畫提示詞,或生成調(diào)用計(jì)算引擎)。

ChatGPT 成功的關(guān)鍵是人類反饋強(qiáng)化與獎(jiǎng)勵(lì)機(jī)制,其應(yīng)用層的良好效果,為 AIGC 領(lǐng)域 提供了普適性的模型優(yōu)化思路。目前內(nèi)容生成領(lǐng)域還處于用戶創(chuàng)作(UGC)或者 AI 輔助用戶創(chuàng)作(AIUGC)為主的階段,但 ChatGPT 的底層技術(shù)已被逐漸遷移向以下領(lǐng)域:

(1)在文本生成領(lǐng)域,AI 在文章潤(rùn)色、拼寫檢查修改等輔助性寫作領(lǐng)域的能力將更加穩(wěn) 定,除此外,自然語(yǔ)言生成能力的提升賦予 AI 更好地完成結(jié)構(gòu)化程度較高的文本初稿,例如電子郵件、新聞等領(lǐng)域,甚至在一些非結(jié)構(gòu)化的文章,例如社交媒體、廣告營(yíng)銷、文學(xué)等領(lǐng)域的創(chuàng)作也能提供幫助;理解歸納能力的提升將推動(dòng)大量辦公輔助類工具的落地,例如會(huì)議紀(jì)要、文檔翻譯、筆記管理等,提高整體辦公效率。

(2)在代碼開(kāi)發(fā)領(lǐng)域,基于上下文理解能力,AI 進(jìn)行代碼注釋、代碼補(bǔ)全或代碼檢查的 相關(guān)應(yīng)用將有可能在短期內(nèi)落地。雖然與文本生成的底層技術(shù)相類似,但是代碼生成對(duì) AI 工具的穩(wěn)定性、以及自然語(yǔ)言和代碼的相互轉(zhuǎn)換的精準(zhǔn)性提出了更高的要求。目前已有海外公司研發(fā)出穩(wěn)定的 AI 輔助工具,可以實(shí)時(shí)顯示代碼示例并提供錯(cuò)誤反饋。

(3)在智能問(wèn)答領(lǐng)域,目前 AI 文本生成的技術(shù)已相對(duì)成熟,理解能力和表達(dá)能力的提升突破了現(xiàn)有客服“回答千篇一律、答非所問(wèn)”的情況。未來(lái),從底層模型的微調(diào)和強(qiáng)化將使得模型分化出不同的技能樹(shù),或?qū)⒃凇皢?wèn)題解決、服務(wù)效率和使用體驗(yàn)”等三個(gè)方面全面提升用戶的使用體驗(yàn)。

(4)在圖像生成領(lǐng)域,目前 GPT 模型的圖像生成能力相對(duì)弱于 Diffusion 模型,但是在 利用 GPT 生成文字提示的基礎(chǔ)上,AI 可以根據(jù)擴(kuò)散模型生成更優(yōu)質(zhì)的 AI 繪畫作品。未來(lái),傳統(tǒng)圖片編輯能力將大幅提升,摳圖、去除特定主體等技術(shù)將更加優(yōu)化,AI 按照文字提示或者示意圖生成圖片的能力將進(jìn)一步提升。

(5)在視頻、游戲和 3D 領(lǐng)域,所需底層技術(shù)更多,技術(shù)能力更加交叉,需要以目前已 有模型作為基礎(chǔ)技術(shù)實(shí)現(xiàn)。以視頻領(lǐng)域?yàn)槔?,視頻是音頻和圖像的結(jié)合,語(yǔ)音合成目前已有所探索,但是耗時(shí)和相似度還有所欠缺,要實(shí)現(xiàn)完全自然的人類語(yǔ)音的合成仍然需要時(shí)間的積累。目前對(duì) AI 視頻生成的探索中,應(yīng)用場(chǎng)景、素材選擇的限制仍然較多,在未來(lái)音頻和圖像領(lǐng)域發(fā)展到更加成熟的階段后,視頻生成或許將擁有更大的自由度。

(三)AIGC 海外公司布局梳理

目前海外 AIGC 行業(yè)正呈現(xiàn)百花爭(zhēng)艷的狀態(tài)。根據(jù) Leonis Capital 統(tǒng)計(jì),截至 2022 年 12 月,海外對(duì)于生成式 AI 的風(fēng)險(xiǎn)投資從 2020 年約五億美金增長(zhǎng)到超過(guò) 22 億美金,增長(zhǎng)幅度超過(guò) 400%。目前文本和繪畫領(lǐng)域的技術(shù)成熟度較高,音視頻領(lǐng)域、代碼生成和更為復(fù)雜的多模態(tài)生成領(lǐng)域目前底層技術(shù)原理已經(jīng)基本具備,但還需要靜候發(fā)展。

(四)AIGC 細(xì)分市場(chǎng)規(guī)模預(yù)測(cè):2025 年有望百倍增長(zhǎng)

目前,AIGC 所覆蓋的領(lǐng)域基本屬于 AI 軟件與服務(wù)。根據(jù) Statista 的預(yù)測(cè)數(shù)據(jù),全球 AI 軟件的市場(chǎng)規(guī)模將在 2025 年超過(guò) 1200 億美元,2021 年到 2025 年的 CAGR 為 38.01%。在 AIGC 發(fā)展的推動(dòng)下,未來(lái)人工智能市場(chǎng)規(guī)模將以更快的速度增長(zhǎng)。

雖然目前 AIGC 已經(jīng)涉及文字、圖像、代碼、語(yǔ)音、視頻、3D、游戲等多種內(nèi)容形式的生成,但是每個(gè)領(lǐng)域的技術(shù)成熟度、底層技術(shù)難度均有差距,因此未來(lái) AIGC 的滲透率將有所差別。2021 年 AI 制作的比例僅占市場(chǎng)的 1%-2%左右,隨著技術(shù)發(fā)展,我們預(yù)測(cè),到 2025 年 AIGC 在網(wǎng)絡(luò)文學(xué)領(lǐng)域、文本分析領(lǐng)域、繪畫及圖片領(lǐng)域、數(shù)字音樂(lè)領(lǐng)域技術(shù)將相對(duì)成熟,因此滲透率分別為 70%/60%/60%/50%,網(wǎng)絡(luò)視頻領(lǐng)域、游戲領(lǐng)域由于技術(shù)原因滲透率相對(duì)較低,分別約為 30%/25%?;谏鲜黾僭O(shè),我們分別對(duì) AIGC 細(xì)分領(lǐng)域針對(duì)中國(guó)市場(chǎng)做 2025 年的市場(chǎng)規(guī)模預(yù)測(cè),預(yù)計(jì) 2025 年中國(guó) AIGC 市場(chǎng)規(guī)模有望達(dá)到 1600 億。

三、AIGC 產(chǎn)業(yè)鏈:基礎(chǔ)層最先受益,中間層巨頭占優(yōu)

(一)AIGC 產(chǎn)業(yè)鏈結(jié)構(gòu)及巨頭布局

AIGC 產(chǎn)業(yè)鏈可大致分為上中下三層架構(gòu)。第一層為基礎(chǔ)層,以預(yù)訓(xùn)練模型為基礎(chǔ)搭建的 AIGC 技術(shù)基礎(chǔ)設(shè)施層,包括芯片、服務(wù)器等硬件提供商以及大模型技術(shù)提供商。第二層為中間層,通過(guò)基礎(chǔ)層的模型,進(jìn)行特定訓(xùn)練,形成垂直化、場(chǎng)景化、定制化的應(yīng)用工具。第三層為應(yīng)用層,即面向 C 端用戶提供圖像、語(yǔ)音、文字生成等各種 AIGC 的應(yīng)用。鑒于大模型訓(xùn)練需要巨大的算力規(guī)模,基礎(chǔ)層中的芯片、服務(wù)器等硬件提供商將最先受益。而對(duì)于中間層來(lái)說(shuō),技術(shù)積累以及資金實(shí)力都是關(guān)鍵競(jìng)爭(zhēng)力,因此我們認(rèn)為科技巨頭更具有競(jìng)爭(zhēng)優(yōu)勢(shì)。應(yīng)用層中,可類比移動(dòng)互聯(lián)網(wǎng)時(shí)代,會(huì)爆發(fā)出很多殺手級(jí)應(yīng)用,用戶體驗(yàn)和模式創(chuàng)新都將成為“殺手鉗”。

(二)GPT 模型所需算力測(cè)算

GPT-3 訓(xùn)練所需算力:?根據(jù) OPENAI 公布的論文附錄,GPT-3 175B 共有 1746 億個(gè)參數(shù),訓(xùn)練該模型需要經(jīng)過(guò) 3.14E+23 個(gè)浮點(diǎn)運(yùn)算,總算力為 3640 PF-days。換言之,在每秒進(jìn)行 1 萬(wàn)億次浮點(diǎn)運(yùn)算的計(jì)算速度下,GPT-3 175B 需要耗時(shí) 364 天。

論文中表明,GPT-3 的模型訓(xùn)練是在微軟提供的 V100 GPU 上完成的。由于微軟與 OPENAI 并未公布人才合作共建的超級(jí)計(jì)算機(jī)的硬件細(xì)節(jié),未知其 V100 的運(yùn)算成本效率,因此 V100 GPU 型號(hào)細(xì)節(jié)參考 NVIDIA 官網(wǎng)公布的 TESLA V100。其采用 NVIDIA Volta 架構(gòu),帶有 16GB 和 32GB 兩種配置,單個(gè) GPU 即可提供高達(dá) 100 個(gè) CPU 的性能,訓(xùn)練吞吐量比使用 CPU 快 32 倍,推理吞吐量比使用 CPU 快 24 倍,配備 V100 GPU 的單臺(tái)服務(wù)器可以取代數(shù)百臺(tái)僅配備通用 CPU 的服務(wù)器來(lái)處理傳統(tǒng)的高性能計(jì)算和人工智能工作負(fù)載。

GPT-3 訓(xùn)練所需總成本:?模型的算力需求幾乎與參數(shù)量呈同比增長(zhǎng)。單一 V100 GPU 芯片進(jìn)行一次 GPT-3 13B 模型的訓(xùn)練,大約需要 2144 天;進(jìn)行一次 GPT-3 175B 模型的訓(xùn)練,大約需要 29120 天。由于 NVIDIA 官網(wǎng)公布的最快的 V100 深度學(xué)習(xí)性能達(dá)到 125 TFlops,按照 GPT-3 13B 模型的算力需求 268 PF-days, 單個(gè) V100 GPU 需要進(jìn)行:268/0.125 = 2144 天的運(yùn)算;同理,完成一次 GPT3 175B 運(yùn)算的算力需求為 3640 PF-days,單個(gè) V100 GPU 需要進(jìn)行 29120 天的計(jì)算。GPT-3 13B 發(fā)展到 GPT-3 175B,參數(shù)量擴(kuò)大 13.73 倍,算力需求擴(kuò)大 13.58 倍,兩者幾乎同比增長(zhǎng)。若以一個(gè)容量為 28 Tflops 的 V100 GPU 為例,完成 GPT-3 13B 和 GPT-3 175B 模型理論上分別需要 26 個(gè) GPU 年和 355 個(gè) GPU 年的運(yùn)算。根據(jù) Cloud GPU Comparison 公布的數(shù)據(jù),Microsoft Azure 的 V100 型號(hào)使用成本為$3.06/H, 我們測(cè)算 GPT-3 13B 訓(xùn)練總成本約為:$3.06 /H * 24 H/D * 365 D/Y * 26Y = $0.7 Million;同理,GPT-3 175B 訓(xùn)練總成本約為$ 9.5 Million。

GPT-3 運(yùn)行所需芯片成本:?除此外,根據(jù) OpenAI 的白皮書,GPT-3 使用每個(gè)參數(shù) 16 位的半精度浮點(diǎn)變量,這說(shuō)明 1750 億參數(shù)至少需要有 175*4=700 GB 的空間才能存儲(chǔ)(每個(gè)參數(shù)需要 4 個(gè)字節(jié))。若以此計(jì)算,相當(dāng)于至少 22 塊 32GB 內(nèi)存的 Tesla V100 GPU,每塊約 9000 美元,則不計(jì) RAM、CPU、SSD 驅(qū)動(dòng)器、電源等其他情況下,芯片成本在至少 20 萬(wàn)美元以上。

四、A 股相關(guān)公司介紹

1、浪潮信息——全球 AI 服務(wù)器龍頭

技術(shù)發(fā)展:浪潮信息人工智能服務(wù)器的市占率位居全球第一,在中國(guó)市場(chǎng)份額連續(xù)五年保持 50%以上。公司行業(yè)競(jìng)爭(zhēng)力強(qiáng)勁,致力于十四五期間成為全球服務(wù)器龍頭公司。根據(jù) IDC 數(shù)據(jù)顯示,2022 年,公司在全球服務(wù)器行業(yè)市占率排名第三,市占率分別為 9.9%;在國(guó)內(nèi)服務(wù)器行業(yè),公司更是當(dāng)之無(wú)愧的龍頭廠商,2020 年市占率 35.6%,高于排名第二第三的華為和新華三總和。

業(yè)務(wù)布局:2 月 10 日,浪潮信息推出 AI 算力服務(wù)產(chǎn)品,將基于國(guó)內(nèi)領(lǐng)先智算中心的算力基礎(chǔ)設(shè)施,為國(guó)內(nèi)客戶提供先進(jìn)、開(kāi)放、高性能、高質(zhì)量的 AI 算力資源和配套服務(wù),支撐 AI 模型構(gòu)建、訓(xùn)練和推理的業(yè)務(wù)全流程,賦力生成式 AI 產(chǎn)業(yè)創(chuàng)新。目前,AI 算力服務(wù)相關(guān)信息已在元腦生態(tài) AIStore 平臺(tái)上線,包括有多種算力、數(shù)據(jù)、算法等可選產(chǎn)品。浪潮信息此次推出的 AI 算力服務(wù)產(chǎn)品,包括支持國(guó)際和國(guó)內(nèi)領(lǐng)先的的 4 種 AI 算力產(chǎn)品、經(jīng)“源”清洗驗(yàn)證過(guò)的語(yǔ)言或多模態(tài)的大模型數(shù)據(jù)集的 2 種數(shù)據(jù)產(chǎn)品、由浪潮“源”專家團(tuán)隊(duì)提供的語(yǔ)言或多模態(tài)的大模型訓(xùn)練支持的 2 種算法產(chǎn)品以及 AI 訓(xùn)練推理資源管理調(diào)度的 1 種平臺(tái)產(chǎn)品。

2、彩訊股份——信創(chuàng)+國(guó)資云+AIGC 三駕馬車

技術(shù)發(fā)展:公司在智能問(wèn)答、圖像識(shí)別、語(yǔ)音語(yǔ)義識(shí)別等產(chǎn)品方向均有所涉獵,此外,公司還在電信、金融等行業(yè)的智能文件識(shí)別、智能客服機(jī)器人系統(tǒng)、5G 消息 chatbot 系統(tǒng)等方面都有著深厚的技術(shù)儲(chǔ)備,其中一部分成果已經(jīng)實(shí)現(xiàn)落地應(yīng)用。與 AI 的深度融合,可以讓彩訊郵件系統(tǒng)更加智能地實(shí)現(xiàn)郵件摘要自動(dòng)生成,郵件撰寫智能等功能。5G 消息未來(lái)有機(jī)會(huì)成為 ChatGPT 入口。彩訊 5G消息 CSP 解決方案可定制接入客戶自有 chatbot 或提供垂直行業(yè) chatbot 一體化解決方案,通過(guò) 5G 消息號(hào)“變身”為智能客服助手,提供更智能的交互體驗(yàn)。

業(yè)務(wù)布局:公司力求將云計(jì)算、人工智能以及大數(shù)據(jù)等新興技術(shù)應(yīng)用到傳統(tǒng)產(chǎn)業(yè)鏈,促進(jìn)各行各業(yè)的數(shù)字化轉(zhuǎn)型升級(jí)。智慧渠道、協(xié)同辦公、云和大數(shù)據(jù)為公司的三大業(yè)務(wù)線,主要為行業(yè)客戶提供產(chǎn)業(yè)互聯(lián)網(wǎng)應(yīng)用平臺(tái)開(kāi)發(fā)和運(yùn)營(yíng)服務(wù)。目前是信創(chuàng)產(chǎn)業(yè)發(fā)展的風(fēng)口,公司在此趨勢(shì)下積極布局,自研的彩訊 Richmail(Richmail 信創(chuàng)安全增強(qiáng)電子郵件系統(tǒng)解決方案)未來(lái)有望在黨政、金融等領(lǐng)域多點(diǎn)發(fā)力。公司作為中國(guó)移動(dòng)供貨商,云業(yè)務(wù)深度受益移動(dòng)云業(yè)務(wù)加速,預(yù)計(jì)維持較高增速。

3、嘉和美康——電子病歷龍頭,AI 智慧醫(yī)療先行者

技術(shù)發(fā)展:公司在國(guó)內(nèi)醫(yī)療大數(shù)據(jù)和人工智能方面具有豐富的技術(shù)與經(jīng)驗(yàn)儲(chǔ)備,智慧醫(yī)療類產(chǎn)品在全國(guó)市場(chǎng)排名領(lǐng)先。據(jù) IDC 報(bào)告,公司在 2021 年中國(guó)醫(yī)療大數(shù)據(jù)解決方案市場(chǎng)中排名第二。憑借深厚的臨床信息化建設(shè)經(jīng)驗(yàn)和上千家醫(yī)院核心信息系統(tǒng)的數(shù)據(jù)處理優(yōu)勢(shì),公司對(duì)數(shù)據(jù)處理技術(shù)進(jìn)行二次創(chuàng)新轉(zhuǎn)化,自主研發(fā)了智能醫(yī)學(xué)數(shù)據(jù)中臺(tái),對(duì)大規(guī)模多源異構(gòu)醫(yī)療數(shù)據(jù)進(jìn)行深度處理和分析,對(duì)不同維度數(shù)據(jù)進(jìn)行聚合、關(guān)聯(lián),形成適用于不同場(chǎng)景的數(shù)據(jù)模型,打造出擁有自主知識(shí)產(chǎn)權(quán)的覆蓋智能診前服務(wù)、臨床決策支持、病歷內(nèi)涵質(zhì)控及大數(shù)據(jù)科研等不同應(yīng)用場(chǎng)景的醫(yī)療 AI 系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動(dòng)下的患者服務(wù)、臨床輔助、科研反哺、質(zhì)控護(hù)航的多位一體醫(yī)療服務(wù)模式,完成了對(duì)“診前-診中-診后”全量醫(yī)療數(shù)據(jù)的全流程閉環(huán)應(yīng)用。

業(yè)務(wù)布局:臨床輔助決策支持系統(tǒng)(CDSS)、大數(shù)據(jù)科研分析平臺(tái)、AI 病歷內(nèi)涵質(zhì)控系統(tǒng)、智能預(yù)問(wèn)診系統(tǒng)、智能分診系統(tǒng)是公司智慧醫(yī)療產(chǎn)品體系的五大核心產(chǎn)品。公司智慧醫(yī)療產(chǎn)品體系以人工智能技術(shù)為核心驅(qū)動(dòng),以醫(yī)院內(nèi)真實(shí)診療數(shù)據(jù)為基礎(chǔ),以能夠提供高度集約化、標(biāo)準(zhǔn)化數(shù)據(jù)整合、治理及服務(wù)的智能醫(yī)學(xué)數(shù)據(jù)中臺(tái)為支撐,形成的覆蓋臨床診療、科研支持、醫(yī)務(wù)管理、患者服務(wù)等多個(gè)應(yīng)用場(chǎng)景的智慧醫(yī)療全生態(tài)產(chǎn)品矩陣,能夠?qū)崿F(xiàn)“診前-診中-診后”?智慧醫(yī)療服務(wù)閉環(huán),為醫(yī)療機(jī)構(gòu)、科研院校、衛(wèi)生主管部門等提供數(shù)字化、智能化、精細(xì)化的智慧醫(yī)療創(chuàng)新服務(wù)。智慧醫(yī)療產(chǎn)品在智慧醫(yī)院建設(shè)中比重不斷增加,隨著智慧醫(yī)院建設(shè)要求不斷提高,以大數(shù)據(jù)和人工智能等新興技術(shù)為基礎(chǔ)的智慧醫(yī)療產(chǎn)品,場(chǎng)景豐富度和成熟度得到根本提升,在醫(yī)療過(guò)程中發(fā)揮的作用不斷凸顯。公司智慧醫(yī)療產(chǎn)品也成為主營(yíng)業(yè)務(wù)中新的增長(zhǎng)點(diǎn),2022 上半年,公司智慧醫(yī)療產(chǎn)品增速明顯,軟件產(chǎn)品銷售收入 3,107.72 萬(wàn)元,同比增長(zhǎng) 128.09%。

4、科大訊飛——人工智能行業(yè)龍頭企業(yè)

技術(shù)發(fā)展:AI 語(yǔ)音技術(shù)為公司之本,公司在 AI 語(yǔ)音市場(chǎng)份額第一,由此延展至人工智能 多個(gè)領(lǐng)域。目前公司已進(jìn)入 AI2.0 戰(zhàn)略時(shí)代,處于 AI 技術(shù)的紅利兌現(xiàn)期,目標(biāo)是實(shí)現(xiàn) AI 應(yīng)用規(guī)?;涞?。在此時(shí)期內(nèi),公司將在于教育、消費(fèi)者、開(kāi)放平臺(tái)、智慧城市、醫(yī)療、汽車等重點(diǎn)行業(yè)規(guī)?;茝V人工智能解決方案??拼笥嶏w主導(dǎo)建設(shè)了認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室,使得自身核心技術(shù)始終保持在世界前沿水平,并且面向認(rèn)知智能領(lǐng)域前后共開(kāi)源了 6 大類、超過(guò) 40 個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn)練語(yǔ)言模型,是業(yè)界最為流行的中文預(yù)訓(xùn)練模型系列之一。

業(yè)務(wù)布局:公司在 2019 年啟動(dòng) AI2.0 戰(zhàn)略,以“開(kāi)放平臺(tái)+賽道”的模式,在智慧教育、消費(fèi)者業(yè)務(wù)、智慧醫(yī)療、智慧城市等應(yīng)用場(chǎng)景布局。在平臺(tái)上,公司依靠訊飛人工智能開(kāi)放平臺(tái),為客戶提供 AI 解決方案,圍繞自身平臺(tái)筑建產(chǎn)業(yè)生態(tài);在賽道上,公司為各行各業(yè)提供產(chǎn)品服務(wù)以及解決方案,主要有智慧教育、智慧醫(yī)療、智慧城市、消費(fèi)者業(yè)務(wù)、智慧汽車、智慧金融等。

5、拓爾思——專注于 NLP(語(yǔ)義智能)領(lǐng)域的行業(yè)領(lǐng)軍者

技術(shù)發(fā)展:在人工智能領(lǐng)域,拓爾思是國(guó)內(nèi)最早研發(fā)自然語(yǔ)言處理(NLP)的公司之一,在知識(shí)圖譜、NLP、OCR 等領(lǐng)域都有著自主可控的底層技術(shù),也是行業(yè)領(lǐng)軍者。此外,公司的語(yǔ)義智能技術(shù)還包括了知識(shí)圖譜、智能搜索等領(lǐng)域,并且在相關(guān)領(lǐng)域業(yè)處于領(lǐng)先地位。如今公司將以預(yù)訓(xùn)練大模型、In-Context Learning、instruction tuning 等技術(shù)為基礎(chǔ),把文本生成、交互式生成、跨模態(tài)生成、小樣本學(xué)習(xí)等功能作為研發(fā)重點(diǎn),力求在問(wèn)答式 AI、智能創(chuàng)作、搜索引擎等領(lǐng)域?qū)崿F(xiàn)成功應(yīng)用。

業(yè)務(wù)布局:公司先前主要業(yè)務(wù)為向各級(jí)黨政機(jī)關(guān)和企事業(yè)單位等提供人工智能和大數(shù)據(jù)工具軟件平臺(tái)以及解決方案,現(xiàn)在正逐步從提供軟件產(chǎn)品向提供云平臺(tái)服務(wù)轉(zhuǎn)型升級(jí),以軟件產(chǎn)品+云服務(wù)的商業(yè)模式成為目前公司的核心競(jìng)爭(zhēng)力所在。

6、金山辦公——推動(dòng) OA 與 AIGC 高效融合的辦公軟件龍頭

技術(shù)發(fā)展:公司在辦公軟件具備 30 余年的技術(shù)積累,且具有辦公領(lǐng)域?qū)I(yè)研究的優(yōu)勢(shì),對(duì)核心技術(shù)具有自主知識(shí)產(chǎn)權(quán)。目前關(guān)鍵技術(shù)研究重點(diǎn)針對(duì)數(shù)據(jù)云存儲(chǔ)、智能數(shù)據(jù)處理、安全云文檔以及數(shù)據(jù)協(xié)同共享等多個(gè)領(lǐng)域。由于辦公領(lǐng)域與 AIGC 天然的結(jié)合點(diǎn),能大幅提高工作效率,實(shí)現(xiàn)“軟件產(chǎn)品向價(jià)值工具”的轉(zhuǎn)變。目前公司在研項(xiàng)目包括智能協(xié)作創(chuàng)新和產(chǎn)業(yè)化公共服務(wù)平臺(tái)、智能辦公軟件集成等,目前已完成國(guó)產(chǎn)軟硬件深度適配基本技術(shù)的研究實(shí)現(xiàn)、產(chǎn) 品架構(gòu)設(shè)計(jì)及第一階段功能定制開(kāi)發(fā)等工作。

業(yè)務(wù)布局:公司一直探索人工智能和大數(shù)據(jù)分析技術(shù)的發(fā)展,并應(yīng)用于用戶文檔創(chuàng)作和在線協(xié)同中,以提供“多屏、云、內(nèi)容、AI、協(xié)作”的辦公生活方式,依托 AI 構(gòu)建產(chǎn)品云服務(wù)體系。2022 年 11 月,金山辦公與華為簽訂戰(zhàn)略合作備忘錄,進(jìn)一步在鴻蒙生態(tài)領(lǐng)域展開(kāi)深度合作,逐步將 WPS 及其他旗下產(chǎn)品適配華為 1+8+N 設(shè)備,以期實(shí)現(xiàn)設(shè)備協(xié)同和生態(tài)融合的理念,未來(lái)將推動(dòng)“跨設(shè)備、跨用戶、跨服務(wù)”的辦公形態(tài)。

7、同花順——AI+互聯(lián)網(wǎng)金融信息服務(wù)提供商

技術(shù)發(fā)展:公司在人工智能技術(shù)方面具有豐富的經(jīng)驗(yàn)積累,2009 年落地的“i 問(wèn)財(cái)”部門是最早為股票信息服務(wù)平臺(tái),逐步完善智能問(wèn)答功能,并從金融垂直領(lǐng)域擴(kuò)展到多領(lǐng)域生成答案。2015 年公司自主研發(fā)的自然語(yǔ)言系統(tǒng)中,語(yǔ)音識(shí)別表現(xiàn)處于第一梯隊(duì),此后上線的語(yǔ)音系產(chǎn)品包括智能外呼、智能客服、語(yǔ)音質(zhì)檢等,其智能客服機(jī)器人已應(yīng)用于多家大中型證券公司及基金公司。同花順長(zhǎng)期保持高研發(fā)投入,不斷加大對(duì)機(jī)器學(xué)習(xí)、自然語(yǔ)言理解、語(yǔ)音識(shí)別、人機(jī)交互、數(shù)字人等關(guān)鍵技術(shù)應(yīng)用的研發(fā),正在推出更多 ALL IN AI 的產(chǎn)品。

業(yè)務(wù)布局:公司從 2009 年開(kāi)始布局人工智能領(lǐng)域,先后推出自主研發(fā)的股票信息檢索服 務(wù)、智能問(wèn)答、語(yǔ)音識(shí)別等技術(shù),目前已上線 AI 開(kāi)放平臺(tái),可面向客戶提供數(shù)字虛擬人、智能金融問(wèn)答、智能語(yǔ)音、智能客服機(jī)器人、智能質(zhì)檢機(jī)器人、會(huì)議轉(zhuǎn)寫系統(tǒng)、智慧政務(wù)平臺(tái)、智能醫(yī)療輔助系統(tǒng)等 40 余項(xiàng)人工智能產(chǎn)品及服務(wù),應(yīng)用于證券、基金、銀行、保險(xiǎn)、運(yùn)營(yíng)商、高校、企業(yè)、科研院所、政府部門等多個(gè)行業(yè)。目前公司已在金融領(lǐng)域以外推出智能電梯產(chǎn)品、AI 醫(yī)療內(nèi)鏡助手等,未來(lái)將推動(dòng) AI 和更多垂直領(lǐng)域的結(jié)合。

8、萬(wàn)興科技——全球領(lǐng)先的新生代數(shù)字創(chuàng)意賦能者

技術(shù)發(fā)展:公司正積極探索 3D 模型設(shè)計(jì)與渲染技術(shù)、動(dòng)捕 AI 技術(shù)和基于 GAN 網(wǎng)絡(luò)形象生成等技術(shù)。截至目前,公司已在多個(gè)產(chǎn)品中實(shí)現(xiàn)虛擬人、文生圖、AI 智能摳像、AI 智能降噪、AI 音樂(lè)重組、AI 換臉等功能。

業(yè)務(wù)布局:公司已布局虛擬數(shù)字人、虛擬場(chǎng)景、虛擬直播等業(yè)務(wù),并于近日在全球元宇宙大會(huì)論壇上宣布將布局 AIGC 賽道,同時(shí),公司旗下首款 AI 繪畫軟件“萬(wàn)興愛(ài)畫”也已經(jīng)正式開(kāi)啟公測(cè)。未來(lái),公司將在進(jìn)一步挖掘消費(fèi)類軟件海外市場(chǎng)的同時(shí),大力開(kāi)拓國(guó)內(nèi)市場(chǎng),提高自身在國(guó)內(nèi)市場(chǎng)的占有率,因?yàn)槟壳爸袊?guó) IT 市場(chǎng)正處于蓬勃發(fā)展時(shí)期,公司需要抓住這一機(jī)遇,并且中國(guó)是全球重要市場(chǎng),實(shí)現(xiàn)全球化自然離不開(kāi)開(kāi)拓國(guó)內(nèi)市場(chǎng)。

9、云從科技——提供人機(jī)協(xié)同操作系統(tǒng)和行業(yè)解決方案的人工智能企業(yè)

技術(shù)發(fā)展:依靠在人臉識(shí)別領(lǐng)域的技術(shù)積累,云從科技首先從人臉識(shí)別切入 AI 行業(yè),之 后相繼在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等 AI 領(lǐng)域取得突破和成果,公司有著自主研發(fā)的跨鏡追蹤(ReID)、3D 結(jié)構(gòu)光人臉識(shí)別、雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)和對(duì)抗性神經(jīng)網(wǎng)絡(luò)技術(shù)等人工智能技術(shù),均處于業(yè)界領(lǐng)先水平。截至目前,公司已經(jīng)基本形成了人工智能感知、認(rèn)知、決策的技術(shù)閉環(huán),全鏈自主可控。

業(yè)務(wù)布局:公司從人臉識(shí)別技術(shù)出發(fā),通過(guò)感知、認(rèn)知、決策的全鏈人工智能技術(shù),將人工智能解決方案在智慧金融、智慧治理、智慧出行、智慧商業(yè)等行業(yè)進(jìn)行實(shí)踐。此外,公司以自身研發(fā)的通用操作系統(tǒng)為基礎(chǔ),實(shí)現(xiàn)人工智能技術(shù)在特定場(chǎng)景下的應(yīng)用,如火眼人臉大數(shù)據(jù)、活體檢測(cè)軟件等產(chǎn)品,最終形成軟硬件相結(jié)合的人工智能解決方案


ChatGPT開(kāi)啟AI新紀(jì)元,AIGC投資梳理的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
周宁县| 沙河市| 铜梁县| 雷波县| 甘洛县| 涪陵区| 黄梅县| 凯里市| 甘孜县| 京山县| 定陶县| 始兴县| 岳西县| 沽源县| 新龙县| 彰化市| 莱阳市| 乌兰浩特市| 江口县| 胶南市| 台北市| 卢氏县| 武乡县| 晴隆县| 台中县| 安达市| 佛坪县| 射阳县| 吉木乃县| 上饶市| 张家口市| 玉田县| 商水县| 邯郸县| 金溪县| 丰都县| 泸水县| 普陀区| 许昌县| 海口市| 雅江县|