虛擬人“柳夜熙們”已來?元宇宙最強賽道規(guī)模超千億
來源:21世紀(jì)經(jīng)濟報道,作者:張賽男
1982年,動畫作品《超時空要塞》中的女主角林明美憑借動人歌聲與純真人設(shè)走紅,由此成為全球首個虛擬偶像。
2007年,初音未來在VOCALOID語音合成技術(shù)的加持下誕生,熱度延續(xù)至今。
2021年,虛擬美妝達人柳夜熙在發(fā)布抖音第一條短視頻后即獲得300多萬點贊,漲粉上百萬。
2022江蘇衛(wèi)視的跨年晚會上,以鄧麗君為原型的虛擬人與現(xiàn)場歌手周深實現(xiàn)跨時空同臺合唱。
……
虛擬人并非新時代的產(chǎn)物,在元宇宙火熱的當(dāng)下,有了更多的打開方式。在新的時代背景下,虛擬人出現(xiàn)了哪些新的特征?需要哪些底層技術(shù)的支持?又將帶來哪些產(chǎn)業(yè)鏈投資機會?
虛擬人進化史
根據(jù)量子位《虛擬數(shù)字人深度產(chǎn)業(yè)報告》顯示,虛擬數(shù)字人指存在于非物理世界中,由計算機圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物。市面上也多將其稱為為虛擬形象、虛擬人、數(shù)字人等,代表性 的細分應(yīng)用包括虛擬助手、虛擬客服、虛擬偶像/主播等。
商湯科技移動智能事業(yè)群副總裁欒青在接受21世紀(jì)資本研究院采訪時表示,“虛擬數(shù)字人是基于視覺、語音、NLP等技術(shù)打造,可以模擬真人的會話、表情和動作,在各種不同的場景進行交互應(yīng)用。”
“虛擬人模型能夠正常運行的背后其實是在不斷地得到數(shù)據(jù)和技術(shù)的支撐,其一方面須持續(xù)地獲得高質(zhì)量的樣本數(shù)據(jù)進行訓(xùn)練,另一方面也須結(jié)合技術(shù)的賦能,例如語音合成、多模態(tài)交互、深度神經(jīng)網(wǎng)絡(luò)渲染等,使得包括面容、表情、聲音、肢體動作等在內(nèi)的整體自然度能夠接近真人水平?!焙L烊鹇曄嚓P(guān)負責(zé)人對21世紀(jì)資本研究院說。
不難發(fā)現(xiàn),虛擬人的一個重要特點是:可模擬真人、可交互。多位業(yè)內(nèi)人士對21世紀(jì)資本研究院表示,這意味虛擬人“自己會動”,區(qū)別于傳統(tǒng)游戲中的NPC。
以重現(xiàn)歌手鄧麗君為例,2013年,借助數(shù)字王國提供的技術(shù)方案,《返老還童》視效團隊讓鄧麗君出現(xiàn)在周杰倫“魔天倫”世界巡回演唱會臺北站小巨蛋現(xiàn)場,與周杰倫對唱。當(dāng)時市場的關(guān)注度僅限于技術(shù)的觀賞性。
十年之后,鄧麗君受到了不同程度的關(guān)注和市場反饋。這一次的江蘇衛(wèi)視跨年晚會,數(shù)字王國通過技術(shù)讓虛擬鄧麗君與人們自主進行實時交互,這意味著更復(fù)雜的動作實時捕捉、渲染,時間成本相對較高。
圖1:虛擬鄧麗君(來源:每日經(jīng)濟新聞)
萬興科技旗下視頻演示產(chǎn)品萬興錄演的產(chǎn)品負責(zé)人長飛對21世紀(jì)資本研究院分析,“虛擬人經(jīng)過技術(shù)不斷發(fā)展,經(jīng)歷了早期手工繪制,到電腦繪圖、人工智能合成,虛擬人逐漸簡化,同時基于自然語言處理、語音識別、計劃算視覺等人工智能技術(shù)的應(yīng)用拓展,虛擬數(shù)字人正朝智能化、便捷化、精細化、多樣化發(fā)展。目前虛擬人在外表、行為、交互各方面高度擬人化?!?br/>
拆解產(chǎn)業(yè)鏈
結(jié)合量子位的測算,若產(chǎn)業(yè)應(yīng)用順利落地,2030年我國虛擬人市場規(guī)模將達到2700億元,其中身份型虛擬人貢獻將超1700億元。在整個產(chǎn)業(yè)鏈發(fā)展升級過程中,優(yōu)質(zhì)的投資機會將持續(xù)涌現(xiàn)。相較于元宇宙那些過于遙遠的概念,“虛擬人”儼然已成為眼下觸手可及的賽道。
圖2:2030年我國虛擬數(shù)字人整體市場規(guī)模預(yù)測(來源:量子位)
“隨著近兩年疫情的原因,視頻化成為一種更好的交流表達方式,而其中像一些老師、自媒體、企業(yè)等部分人群對外視頻時出現(xiàn)不愿意真人出鏡,就產(chǎn)生了使用虛擬形象來代替的趨勢?!遍L飛說。
目前,頭部互聯(lián)網(wǎng)公司以虛擬人為切入點悉數(shù)入局,加大資本投入。
騰訊、字節(jié)跳動、阿里、網(wǎng)易、百度等互聯(lián)網(wǎng)公司均在虛擬人方向投資布局;大禹網(wǎng)絡(luò)、次世文化等MCN公司拓寬了虛擬形象的設(shè)計和運營業(yè)務(wù);藍色光標(biāo)等營銷公司則不斷加強虛擬人領(lǐng)域的營銷服務(wù)能力;小紅書、抖音等社交平臺也對虛擬偶像博主進行布局和引流。
從產(chǎn)業(yè)鏈看,虛擬數(shù)字人可以分為上、中、下三個環(huán)節(jié)。上游產(chǎn)業(yè)鏈為制作內(nèi)容類、工具類和IP策劃類公司,如微軟、Houdini、AUTODESK、蘋果、閱文集團等。虛擬人誕生前需要內(nèi)容制作和IP策劃以確定其性格、形象,基礎(chǔ)設(shè)施還包括顯示設(shè)備、光學(xué)器件、傳感器、芯片等硬件制造商及建模軟件、渲染引擎等軟件制造,后期則需要建模綁定、驅(qū)動、渲染等技術(shù)支持。
中游產(chǎn)業(yè)鏈主要為虛擬數(shù)字人廠商,包括軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺和AI能力平臺,包括提供語音識別、CG建模、XR等技術(shù)的各類企業(yè),如科大訊飛、Avatarworks、騰訊、相芯科技、火山引擎、百度等。
比如天神娛樂近日在投資者互動平臺表示公司近期新設(shè)立了控股子公司北京元境數(shù)字科技有限公司,其主營業(yè)務(wù)為打造虛擬數(shù)字人制作平臺,進行虛擬主播、虛擬偶像等虛擬數(shù)字人的開發(fā),服務(wù)電競游戲、品牌營銷等領(lǐng)域。
下游產(chǎn)業(yè)鏈包括傳媒、游戲、影視、金融、文旅、教育、醫(yī)療等各領(lǐng)域,如各類虛擬主持人、虛擬主播、虛擬偶像、智能客服、智能理財顧問、虛擬導(dǎo)游、講解員等,形成行業(yè)整體解決方案,賦能各領(lǐng)域發(fā)展。
捷成股份近日表示,旗下公司已正式推出虛擬人“妙江山”,計劃在商業(yè)代言、直播、短視頻等領(lǐng)域率先嘗試商業(yè)變現(xiàn)模式。
除了上述產(chǎn)業(yè)鏈系列相關(guān)公司外,中信證券還建議關(guān)注Roblox等結(jié)合內(nèi)容IP運營和研發(fā)能力于一身的平臺型公司;嗶哩嗶哩、泡泡瑪特、芒果超媒、中文在線等擁有豐富數(shù)字IP資源和優(yōu)秀運營能力的內(nèi)容型公司,以及抖音、快手、小紅書、微博等虛擬人內(nèi)容運營平臺公司。此外,萬潤科技、平治信息、湯姆貓等也均有所關(guān)注或布局。
不過,不難看出,當(dāng)下的A股市場還沒有純正的虛擬人標(biāo)的,多是在某個產(chǎn)業(yè)鏈環(huán)節(jié)上特定技術(shù)的提供商。
底層技術(shù)支撐商機
當(dāng)下市場產(chǎn)生的對虛擬人的新需求,背后需要一系列的技術(shù)支持。而這也衍生出不少投資機會。
智慧芽相關(guān)研究員表示,虛擬人作為一個新興的綜合性技術(shù)應(yīng)用領(lǐng)域,主要涉及到圖形渲染、動作捕捉、語音識別、自然語言處理、多模態(tài)技術(shù)、深度學(xué)習(xí)等技術(shù)領(lǐng)域。
以上游為例,通過智慧芽全球?qū)@麛?shù)據(jù)庫檢索可知,微軟及其關(guān)聯(lián)公司共有3000余件適用于虛擬人領(lǐng)域的專利申請,主要集中于語音識別、自然語言處理、深度學(xué)習(xí)、計算機視覺等領(lǐng)域。Houdini(Side Effects Software公司)在該領(lǐng)域的技術(shù)布局主要集中于計算機圖形、動畫制作等領(lǐng)域。
而閱文集團是一家以數(shù)字閱讀為基礎(chǔ),IP培育與開發(fā)為核心的綜合性文化產(chǎn)業(yè)集團。該集團及其關(guān)聯(lián)公司則暫無與虛擬人領(lǐng)域直接相關(guān)的專利申請。
在中游環(huán)節(jié),智慧芽數(shù)據(jù)顯示,科大訊飛及其關(guān)聯(lián)公司在該領(lǐng)域的技術(shù)布局主要集中于語音識別、語音合成、知識圖譜、圖像識別等技術(shù)領(lǐng)域。百度及其關(guān)聯(lián)公司的技術(shù)布局主要集中于深度學(xué)習(xí)、計算機視覺、自然語言處理、圖像處理等領(lǐng)域。
在下游,網(wǎng)易在該領(lǐng)域的技術(shù)布局主要集中于虛擬角色、觸控操作、計算機圖形等領(lǐng)域。Bilibili在該領(lǐng)域的技術(shù)布局主要集中于虛擬形象、圖像渲染、語音識別等領(lǐng)域。
長飛進一步分析,虛擬人底層技術(shù)包括3D形象設(shè)計及建模,模型綁定,人臉、半身和全身的動作捕捉和驅(qū)動技術(shù),3D渲染技術(shù)等。目前動作捕捉和驅(qū)動,3D渲染技術(shù)的壁壘都比較高,這里面虛擬人又分卡通3D虛擬人和高仿真虛擬人,特別是后者,對于動作精細化程度和整個技術(shù)流程的計算復(fù)雜度高,算法效果實時性要求高,要做好都是比較難的。
據(jù)悉,萬興目前在3D形象設(shè)計和建模上已經(jīng)有較豐富的經(jīng)驗,同時由博士主導(dǎo)的AI/3D/AR/VR技術(shù)團隊,已能實現(xiàn)視頻實時頭像3D卡通化,并實現(xiàn)人臉和身體的動作捕捉技術(shù),應(yīng)用端3D渲染能力等。
作為技術(shù)提供方的商湯科技,處于產(chǎn)業(yè)鏈的中上游。欒青對21世紀(jì)資本研究院表示,“數(shù)字人的技術(shù)難點在于表情和動作的精準(zhǔn)表達、流暢自然。落地過程中的難點則在于與不同的應(yīng)用場景進行適配?!?/p>
據(jù)悉,商湯的SenseMARS Agent數(shù)字人經(jīng)過不同領(lǐng)域的知識數(shù)據(jù)庫訓(xùn)練,已應(yīng)用于購物中心、銀行、線上客服、博物館、展館、旅游景區(qū)、機場等多種行業(yè)和領(lǐng)域。比如在交互方面,基于商湯的AI技術(shù),SenseMARS Agent數(shù)字人可以實現(xiàn)口型準(zhǔn)確、動作逼真,并與真人之間進行智能對話等交互應(yīng)用。
圖3:數(shù)字人技術(shù)展示(來源:商湯科技官網(wǎng))
而A股上市公司海天瑞聲則是一家人工智能數(shù)據(jù)及相關(guān)數(shù)據(jù)服務(wù)的提供商。其相關(guān)負責(zé)人表示,“虛擬人目前的應(yīng)用比較前沿化,其最終呈現(xiàn)的狀態(tài)需要在特征化、多樣化、高匹配度的訓(xùn)練數(shù)據(jù)支撐下才能得以實現(xiàn),即更好的數(shù)據(jù)才能訓(xùn)練出更為逼真的虛擬人?!?br/>
顯然,在一定程度上被視為元宇宙基建的虛擬人賽道,未來的成長空間留給了外界很多想象。
在這里看見、讀懂和連接硬科技。聚焦光電芯片、人工智能、航空航天、生物技術(shù)、新能源等8大硬科技產(chǎn)業(yè),依托智慧芽獨特的科技情報數(shù)據(jù)優(yōu)勢,讓讀者看見技術(shù)趨勢,讀懂硬科技產(chǎn)業(yè),連接創(chuàng)新未來。智慧芽創(chuàng)新研究中心出品。