解析丨牽手郎朗推出VR音樂(lè)作品,華為VR音視頻技術(shù)牛在哪?
4月15日,華為在上海舉辦了“身臨其境,看見(jiàn)美好”VR音樂(lè)媒體品鑒會(huì)。郎朗首部VR音樂(lè)作品正式上線(xiàn)華為視頻VR專(zhuān)區(qū)和華為VR視頻。除了郎朗的三部作品,華為VR音樂(lè)平臺(tái)還通過(guò)與更多獨(dú)立音樂(lè)人、樂(lè)隊(duì)的合作引入高質(zhì)量的VR音視頻內(nèi)容。官方透露,平臺(tái)首發(fā)陣容將達(dá)到24部作品。
溝通會(huì)當(dāng)天,陀螺君受邀來(lái)到現(xiàn)場(chǎng)。親身體驗(yàn)了目前已經(jīng)上線(xiàn)華為VR視頻的八部作品,并對(duì)華為VR音視頻生態(tài)平臺(tái)提供的端到端VR技術(shù)解決方案有了深入了解,也充分理解了拍攝強(qiáng)沉浸感VR音樂(lè)會(huì)背后所需要的科技硬實(shí)力。
此外,陀螺君還深度對(duì)話(huà)華為消費(fèi)者業(yè)務(wù)云服務(wù)副總裁譚東暉、華為VR音視頻平臺(tái)總監(jiān)Xinxin。透過(guò)他們的分享,了解到關(guān)于華為VR音視頻一站式生態(tài)服務(wù)在前端播放能力、視頻點(diǎn)播VOD服務(wù)、音樂(lè)開(kāi)發(fā)工具及VR內(nèi)容的制作與發(fā)行等更多方面的技術(shù)沉淀及實(shí)用價(jià)值。
?
VR音視頻,華為篤定的5G時(shí)代新應(yīng)用
?
5G技術(shù)的快速發(fā)展,使得千行百業(yè)有了一個(gè)具備創(chuàng)新基礎(chǔ)的技術(shù)平臺(tái)。5G技術(shù)在中國(guó)商業(yè)化落地的兩年時(shí)間里,其發(fā)展速度遠(yuǎn)超想象。
同樣是這個(gè)時(shí)間節(jié)點(diǎn),3G技術(shù)部署后的一年時(shí)間里,全球商用網(wǎng)絡(luò)只有9個(gè),3G站點(diǎn)數(shù)僅有2萬(wàn)個(gè),用戶(hù)數(shù)32萬(wàn);4G技術(shù)時(shí)代略強(qiáng)。相較之下,5G技術(shù)正式部署的第一年里,全球5G商用網(wǎng)絡(luò)數(shù)已經(jīng)超過(guò)110多個(gè),站點(diǎn)數(shù)80萬(wàn)個(gè),用戶(hù)數(shù)超過(guò)2億。
這背后,在于人們對(duì)超大帶寬應(yīng)用、超低延時(shí)應(yīng)用以及海量聯(lián)接式應(yīng)用的龐大需求。譚東暉表示:“在超大寬帶應(yīng)用需求下,華為意識(shí)到VR/AR、超高清視頻和無(wú)線(xiàn)傳影等新科技融合5G商用將催生出第一波改變?nèi)藗兩?、辦公和娛樂(lè)方式的產(chǎn)業(yè)?!?br>

華為消費(fèi)者業(yè)務(wù)云服務(wù)副總裁譚東暉
?
也就是說(shuō),華為相信VR音視頻將成為5G技術(shù)普及下的第一波深度影響用戶(hù)行為的產(chǎn)業(yè)。那么,為何會(huì)如此篤定呢?
業(yè)界的技術(shù)成熟度曲線(xiàn)認(rèn)為,一項(xiàng)技術(shù)需要經(jīng)過(guò)萌芽期、炒作巔峰期、低谷期、平穩(wěn)發(fā)展期以及成熟期。2018年以后,VR技術(shù)被從這條曲線(xiàn)上移除,這意味著其發(fā)展?fàn)顟B(tài)已開(kāi)始趨于成熟;而看結(jié)果,2020年,全球VR頭戴式顯示器的出貨量達(dá)到670萬(wàn)臺(tái),相比于2019年增長(zhǎng)了72%,幾乎翻番。
譚東暉認(rèn)為,技術(shù)的不斷成熟與其VR設(shè)備出貨量的不斷增長(zhǎng),足夠證明VR技術(shù)已經(jīng)跨越了低谷期,進(jìn)入到規(guī)模應(yīng)用成熟期,這意味著VR已經(jīng)開(kāi)始接近我們的生活,VR產(chǎn)業(yè)的未來(lái)充滿(mǎn)無(wú)限想象。
與此同時(shí),人們對(duì)于在線(xiàn)服務(wù)及影音的需求也在大幅增長(zhǎng)。2020年,人們通過(guò)移動(dòng)設(shè)備觀(guān)看在線(xiàn)視頻的時(shí)長(zhǎng)增長(zhǎng)40%,在音樂(lè)領(lǐng)域,全球流媒體收入占增長(zhǎng)19.9%,成為全球錄制音樂(lè)產(chǎn)業(yè)中唯一的收入增長(zhǎng)來(lái)源。
“人們對(duì)于音樂(lè)的需求,將不再僅限于如今的便攜性和豐富性,將很快向著更創(chuàng)新的用戶(hù)體驗(yàn)和更優(yōu)質(zhì)的創(chuàng)作內(nèi)容提出更多要求。希望在線(xiàn)上,就能夠體驗(yàn)到過(guò)去在線(xiàn)下音樂(lè)會(huì)才有的幾倍或者十幾倍的臨場(chǎng)感?!?br>
華為終端云服務(wù)已經(jīng)為全球7億多消費(fèi)者提供全場(chǎng)景、高品質(zhì)的數(shù)字服務(wù)。這樣的背景之下,正因看到這樣的用戶(hù)需求,本著以消費(fèi)者為中心,打造軟硬件雙輪驅(qū)動(dòng)的全場(chǎng)景智慧生態(tài)(1+8+N和HMS)理念,正式上線(xiàn)了華為VR音視頻平臺(tái)。
?
13K拍攝、空間音頻,華為VR音視頻方案如何做到低成本高質(zhì)量?
?
華為VR音視頻平臺(tái)是華為終端云服務(wù)推出的全新內(nèi)容平臺(tái),其作用是在全球范圍內(nèi)連接音樂(lè)人、音樂(lè)創(chuàng)作者,令用戶(hù)隨時(shí)隨地能夠體驗(yàn)到由超高清畫(huà)質(zhì)、空間音頻等技術(shù)支撐的優(yōu)質(zhì)VR音視頻內(nèi)容。
用戶(hù)可以通過(guò)VR Glass頭顯或者華為手機(jī)體驗(yàn)華為視頻VR專(zhuān)區(qū)中的所有內(nèi)容。而支撐該平臺(tái)的是一整套內(nèi)容制作解決方案。

華為VR音視頻平臺(tái)涵蓋了前期制作、后期合成、編解碼適配和上架發(fā)行平臺(tái)四個(gè)標(biāo)準(zhǔn)流程,其方案涉及前端播放能力、視頻點(diǎn)播VOD服務(wù)、音樂(lè)開(kāi)發(fā)工具及VR內(nèi)容的制作與發(fā)行各階段,實(shí)現(xiàn)了端到端一體化全覆蓋。
整體來(lái)看,該方案優(yōu)勢(shì)可以大致分成三類(lèi):
1、超高清畫(huà)質(zhì)呈現(xiàn)
顧名思義,VR的音視頻體驗(yàn)最主要的就是內(nèi)容視覺(jué)和聽(tīng)覺(jué)上的感受。提到視覺(jué)部分,很多人對(duì)于VR的第一印象是不夠清晰、紗窗效應(yīng)嚴(yán)重。成像質(zhì)量方面,在對(duì)比度高的高光區(qū)域成像,是多數(shù)拍攝設(shè)備所遇到的老大難問(wèn)題。
在VR里面的成像和傳統(tǒng)意義上的影視內(nèi)容拍攝不同。人眼在沉浸式數(shù)字環(huán)境下會(huì)追求更加接近人眼的成像效果,這種高要求很多平面視頻拍攝設(shè)備都難以企及,而VR需要考慮的是360度范圍內(nèi)的畫(huà)面質(zhì)量輸出,無(wú)疑難度更大。

在上圖中,左側(cè)和右側(cè)分別放置的是華為VR音視頻內(nèi)容制作解決方案中錄制設(shè)備在高對(duì)比度和暗光環(huán)境下的拍攝效果??梢钥吹?,其對(duì)于曝光、噪點(diǎn)處理的相對(duì)柔和自然,衣衫之上花紋的呈現(xiàn)細(xì)節(jié)豐富。
Xinxin認(rèn)為,無(wú)論是1080P、4K還是8K分辨率,其實(shí)這只是視頻成像質(zhì)量衡量中的一個(gè)維度,它并不是全部。一個(gè)視頻的好與壞,固然跟尺寸有一定的關(guān)聯(lián),但更重要的是像素的質(zhì)量、銳度,包括色彩范圍以及幀率,這些是會(huì)深深影響視頻觀(guān)看質(zhì)量的關(guān)鍵技術(shù)點(diǎn)。
“從這兩張圖可以看出,華為對(duì)于VR視頻成像的理解,并非傳統(tǒng)意義上的僅是尺寸上的優(yōu)勢(shì),而是基于對(duì)VR類(lèi)影像的采集和回放技術(shù)的深刻理解?!?br>
2、3D空間音樂(lè)效果
目前的VR內(nèi)容(尤其視頻)體驗(yàn)里面,有時(shí)候會(huì)有提及一些跟3D聲音有關(guān)的描述,但并未對(duì)此有更為深入的研究和認(rèn)知。
將雙手比作聲源,當(dāng)用戶(hù)戴上耳機(jī)的時(shí)候,傳統(tǒng)的立體聲音效是從耳機(jī)兩側(cè)進(jìn)行發(fā)聲。用戶(hù)在轉(zhuǎn)動(dòng)頭部的時(shí)候,音源被固定在頭顱兩側(cè),這證明傳統(tǒng)聲音模擬并不包含聲音的空間信息和它的三維空間的位置信息。
所謂實(shí)時(shí)3D現(xiàn)場(chǎng)聲音,即3D空間音樂(lè)效果可以還原聲音的方位信息、聲場(chǎng)信息和環(huán)境信息,可以把不同的相位音源同時(shí)在算法中進(jìn)行處理并提供給用戶(hù)。這與5.1、7.1影音設(shè)備不同,除了設(shè)備體積差距外,因?yàn)榕鋫鋽?shù)量有限,這類(lèi)設(shè)備無(wú)法模擬真正意義上360度音效,且成本及操作難度都遠(yuǎn)高于前者。

在上圖中,是華為VR音視頻內(nèi)容制作解決方案現(xiàn)場(chǎng)錄制時(shí)的聲道圖解。設(shè)備將現(xiàn)場(chǎng)聲音全部解析成了單獨(dú)的通道,提供給用戶(hù)去聽(tīng),而傳統(tǒng)的立體聲只有雙聲道概念。舉個(gè)例子,現(xiàn)場(chǎng)歌手的聲音會(huì)由其本人、樂(lè)器、音響設(shè)備等發(fā)出,因此至少有四路聲音被記錄和采集的,這在傳統(tǒng)方案中只能是揉在一起。

華為VR有專(zhuān)屬的編解碼音頻信號(hào)解析的標(biāo)準(zhǔn),與市面上的無(wú)損和標(biāo)準(zhǔn)編解碼信號(hào)相對(duì)比,前者音頻信號(hào)的解析在網(wǎng)絡(luò)帶寬的壓力下并沒(méi)有損失音質(zhì)(上訪(fǎng)的點(diǎn)狀物數(shù)量區(qū)分)。這是因?yàn)槿A為增強(qiáng)層編解碼信號(hào)允許在體積更小的情況下,傳遞跟原始無(wú)損信號(hào)更一致的音頻音質(zhì)給到用戶(hù)。
3、VR編輯工具
華為VR音視頻內(nèi)容制作軟件可以實(shí)現(xiàn)原有錄制文件的整合、打包和輸出。整個(gè)文件打包的流程非常傻瓜,其基于傳統(tǒng)行業(yè)的錄音師和后期音視頻制作的流程,可實(shí)現(xiàn)時(shí)間線(xiàn)編輯、素材管理方式、動(dòng)畫(huà)記錄方式等聲音的軌跡和畫(huà)面的特性一同在該軟件里完成編輯。
此外,導(dǎo)出的完成版文件可以被華為VR音視頻平臺(tái)所識(shí)別,并實(shí)現(xiàn)自動(dòng)上傳和云端全球分發(fā)。

據(jù)介紹,華為VR音視頻內(nèi)容制作軟件相較業(yè)內(nèi)大幅降低了VR音視頻內(nèi)容制作的成本。一部作品的制作成本可以壓到同行業(yè)內(nèi)的1/10,并保證其視聽(tīng)質(zhì)量達(dá)到最佳。
通常的制作成本是指人力成本和現(xiàn)場(chǎng)部分(場(chǎng)地、燈光、舞美、錄回音等)素材采集方面的成本。華為的拍攝設(shè)備及后期制作工具引入自動(dòng)化操作方案,極大程度節(jié)省了人力成本和現(xiàn)場(chǎng)操作的成本。
Xinxin稱(chēng),通常情況下華為的一部作品只需幾個(gè)小時(shí)就可以完成拍攝。對(duì)比傳統(tǒng)的作品錄制流程,華為VR音視頻采集系統(tǒng)的展開(kāi)和收集效率更高。此外,后期階段里,華為將優(yōu)勢(shì)項(xiàng)的音頻處理能力和視頻處理能力工具化,這樣就省去了以前分散在多個(gè)工具端處理完后再縫合到一起的過(guò)程,這會(huì)減少內(nèi)容的生產(chǎn)成本和時(shí)間。
未來(lái),華為將運(yùn)用通訊業(yè)起家的編解碼標(biāo)準(zhǔn)制定優(yōu)勢(shì),更加大力推動(dòng)VR音視頻工具的標(biāo)準(zhǔn)化。并基于類(lèi)似音樂(lè)Party模式(允許多臺(tái)華為手機(jī)拼合實(shí)現(xiàn)類(lèi)似多點(diǎn)采集收音的效果)等功能,進(jìn)一步降低VR音視頻內(nèi)容的錄制階段硬件成本。
?
實(shí)測(cè):空間級(jí)感官拔升,這次真不是純堆技術(shù)
?
會(huì)議之后,陀螺君實(shí)際體驗(yàn)了華為VR視頻中現(xiàn)已上線(xiàn)的8款VR音視頻內(nèi)容。下面我以?xún)煽顦O具代表性的內(nèi)容實(shí)際體驗(yàn)為例,來(lái)分享下對(duì)于所謂華為VR音視頻黑科技的切實(shí)感受。

1、《茉莉花》(郎朗)
第一次體驗(yàn),是朗朗的鋼琴曲獨(dú)奏茉莉花。這部作品采用類(lèi)似沙龍演奏的形式,很多觀(guān)賞者圍坐在郎朗及鋼琴周?chē)?。美妙的琴聲呼之欲出,而身為觀(guān)賞者里的一員,陀螺君則恰好坐在郎朗的正側(cè)面,屬于黃金觀(guān)賞位。
這部作品的背景,模擬了類(lèi)似漆黑環(huán)境聚光燈下的畫(huà)面效果。郎朗和眾人在燈光之下,與漆黑深邃的背景區(qū)分開(kāi)來(lái)。值得一提的是,陀螺君可以清楚地看到光照下每位觀(guān)賞者的毛孔,郎朗戴著的手套上的纖維和鋼琴背光板折射出的倒影。
在這種極度考驗(yàn)設(shè)備處理曝光環(huán)境拍攝能力的環(huán)境下,陀螺君看到的不是一片漆黑或者慘白一片,而是在燈光照應(yīng)下,人們的背影和細(xì)枝末節(jié)的微表情。而工作人員告訴陀螺君,雖說(shuō)觀(guān)賞細(xì)膩度已經(jīng)非常震撼,但其實(shí)原片分辨率可以達(dá)到13K*9K,而目前的影片只是達(dá)到了4K級(jí)別??梢韵胂?,如果真有頭顯可以原生支持13K的片源,那會(huì)是一番更加難忘的體驗(yàn),并且該片源也支持適應(yīng)未來(lái)3-5年的發(fā)展。
2、《BeatBox Show》(啊鑫)
如果說(shuō)郎朗給我的第一印象是視覺(jué)爆炸,那這段B-BOX就是真正的聽(tīng)覺(jué)爆炸。視頻開(kāi)始,啊鑫隨即開(kāi)始自己的表演。我面對(duì)著啊鑫,距離只有一拳之隔。隨著嘴唇的抖動(dòng),一陣陣爆炸似的聲波傳入陀螺君的耳膜,從聲音來(lái)分辨,即使是閉著眼睛甚至腦海里都可以精確浮現(xiàn)處他在發(fā)聲時(shí)的嘴型。
而這,還不是最有趣的。
因?yàn)楝F(xiàn)場(chǎng)是坐在一把類(lèi)似蛋椅的旋轉(zhuǎn)座椅中。因此,陀螺君下意識(shí)扭轉(zhuǎn)身體,頭部便跟著向左側(cè)旋轉(zhuǎn)。此時(shí)我不再正對(duì)啊鑫,而是左耳正對(duì)的側(cè)身方式。陀螺君明顯感覺(jué)到音場(chǎng)強(qiáng)度的變化,就好像真的在視頻內(nèi)容中轉(zhuǎn)了個(gè)身一樣。與之類(lèi)似的,左轉(zhuǎn)、右轉(zhuǎn)音源變化感知最為明顯,抬頭、低頭則可以感受到聲音輕微發(fā)悶。
這就是所謂華為3D空間音效,實(shí)際體驗(yàn)后陀螺君發(fā)現(xiàn)——其實(shí)它實(shí)現(xiàn)的就是一句話(huà):讓用戶(hù)走進(jìn)內(nèi)容。正如Xinxin所說(shuō),沉浸式體驗(yàn)是令用戶(hù)走進(jìn)內(nèi)容的最佳方式。
而據(jù)透露,華為已經(jīng)在VR光場(chǎng)拍攝技術(shù)方面研究多年,并會(huì)隨著用戶(hù)群體的增加,考慮將最新的交互模式(比如語(yǔ)音識(shí)別、彈幕交互、眼球追蹤等)加入其中。現(xiàn)在,還只是視聽(tīng)維度更上一層樓。也許不久的將來(lái),我們真的可以走到郎朗面前,請(qǐng)他喝杯茉莉花茶;亦或是擺個(gè)炫酷的姿勢(shì),和對(duì)面啊鑫來(lái)一場(chǎng)battle(即6DOF交互)。
?
總結(jié)
?
究竟什么才是適合中國(guó)VR消費(fèi)級(jí)市場(chǎng)的產(chǎn)品?
Xinxin說(shuō):“VR產(chǎn)業(yè)發(fā)展,從來(lái)缺的不是技術(shù)的更替和成熟,而是真正能夠?qū)⑿录夹g(shù)帶入舊領(lǐng)域,催生新用戶(hù)的人。在VR音視頻這塊,我們?cè)敢馔渡砥渲?,因?yàn)橛姓{(diào)研后實(shí)實(shí)在在的用戶(hù)需求、有華為的技術(shù)優(yōu)勢(shì)作為支撐,那何樂(lè)而不為呢?”
未來(lái),華為VR音視頻內(nèi)容制作解決方案或?qū)?duì)外開(kāi)放,這意味著未來(lái)任何一個(gè)普通人、up主或者作曲人,都有機(jī)會(huì)成為VR音視頻作品的締造者。譚東暉稱(chēng),以用戶(hù)為導(dǎo)向,不斷創(chuàng)新、發(fā)展和探索正是一直以來(lái)華為發(fā)展的愿景。我們希望華為VR音視頻平臺(tái)可以開(kāi)個(gè)好頭,并隨著用戶(hù)群體的重視度增加,逐漸進(jìn)行外擴(kuò)。