最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

蘋果專利分享針對AR/VR頭顯體驗的空間音頻渲染

2023-07-28 13:35 作者:映維網(wǎng)劉衛(wèi)華  | 我要投稿

查看引用/信息源請點擊:映維網(wǎng)Nweon

空間音頻渲染

映維網(wǎng)Nweon?2023年07月27日)對于沉浸式體驗,生成多通道揚聲器驅(qū)動信號的空間音頻渲染對于提升真實感而言非常重要。例如,一個聲音信號可以通過電子處理來產(chǎn)生一個虛擬的點源,并呈現(xiàn)為從聽者的右邊或左邊的給定位置發(fā)出,而不是從正前方或各個方向均勻地發(fā)出。這種聲音是由驅(qū)動多聲道揚聲器設置的空間音頻渲染算法產(chǎn)生。

在名為“Splitting a voice signal into multiple point sources”的專利申請中,蘋果就介紹了一種相關的方法。

圖片

圖1是音頻系統(tǒng)的框圖,所述音頻系統(tǒng)將與數(shù)據(jù)對象的視覺元素相關聯(lián)的輸入音頻信號分割為至少兩個虛擬聲源,并分別對每個聲源進行空間化。相關方法操作由系統(tǒng)的數(shù)據(jù)處理器執(zhí)行,并用于對數(shù)據(jù)對象的聲音進行空間化。數(shù)據(jù)處理器可以由軟件配置,例如模擬現(xiàn)實XR應用。

輸入音頻信號由視覺元素表示的數(shù)據(jù)對象的聲音相關聯(lián)或表示,例如在XR應用程序中。數(shù)據(jù)對象的可視元素在由視頻引擎渲染后出現(xiàn)在顯示器??梢曉乜梢允菙?shù)據(jù)對象的圖形對象區(qū)域,或者可以是圖形對象體積。

所述數(shù)據(jù)對象可以是例如人,并且所述視覺元素是所述人的Avatar,其在圖1中描述為具有頭部和軀干。音頻信號表示數(shù)據(jù)對象的聲音,在人的示例中是人的聲音。

音頻系統(tǒng)將單個輸入音頻信號呈現(xiàn)為兩個或多個虛擬聲源或點源。分頻器將所述音頻信號分成兩個或多個子頻帶音頻信號,包括第一子頻帶(子頻帶A)和第二子頻帶(子頻帶B)。分頻器可以作為濾波器組來實現(xiàn)。子頻帶A在人可聽范圍內(nèi)的頻率范圍可能高于子頻帶B。例如,低頻(子頻帶B)可能在50hz – 200hz之間。例如,低頻段為100hz ~ 300hz。

將子頻段A分配給視覺元素中的第一位置,而將第二子頻段分配給視覺元素中的第二位置。如圖所示,子頻段A空間化為虛擬聲源A或位于頭部或嘴巴的點源,而子頻段B空間化為軀干的虛擬聲源B。

所述系統(tǒng)通過處理所述兩個子頻帶音頻信號及其相關的元數(shù)據(jù),產(chǎn)生一組多聲道揚聲器驅(qū)動信號,并且驅(qū)動聽音設備產(chǎn)生所述數(shù)據(jù)對象的聲音,從而使得子頻帶A的聲音從與子頻帶B的聲音不同的位置發(fā)出。

在圖1的示例中,子頻帶A、B分別空間化,由兩個空間化模塊A、B來描述,這兩個空間化模塊A、B作為輸入接收相同的虛擬接聽位置但不同的虛擬源位置和不同的音頻信號。

圖1同時說明了分頻器由房間的聲學特性控制。這個房間可以是一個虛擬的房間,其中數(shù)據(jù)對象呈現(xiàn)在顯示器?;蛘?,所述房間可以是一個真實的房間。在這種情況下,設備可能是聽者佩戴的耳機,聽者可以通過光學頭戴式顯示器看到真實的房間,而數(shù)據(jù)對象的視覺元素則呈現(xiàn)在顯示器中。

圖片

圖2是一個示例計算機系統(tǒng)的框圖。語音信號是一種音頻信號,其內(nèi)容主要或主要是人的講話,例如。因此,語音信號不包含音樂或效果。

如圖1所示,數(shù)據(jù)處理器配置為充當分頻器,其將語音信號分為至少兩個component,即第一子頻帶A中的第一子頻帶信號和第二子頻帶B中的第二子頻帶帶信號,然后生成多個揚聲器驅(qū)動信號。

這在本例中為高音喇叭信號和一個低音信號。高音和低音形成一個雙向揚聲器系統(tǒng)。因此,圖2中的處理器不是作為將兩個子頻帶分別空間化的空間化模塊,而是使第一子頻帶A中的聲音從設備的高音發(fā)出,并且使第二子頻帶B中的聲音從低音發(fā)出。第一子頻帶A為高頻段,第二子頻帶B為低頻段。

圖片

在圖3中的流程圖中,通過將語音信號分割成用于單獨點源的至少兩個子頻帶來再現(xiàn)數(shù)據(jù)對象的語音,而所述方法可由數(shù)據(jù)處理器執(zhí)行。

在一個實施例中,所述方法首先接收數(shù)據(jù)對象的語音信號(操作9),并將語音信號分割為第一子頻帶中的第一子頻帶信號和第二子頻帶中的第二子頻帶信號(操作11)。

在一方面,處理器同時將第一子頻帶信號分配給數(shù)據(jù)對象的視覺元素的第一位置(操作13),并將第二子頻帶信號分配給視覺元素的第二位置(操作15)。

它生成多個揚聲器驅(qū)動信號,以在單個場景中再現(xiàn)數(shù)據(jù)對象的聲音(操作17)。在一個實施例中,空間化處理產(chǎn)生揚聲器驅(qū)動信號,使得第一子頻帶信號的聲音從第一虛擬位置發(fā)出,第二子頻帶信號的聲音從不同于第一位置的第二虛擬位置發(fā)出。

在另一實施例中,不將數(shù)據(jù)對象的聲音空間化,第一子頻帶信號的聲音由高頻揚聲器驅(qū)動器產(chǎn)生,而第二子頻帶信號的聲音由低頻揚聲器驅(qū)動器。

在另一方面,將音頻處理效果添加到正在對子頻帶A音頻信號執(zhí)行的信號處理鏈中。在圖1中,所述處理效果可能是空間話模塊A的一部分。當聽者在聲源周圍移動時,這一添加將影響聲音的均衡性,

例如,當聽者在角色說話時在角色后面或在角色前面時。在高頻波段處理中加入頻率相關的指向性效應可以令特定音素的呈現(xiàn)更加真實。通過將增益相關的指向性添加到高頻波段處理中,可以更真實地呈現(xiàn)不同級別的語音產(chǎn)生。

相關專利


Apple Patent | Splitting a voice signal into multiple point sources


https://patent.nweon.com/28273

名為“Splitting a voice signal into multiple point sources”的蘋果專利申請最初在 提交,并在日前由美國專利商標局公布。


---
原文鏈接:https://news.nweon.com/110838



蘋果專利分享針對AR/VR頭顯體驗的空間音頻渲染的評論 (共 條)

分享到微博請遵守國家法律
贵南县| 江川县| 台州市| 炎陵县| 钟祥市| 来凤县| 高青县| 东台市| 长治县| 宜春市| 讷河市| 太谷县| 观塘区| 大荔县| 万山特区| 古田县| 湖南省| 平谷区| 西林县| 西充县| 磐安县| 大连市| 潼南县| 晋宁县| 宝鸡市| 望谟县| 南通市| 法库县| 镇沅| 崇州市| 分宜县| 泽州县| 关岭| 永川市| 仙居县| 盐边县| 乐清市| 崇信县| 栾川县| 桓仁| 夏津县|