從客觀指標來評估人類聽覺系統(tǒng)對聲音相位的敏感程度——耳蝸神經的相鎖
此篇文章經授權轉自辜磊的公眾號聲學號角,辜磊先生曾任國光聲學工程師、JBL Professional高級聲學工程師、Tymphany首席聲學工程師、華為音頻主任工程師以及瀛通耳機事業(yè)部副總經理。以下是原文:
日常生活中,很多人吹噓對音箱系統(tǒng)的相位非常敏感,即便是高頻信號。
但大部分人類歸根到底還是肉身,會受到各種客觀物理規(guī)律限制。當然多個音箱的相位不一致導致的客觀干涉不在本文討論之列。
下面我們先看看凡人的聽覺系統(tǒng)。
人耳的結構


外耳:共振腔
中耳:放大作用和強聲保護作用
內耳:頻譜分析作用
下面的人耳聽覺系統(tǒng)的3D圖片是我從一款解剖軟件中截取出來的




內耳結構圖

基底膜(basilar membrane)分析聲音示意圖(位置理論)

匈牙利-美國物理學家貝克西(Békésy,Georgvon)用實驗驗證了這個理論,寫了“聽覺原理”巨著,獲得了1961年諾貝爾醫(yī)學及生理學獎。
各種頻率在基底膜上的振動模式

聽神經主要由神經纖維組成,這些神經纖維支配著耳蝸內的毛細胞。它的響應是相對均勻的。每條神經纖維的頻率都經過了嚴格的調整(與基底膜的振動模式相匹配)。
基底膜內膜有3500根神經纖維,外膜有3排神經纖維共20000根,俗稱毛細胞。當聲波在基底膜上振幅超過一定閾值時,產生電脈沖,經毛細胞傳入大腦,感知語音。

有點類似于生理性質的傅里葉變換,見下圖展開的動作電位,以及聽神經纖維的動作。

每條聽覺神經纖維僅對狹窄的頻率范圍做出響應

耳蝸神經纖維向低頻聲音的放電不是隨機的;它們發(fā)生在特定時間(相鎖)。即對低頻信號,人耳對相位是比較敏感的。


從上圖來看,以客觀的聽神經來說,對于單一頻率的正弦波,頻率在2kHz以上的,基本沒有細胞電位和音頻之間的相鎖(phase lock)。也就是毛細胞不再根據(jù)正弦波的不同相位改變自身的電位,此時聽覺系統(tǒng)不再編碼聲音的相位,而只編碼幅值。
所以2kHz以上的正弦波的相位對人耳而言,基本是沒有意義的。包括雙耳聽覺的相位在高頻也是沒有意義的。這就是為什么經常使用雙耳時間差,而不是雙耳相位差的原因之一。

接下來簡單說一下我對這個話題的看法。因為本人在從事調音時幾乎每天都有調節(jié)相位,對此問題也算是有一定的發(fā)言權。
首先,相位的調節(jié)主要是多聲道之間的相位調節(jié)(通常也是1kHz以內)能夠影響人耳主觀聽感,尤其是對聲場中image的定位和focus影響。亦或是低音炮與主音箱之間的相位匹配或者主動降噪耳機。對于常見的立體聲音箱或者耳機,同步改變兩個聲道的相位通常不會有顯著的聽覺影響?;蛘哒f單體自身的絕對相位的可聽性是很弱的。除非是左右聲道之間存在相位差。
而對于更深層次的問題,正如知乎的麥文學經常調侃的“人類DNA與蝙蝠不一樣”。看似是荒誕滑稽的,但實際上是非常有說服力的。人耳對于聲音中一些現(xiàn)象的反應,和人耳器官本身的結構是有直接關系的。例如人耳的頻率分辨極限。所以一些人聲稱的“一耳朵區(qū)別”或者“xx很明顯”之類的,從根本上就是不成立的,或者說不是人類能聽出來的。這些聲稱實際上是非?;闹嚨摹8嗟氖且环N純粹的想象。
關于人耳的一些聽覺特性,其實早就有大量的嚴謹實驗和定論,例如辜磊先生提到的獲得諾貝爾醫(yī)學及生理學獎的巨著《聽覺原理》。再比如說我過去分享的一些關于人耳聽覺極限的實驗,有些是發(fā)表在自然科學等權威期刊的。如果各位想了解一些靠譜的知識,建議還是看一看這些經典著作。