關(guān)于“瀑布圖”你需要知道的。(2022remix)
昨天視頻中所講的音箱“瀑布圖”問題,看到還是有些人不太理解,或者說與他們的固有認(rèn)知相沖突。其實(shí)這個問題我過去已經(jīng)講過很多次了,所以昨天的視頻中說的很簡潔。這里再重復(fù)一次吧。

首先,你們常見的“瀑布圖”不是測試出來的,而是換算出來的。不是實(shí)測結(jié)果。不是每間隔幾毫秒掃頻一次,掃頻本身就沒法做到這么短的時間,你們測試的時候也不是像圖中顯示的那個樣子。
其次,因?yàn)镕FT的采樣原理,導(dǎo)致計算顯示出來的瀑布圖是錯誤的,或者說瀑布圖中的振鈴和現(xiàn)象是與現(xiàn)實(shí)過程不符合的,甚至是現(xiàn)實(shí)中并不存在的。
下面引用聲音的重現(xiàn)中的一個例子:

圖4.17a顯示了非常高的分辨率(約3 Hz)的穩(wěn)態(tài)頻率響應(yīng)。許多測量設(shè)備,包括智能手機(jī)、平板電腦和基于筆記本電腦的軟件包,都可以生成此類數(shù)據(jù)。它在頻域中有極好的細(xì)節(jié),但它沒有直接揭示時域中發(fā)生的事情。然而,因?yàn)槲覀冎赖皖l房間共振通常以最小相位的方式表現(xiàn),我們知道,如果沒有突出到頻譜平均水平以上的明顯凸起,那么時域中就不會有明顯的振鈴。正是這種間接推理的知識,使我們能夠自信地將頻率響應(yīng)作為低頻下房間模式的主要信息來源。圖4.16b、c和d顯示了相同情況下由時間和頻率組成的瀑布圖,但使用了不同的分辨率。
在圖4.17b中,后側(cè)的頻率響應(yīng)(時間=0)與(a)中的曲線非常相似,因?yàn)檫x擇了較窄的7 Hz帶寬。然而,構(gòu)成瀑布圖的每條曲線看起來都差不多,因?yàn)樵陬l域中實(shí)現(xiàn)高分辨率的同時,犧牲了時域的分辨率;時域的分辨率為142毫秒。在顯示的500毫秒總衰減中,沒有太大變化,因?yàn)橄蚯耙苿拥拿織l曲線都是142毫秒窗口內(nèi)的平均值。t=0后的前幾條曲線幾乎相同,隨后的幾條曲線的振幅平穩(wěn)下降。看起來這個房間在很多頻率下都有不受控制的振鈴,但這是錯誤的,這樣的數(shù)據(jù)是具有誤導(dǎo)性的。
在(c)中,頻率分辨率降低;現(xiàn)在它的有效分辨率約為14.3赫茲。頂部頻率響應(yīng)更平滑,顯示的細(xì)節(jié)更少,但由于時間分辨率改進(jìn)為70毫秒,我們現(xiàn)在可以在衰減曲線中看到一些細(xì)節(jié)變化。所有曲線的衰減速度都更快,有證據(jù)表明,在衰減的早期,其中一個諧振出現(xiàn)了頻率偏移。在接近500 Hz的頻率下,可以看出,在達(dá)到350 毫秒之前,輸出已降至最低可測量水平以下。
在(d)中,由于進(jìn)一步降低了頻率分辨率(現(xiàn)在為25 Hz),頂部頻率響應(yīng)以及隨后的所有響應(yīng)變得更加平滑。然而,由于時間分辨率提高為40毫秒,因此可以在時域中看到更多正在發(fā)生的事情。請注意,在圓圈區(qū)域,在(a)中看起來像是一個衰減的諧振,實(shí)際上是兩個相鄰的諧振,振幅較高的一個衰減得很快,剩下一個更高Q值,但振幅低得多而時間更長的諧振。在(a)中看起來如此令人擔(dān)憂的所有其他諧振現(xiàn)在都可以看到衰減得非常快。事實(shí)上,房間似乎只有一個長時間衰減的諧振,其振幅從一開始就下降了超過10分貝,不太可能成為主要的可聞因素。
在音頻論壇的討論和廠商的數(shù)據(jù)中,已經(jīng)有許多從此類瀑布圖中得出錯誤結(jié)論的例子。通常作者不會透露測量參數(shù);在某些情況下,人們懷疑他們是否知道這些參數(shù)的重要性。還有其他數(shù)學(xué)方法揭示了時間/頻率互斥的不同方面(例如,小波、維格納-維爾和加博分布),但每種方法都需要科學(xué)的解釋,但據(jù)我所知,沒有任何支持心理聲學(xué)的數(shù)據(jù)。
最后,因?yàn)槿硕鷮χC振的感知,以及揚(yáng)聲器的最小相位特性等因素。瀑布圖很難作為可聞性的判斷依據(jù)。

人耳對低Q值諧振比較敏感,而低Q值諧振不容易在瀑布圖中產(chǎn)生振鈴現(xiàn)象。

高Q值的諧振需要一定時間才能觸發(fā),所以高Q值的諧振對時間瞬態(tài)不敏感即音樂中必須要有內(nèi)容在這個頻率上,并且維持一定的時間,才能夠使人聽出可聞區(qū)別。這也許也是為什么音樂信號相比于Pink Noise需要更高的幅度(尤其是在高Q值)才能觸發(fā)的重要原因之一。

而對于低Q值resonance,在很短的時間就可以觸發(fā)。

所以從某種意義上,低Q值才更容易暴露一些瞬態(tài)問題。也就是那些頻響曲線中“看似不起眼”的范圍很寬的“隆起或者凹陷”。
然而高Q值的諧振容易在瀑布圖中產(chǎn)生振鈴。所以瀑布圖中的振鈴越明顯,可能瞬態(tài)越?jīng)]有問題。這是反直覺的。不要看到一個圖中有類似于時域的衰減,就是反映聽覺瞬態(tài)的指標(biāo),這和“人有兩個耳朵所以立體聲更好”是類似的純粹想當(dāng)然的理解。必須要從相關(guān)原理去考慮。

總之,可以從測試原理、聲學(xué)原理(揚(yáng)聲器的最小相位特性)和心理聲學(xué)(諧振和瞬態(tài)的感知)三個方面理解所謂瀑布圖的誤區(qū)。實(shí)際上從任何一個角度來說,瀑布圖在大部分情況下都是不成立的。我上期視頻主要講的是測試,所以主要說了瀑布圖本身在測試原理上的缺陷。
大家常見的音箱耳機(jī)瀑布圖,不是測試出來的,不是實(shí)測結(jié)果。由于揚(yáng)聲器以及房間模式的最小相位特性,任何單一域的指標(biāo),例如頻響,都要比瀑布圖更可靠的同時判斷頻域和時域的問題。