虛擬耳機實驗以及這個實驗帶給我們的啟發(fā)。

早在半年前我就寫過一篇關(guān)于虛擬耳機的文章,但那篇文章里只是一個籠統(tǒng)的介紹。
這篇文章通過對虛擬耳機實驗的注釋以及其結(jié)果做一個更詳細的介紹。

科學的耳機聽音測試是很難進行的,因為在控制聽音測試時會受到討厭的變量和人們固有的偏見的挑戰(zhàn)。它們包括視覺和觸覺的偏差、漏泄效應、聽者之間的一致性以及切換不同耳機之間的時間間隔過大而導致的聽覺記憶喪失。這對入耳式(即)耳機尤其具有挑戰(zhàn)性,因為在500赫茲以下的低音性能需要良好的密封環(huán)境。
對于AB對比雙盲聽測試而言,由于大多數(shù)缺乏長期專業(yè)聽音經(jīng)驗的人無法對稍長時間間隔的聲音有準確的記憶,因此快速在兩個產(chǎn)品之間切換是必備條件。對于音箱而言,可以輕易的做到兩個音箱之間的快速切換,兩個音箱位置的不同也可以通過音箱穿梭走廊或者快速轉(zhuǎn)臺來解決。而對于耳機而言,不論是入耳式耳機還是頭戴式耳機,傳統(tǒng)的AB雙盲聽方法中,都需要摘下原有耳機再佩戴上新的耳機,這一過程會引入過多的變量,例如兩次佩戴耳機時佩戴的準確性,以及兩次佩戴耳機過程中的時間間隔,導致無法進行準確的AB對比測試。
有幾位作者針對這個問題提出了不同的解決方案,包括通過對不同的耳機進行雙耳錄音把來模擬不同耳機的聲音。一個具有一致的配合性和密封性的中立復制耳機是必需的,這樣它就不會增加聽音時引入的新的誤差。通過這種方式,聽眾可以以受控和雙盲的方式在不同耳機之間進行即時比較。Hiroven等人采用這種方法來評估六種不同的耳機,使用窄帶和寬帶語音信號。將結(jié)果與可以看到的實際耳機(非盲聽結(jié)果)進行比較,以確定這種方法的準確性。雖然不同的測試方法大體上一致,但存在顯著的差異,這些差異歸因于視覺偏差、與耳機泄漏有關(guān)的誤差以及錄音和復制階段的匹配變化。由于對實際耳機的評估并不能控制耳機的視覺觸覺偏差和滲漏效應,因此無法精確確定這種雙耳錄音方法模擬不同耳機的準確性。
包括通過對不同的耳機進行雙耳錄音把來模擬不同耳機的聲音??梢运闶恰霸圃嚶牎钡睦碚摶A(chǔ)。但前提是除了測量時需要有符合國際標準的測試設(shè)備和環(huán)境,更重要的是需要“云試聽”的收聽者有一個同一標準的耳機,這樣才不會引入新的誤差。如果“云試聽”的收聽者各自使用不同的耳機,那么可能會造成完全相反的判斷。具體原因詳見:
Brielle和Voinier選擇了一種不同的評估方法,通過一個高質(zhì)量的復制耳機來評估不同的頭戴式耳機,該耳機被均衡器均衡以匹配被測耳機的頻率響應。R?m?和V?lim?ki描述了一種用于實現(xiàn)虛擬耳機的數(shù)字信號處理框架,包括模擬噪音環(huán)境中的耳機隔離能力。這種虛擬化方法無需制作和編輯每個耳機和對應的音樂素材錄音,這一優(yōu)勢節(jié)省了大量的時間和精力。與錄音方法相比,虛擬耳機方法要求每個耳機僅測量一次,以量化其頻率響應和相位響應,然后將實時數(shù)字濾波器應用到復制耳機以模擬不同耳機的響應。其好處在于,任何數(shù)量的虛擬耳機都可以立即與任意測試信號進行比較,而無需為每個耳機進行額外的錄制。
Sean Olive等人使用類似的虛擬耳機方法評估了六種不同的耳罩式耳機/頭戴式耳機(2015年)。實際耳機與虛擬耳機的聽音者主觀評分的相關(guān)性總體良好(r=0.85)。然而,某些聽音者和某些耳機型號的結(jié)果之間存在明顯的差異。他們講這種誤差歸因于聽音者佩戴耳機時泄露因素的差異。與此同時,他們還懷疑一些差異與實際耳機聽音測試中的觸覺偏差相關(guān),因為在測試中,聽音者可以通過耳機的重量和耳罩的觸感識別出正在試聽的耳機。
即便是對于盲聽測試而言,頭戴式耳機(尤其是封閉式頭戴耳機)的聽音結(jié)果一方面會受到不同人佩戴的泄露差異影響,更重要的是,實際耳機的聽音測試中,聽音者可以通過耳機的重量和耳罩的觸感識別出正在試聽的耳機型號,進而造成先入為主的判斷。
以上這些研究強調(diào)了消除視覺和觸覺偏差的重要性,以便對耳機進行可靠和有意義的主觀評價。這只能通過錄音聽覺化或者虛擬耳機來完成,如上文所述。雖然基于脈沖響應的虛擬耳機方法因其優(yōu)越的速度和靈活性而更可取,但就像雙耳錄音方法一樣,其缺點在于它不會捕獲耳機中的任何非線性失真。這些失真是否可以在典型的回放水平上被聽到,并對整體音質(zhì)有顯著影響,這是一個有爭議的問題。最近一項針對耳機的調(diào)查發(fā)現(xiàn),除非失真程度很高,否則對耳機的整體偏好等級影響很小。然而,迄今為止,還沒有研究非線性和相位畸變對入耳式耳機感知聲音質(zhì)量的影響,以及它們是否會限制其虛擬化的有效性。以上這些問題是此次研究的動機。
在目前的研究中,我們公布了控制良好的雙盲聽力測試結(jié)果,其中10名訓練有素的聽者(Trained listener)評估了12個型號的入耳式耳機的音質(zhì)。為了驗證虛擬耳機方法的準確性,聽眾分別對通過高質(zhì)量、低失真的復制耳機復制的虛擬耳機和實際耳機的錄音進行了評分,復制耳機被補償為具有在標準聲學耦合器上測量的平坦幅度響應。通過連接在回放耳機上的微電子機械傳聲器(MEM)監(jiān)測耦合器和耳道內(nèi)的信號,消除了錄音和回放中的泄漏效應。
真實耳機的錄音中包括幅度、相位和非線性失真,而虛擬耳機僅捕獲幅度和最小相位響應。因此,通過比較實際耳機和虛擬耳機的音質(zhì)等級評分,可以評估非線性失真和相位畸變對感知音質(zhì)的可聽性和影響。
本文的組織結(jié)構(gòu)如下:第二部分介紹了虛擬耳機的方法,包括耳機的選擇、錄制、播放和均衡。第三部分描述了聽力測試方法,并在第四部分討論了測試結(jié)果。第五節(jié)總結(jié)并在第六節(jié)給出結(jié)論。
森海塞爾 Momentum 入耳式耳機被選擇作為復制耳機,是因為這款耳機具有平滑的頻率響應、良好的頻率延展和低失真。
平滑的頻率響應有利于模擬不同耳機的頻率響應。
篇幅有限,中間省略。


Figs. 5 and 6 graphically illustrate the good agreement in sound quality ratings between the virtual and actual headphone. In cases where there are small differences in mean ratings, they are within the margin of the 95% confidence interval. Based on the Pearson product-moment correlation coefficient the agreement between actual versus virtualized headphone ratings for Tests One and Two were: r = 0.99 and 0.95, respectively. When calculated across both tests, the correlation between actual and virtualized headphone ratings was r = 0.98.
結(jié)論
通過采用受控制的雙盲聽定音實驗,10名訓練有素的聽音者通過高質(zhì)量的復制入耳式耳機播放的雙耳錄音對12款入耳式耳機(12款真實耳機錄音與12款虛擬耳機錄音),評價其整體音質(zhì)。根據(jù)統(tǒng)計證據(jù),結(jié)論如下:
不同型號的耳機對音質(zhì)評分產(chǎn)生主要影響。
實際耳機和虛擬耳機的音質(zhì)評分等級之間沒有顯著差異。Pearson相關(guān)系數(shù)表明真實耳機和虛擬耳機之間的一致性為r=0.98。
在所有聽音者中,虛擬耳機與真實耳機的音質(zhì)評分等級之間相對一致并具有良好的一致性。
真實耳機的客觀測量結(jié)果(幅度響應和相位響應)與虛擬耳機的客觀測量結(jié)果直到10~12kHz均具有良好的一致性。The errors were generally small and based on the listening test results did not have a significant influence on perceived sound quality.(這句話我實在不知道咋翻譯)由于失真會出現(xiàn)在實際耳機中,而不會出現(xiàn)在虛擬耳機中,耳機中存在或不存在非線性失真(仍需通過測量確認)沒有顯著的影響。事實上,實際耳機與虛擬耳機的主觀評分相似,這表明非線性失真不是影響聽音者音質(zhì)主觀評分的因素。
這一觀察結(jié)果與之前的揚聲器和耳機研究結(jié)果一致,與失真和相位測量結(jié)果相比,幅度響應(頻響曲線)被認為是感知聲音質(zhì)量最可靠的預測指標。未來的研究應該集中在發(fā)展可以帶來人耳聽覺主觀感知的失真測量,以確定耳機是否有聲音失真,并將其排除在虛擬耳機聽音測試之外。有了第5節(jié)中概述的約束和限制,本研究提供了證明虛擬耳機聽音測試方法可以產(chǎn)生與真實耳機類似的準確可靠的音質(zhì)評分的證據(jù)。
作者要感謝哈曼國際對這項研究的支持。我們也感謝所有參加測試的十位聽眾。
以下是我對虛擬耳機方法的看法:
就像原文所說,虛擬耳機可以用來作為真實耳機對于音質(zhì)評分的參考。
雖然虛擬耳機的主觀評分和真實耳機的主觀評分對于所有型號的測試耳機并不是完全相同的,但是對于大部分耳機而言,虛擬耳機與真實耳機的主觀評分是相近的或者幾乎相同的(并且考慮到人的主觀感受本身就是浮動的)。那么,當我們?nèi)粘J褂脮r,在沒有對比的情況下,可以認為通過一個耳機加載對應的數(shù)字濾波器后可以等效或極為接近另外一個真實耳機的主觀聽感。而這一數(shù)字濾波器僅包含頻率響應和最小相位響應,不包含相位失真/相位畸變。實際上,就我個人的經(jīng)驗而言,對于耳機和部分情況下的立體聲(2聲道)音箱系統(tǒng)而言,左右相位一致或同步變化很多情況下不會引起可聞的聽覺變化。
不同耳機的非線性失真的差異不足以影響耳機的主觀聽感,除非非線性失真特別高。關(guān)于這部分的內(nèi)容,有興趣的小伙伴可以去擴展閱讀以下:
Steve Temme, Sean Olive, Steve Tatarunis, Todd Welti, and Elisabeth McMullin,” The Correlation between Distortion Audibility and Listener Preference in Headphones,” presented at the 137th Convention of the Audio Eng. Soc. (October 2014).
關(guān)于頭戴式耳機,也有類似的方法和多篇論文。
最后,引用某位熱心網(wǎng)友的留言,我感覺很精髓。
人的心理啊~一旦在某種東西上投入過多,并自己因此獲取存在感,存活消遣的意義,這個人會更加依賴這個東西帶來的觀念,它形成固有的思維,這個人受到觀念植入,不自覺的維護現(xiàn)有的觀念以免一直以來的思想崩塌,自己所作所為失去意義。對他迷信的一些東西加以客觀剖析以至于稍有動搖他的觀念的根本的時候,便沉不住氣,仿佛在否定他的人生似的。那么他就條件反射急得跳腳了唄……