超高采樣率意義何在?(上)

寫這篇文章的時候我甚至有點提心吊膽,因為這個話題太能引發(fā)爭論了,尤其是關(guān)于“玄學”和“科學”的爭論。所以我在這個話題內(nèi)會盡量避免任何的主觀判斷,完全用仿真的結(jié)果來充實我的觀點,以供讀者朋友們參考。
在“采樣”系列的第二篇文章中,我講過采樣率和信號頻率的關(guān)系,即奈奎斯特采樣定理。它描述了信號頻率和采樣頻率的關(guān)系,即:當采樣率嚴格大于信號頻率的兩倍時,可以完美地還原出原始波形(采樣率恰好等于信號頻率兩倍時,則有可能無法還原)。?
所以有一個簡單粗暴的結(jié)論:對于最多能聽到20kHz的耳朵(統(tǒng)計意義上),采樣率達到40kHz就夠了!?但是聲卡廠商、ADDA廠商、軟件廠商好像不認這一點。?




如果44100/48000Hz的采樣率夠用的話,憑什么他們還要費這般功夫呢?僅僅是為了噱頭,去賣出更高價錢嗎??
所以要好好捋一捋,采樣在整個聲音制作的過程中,面對的是什么信號。?
聲音制作當然不只是播放出聲音的過程。實際上,每一個數(shù)字音頻作品的制作和體驗,都需要經(jīng)過錄音/信號生成、信號處理、信號合成輸出/播放的過程。所有涉及到數(shù)字音頻的環(huán)節(jié),都必然和采樣率掛鉤。?
好,我們一個一個講。?
1.?錄音的采樣率問題
(本文“上篇”就只討論這部分?。。?/p>
錄音環(huán)節(jié),我們將用著拾音器材和音頻接口,去面對我們所需要的音頻素材。雖然人耳最多能聽到20kHz,但是世間萬物可不是為了我們耳朵而存在的,超出人耳聽覺范圍的聲音信號多得是。就算是我們的嘴巴產(chǎn)生的信號,實際上也可以超出這個范圍,比如我剛剛在192kHz采樣率下用電容話筒錄制的幾句話,高頻的齒音部分就可以擴展到接近40kHz的地方。?

而這僅僅是人聲而已,人聲的高頻相對來說也不算多的。銅管樂器、某些打擊樂器的泛音可以延伸到更高,而對于合成器,這個頻率甚至可以無線延伸……

“我反正聽不到這么高的頻率,那我采樣率低一些,不錄了總成了吧?”?沒那么簡單!?
高頻信號雖然無法被耳朵感知,但是在采樣過程中,它們依然是信號,話筒不會因為人耳聽不到就不采集高頻的信息,ADC也同樣不會因為人耳聽不到而不采樣高頻信號。?
高頻信號被太低的采樣率采樣下來會變成什么樣呢?舉個例子,在48000Hz的采樣率下采樣一個50000Hz的正弦波信號,你會得到一個——?

50kHz,你憑什么是一個2kHz的正弦波??
再測試一下51kHz、52kHz、53kHz……在48kHz下的采樣,結(jié)果分別產(chǎn)生了3kHz、4kHz、5kHz……的正弦波信號。?
這意味著:高頻采樣在不滿足奈奎斯特采樣定理的情況下會產(chǎn)生低頻率的、人耳可聞的干擾信號。稍微計算一下還可以發(fā)現(xiàn),這個新的信號頻率F2等于高頻信號頻率F1減去采樣率Fs,即F2 = F1-Fs。?
這種現(xiàn)象在工程中稱為“混疊(Aliasing)”。這樣的采樣稱為“欠采樣(Undersampling)”。?
如果我們做一個線性調(diào)頻信號,從20000Hz到28000Hz均勻地掃描,然后在48000Hz下采樣,可以獲得這樣的頻譜圖:?

可以看到,當采樣率不滿足采樣定理之后,波形產(chǎn)生了欠采樣,原本應(yīng)該“往上跑”的頻率撞到了墻,往回彈了,同時滿足F2 = F1-Fs的規(guī)則。更加不巧的是,這只是單個頻率的混疊。如果我們產(chǎn)生的是鋸齒波信號這樣的包含多個頻率的波形的話,頻譜圖會更加難看:?

往下跑的混疊頻率和原本的信號混合,可能會產(chǎn)生明顯的拍頻(Beating):


可以看到波形的幅度產(chǎn)生了正弦波形狀的變化,聽起來就是嗡嗡的。下面的音頻可以感受一下這是啥體驗(注意控制音量、保護耳朵):?

這個包絡(luò)線的頻率恰好是奈奎斯特頻率和信號頻率之差。?
所以,由于混疊的存在,在奈奎斯特頻率附近的信號即使符合采樣定理,也是不能完美還原的。?
因此,為了在錄音的時候能夠不被過高頻率的聲音污染到低頻率可聞區(qū)域,我們有兩種方法:要不就提高采樣率到不會混疊的程度,要不就設(shè)法讓采樣前的聲音去掉過高頻的部分。?實際操作中后者更加常用,而且是每個ADC必備的功能:抗混疊濾波器。?
簡而言之就是設(shè)計一個模擬的濾波器使得超過某個頻點的聲音信號全部消除,只通過符合采樣定理要求的聲音信號,比如這樣:?

佩利-維納定理(Paley-Wiener Theorem)狠狠敲了你一把:“想啥呢”!

嚴謹?shù)亟忉屵@個定理需要涉及大家都不愛看的公式推導,所以簡單來說就是這樣的濾波器是不可能用模擬電路實現(xiàn)的。因為這樣的濾波器是非因果的。非因果系統(tǒng)(Noncausal System)指的是,你要輸出的信號,與未來的輸入信號相關(guān)。如果你無法制造時間機器,那么那就無法完美地濾波。?
(數(shù)字域上倒是可以實現(xiàn),做個傅里葉變換后刪除高頻率信息再反傅里葉變換就好,但是這樣也不屬于因果系統(tǒng),只能獲得完整波形后才能實現(xiàn),所以也沒人這么干)
?因此工程中的濾波器是帶有一定滾降(Roll-off)的。比如這樣:

或者這樣:

上圖例子1中的抗混疊濾波器的截止頻率是24000Hz,假設(shè)經(jīng)過滾降最終在28000Hz衰減到非常低的量級,此時信號仍然帶有高頻成分,但是這部分即使被采樣至48kHz的頻率,仍然可以確保混疊發(fā)生在人耳不可聞的20kHz以上的頻段。這樣就保護了人耳可聽范圍內(nèi)不會因為混疊而干擾。例子2中則截去了2.4kHz以上的頻率,此時通過采樣也不會產(chǎn)生混疊。?
既然理想抗混疊濾波是無法實現(xiàn)的,那不如從設(shè)計上提供一些余量,因此工程應(yīng)用中常常用實際最高頻率的2.5倍采樣率進行采樣。優(yōu)質(zhì)的抗混疊濾波器具有更優(yōu)秀的性能和復雜的設(shè)計,以應(yīng)對濾波器其他的性能限制。總之,在錄音階段,你的聲卡已經(jīng)幫你設(shè)計好了足夠好的聲音保護方案,因此你更需要的是混音階段的考慮。?下期見!
本文作者:艾夫
音樂制作人、編曲人、混音師、艾楽音樂工作室主理人、華中科技大學光電信息專業(yè)碩士。

*文中觀點為作者獨立觀點,不完全代表本號立場,僅供參考交流學習;
*本文部分配圖源自網(wǎng)絡(luò),不用于商業(yè)用途;如有侵權(quán),請聯(lián)系本號處理。