兩耳不聞白噪聲?采樣率、動態(tài)范圍與實際應(yīng)用

上篇文章談到了聽覺極限對于采樣率的影響,也介紹了奈奎斯特采樣定理。它告訴我們,采樣率要選擇44100/48000Hz以上才能確保聲音覆蓋了人類的聽覺范圍。
至此我們知道了采樣率對聽覺的影響了,那,另一個“采樣深度”會帶來什么影響呢?
1.?采樣深度回顧
?
所謂采樣深度,指的是我們在對一個連續(xù)的波形的幅度進(jìn)行量化編碼的時候,設(shè)定的分割的精度,采樣深度越大,則同樣范圍內(nèi)采樣點的幅度可以被定位得越精確,更接近原始波形。?
我在第一篇文章里放了一系列不同采樣深度的音頻試聽,大家應(yīng)該可以發(fā)現(xiàn),隨著采樣深度的降低,有一種噪聲越來越大。?是的,你聽到的噪聲就是“量化噪聲”。?
量化噪聲屬于白噪聲,它的意義是,在整個頻譜內(nèi),各個頻率的能量幾乎一樣,就像各種頻率的可見光疊加的時候,就合成了白光。因此我們把這種噪聲叫做白噪聲。?
2.?量化噪聲的產(chǎn)生
?

白噪聲的頻譜,是時時刻刻、全部頻率都幾乎為同一值的。這樣的白噪聲是怎么來的呢?或者說,什么樣的條件下會產(chǎn)生白噪聲??
答案是:服從均勻分布的隨機(jī)數(shù)。?
好吧,這個說法有點繞。讓我們來看看量化的時候,信號到底發(fā)生了什么變化。?下圖說明的是一個正弦波(藍(lán)色曲線)上的準(zhǔn)確的點(紅色圈)在幅度量化的過程中,被量化為固定柵格上的值(黃色的點)。

可以放大看看細(xì)節(jié)部分:

紅色的點,由于系統(tǒng)設(shè)定,被迫離開了自己的真實值(0.14112…),而附著在了就近的格子上(0.1)。?
可以說,幾乎所有信號上的幅度都不是準(zhǔn)確的整數(shù)(有限小數(shù)),把它們近似為一系列的固定的刻度是量化中必要的步驟。但是,這樣的量化肯定會引入誤差,這個誤差會在多大程度上影響音頻的聽覺體驗?zāi)??這個性質(zhì)就是我們需要探討的。?
量化產(chǎn)生的誤差可以直接由采樣信號和原始信號作差得到。如圖所示:

當(dāng)然,正弦波還是比較規(guī)則的,因此出來的樣子還是具有周期性,如果我們使用一個普通的音頻文件進(jìn)行測試的話,結(jié)果就是:

數(shù)據(jù)不會騙人,誤差也是肉眼可見的,當(dāng)然耳朵也一樣能聽出來。我們把噪聲部分再放大:

所有誤差點的位置都是幾乎隨機(jī)的,每個點隨機(jī)散布在大約-0.03~+0.03之間。恰好,4bit采樣下的單位精度就是0.625,四舍五入的時候這個差值要不就比量化的位置高半格,要不就低半格,所以量化噪聲的波動范圍就在一個量化精度之間。由于音頻信號的內(nèi)容豐富,頻率和幅度多變,因此在大的樣本下,量化產(chǎn)生的噪聲為白噪聲。?
3.?動態(tài)范圍
了解了量化噪聲之后,動態(tài)范圍的概念就可以引入了。動態(tài)范圍指的是,一個音頻文件中可以記錄的最大音量的電平和最小音量的電平的關(guān)系。以16bit為例,如下圖所示,動態(tài)范圍就是數(shù)字音頻能記錄的最大的電平65536到最小電平1的比例,工程上一般用對數(shù)表示,實際上就是最大到最小的比值取對數(shù),并乘以20(功率需要平方)。通過計算可以得到:4bit記錄的動態(tài)范圍為20*lg(2^4)=24dB;8bit采樣深度記錄的動態(tài)范圍為20*lg(2^8)=48bit;以此類推,16bit采樣深度記錄的動態(tài)范圍是96dB、24bit可以記錄144dB。?

動態(tài)范圍越大,我們越能記錄小音量的信號。想象一下,一個波形如果信號微弱,比如只能占用3個量化單位,那么一個正弦波會被記錄成這樣:?

帶來的后果就是,采樣波形的噪聲足以影響這個正弦波的記錄!?
所以如果我們有更細(xì)致的量化深度,就會減少這種誤差了。從結(jié)果上看,就是讓量化噪聲減少到我們不可察覺的量級。?
4.?采樣率、動態(tài)范圍與實際應(yīng)用
?
多數(shù)情況下,音樂的動態(tài)范圍大約從40dB到105dB都有可能。響度大的電子、搖滾音樂動態(tài)小一些,古典管弦樂動態(tài)會大一些。當(dāng)你聆聽小動態(tài)音樂的時候,可能不需要很高的量化精度,16bit足以使用。但是當(dāng)你聽大動態(tài)的交響樂的時候,16bit對應(yīng)的96dB的動態(tài)范圍就顯得不足了。?
從錄音上講更是如此。現(xiàn)今流行的音頻接口的AD/DA動態(tài)范圍可以達(dá)到120~130dB,即使是入門級別的小聲卡也可以輕松實現(xiàn)110dB的動態(tài)范圍,此時16bit的錄音提供的96dB就無法匹配聲卡的性能上限,多出來的這20多dB的余量會被浪費。?
同時,由于錄音的時候出于保護(hù)音頻質(zhì)量考慮,往往不會把輸入電平打到非常高,有的架子鼓錄音、電影音效和同期聲錄音等甚至?xí)逊逯档挠嗔苛舻?12~-20dB。假如你為了保證有20dB的余量,卻使用16bit錄音,其實只能利用其76dB的范圍。而在24bit的錄音中,即使你預(yù)留了20dB的余量,依然可以擁有144dB-20dB=124dB的動態(tài)范圍,此時的量化噪聲完全可以忽略,聲卡的性能也得以釋放。?
至于32bit的精度,以此類推可以獲得192dB的動態(tài)空間。需要注意的是,32bit和32bit float(浮點)是不一樣的?,F(xiàn)在的音頻接口通常最多使用32dB float的精度,它的意義是,在不改變24bit的精度下,額外增加了0dB上方48dB的余量。錄音的時候往往擔(dān)心錄爆(超過0dB的信號全部被抹平為0dB),此時則完全不用擔(dān)心。但是它能記錄的最小電平是和24bit精度下一致的,也就是說,量化噪聲并不會降低。但是噪聲是相對的,我們只需要確保信號和噪聲相比占主要部分就好。在這個情況下,量化噪聲往往會被音頻接口中的本底噪聲、錄音環(huán)境噪聲所掩蓋。

在數(shù)字音頻工作站(DAW)中,一些宿主還可以提供更高的內(nèi)部處理精度,這是為了避免插件運算時引入不必要的噪聲和削波而設(shè)定的。比如Studio One可以提供最大64bit float的內(nèi)部處理精度,這樣你在宿主中偶爾出現(xiàn)超過0dB的音量增益也可以被容忍,只要你在母帶階段把總線的峰值控制住就好。?
同樣,宿主內(nèi)部的采樣率也可以提升到很高,比如384kHz,這樣的高采樣率則可以防止欠采樣、真峰值產(chǎn)生Clip等現(xiàn)象,同時高采樣率也可以降低量化噪聲。?
總之,對于采樣深度的理解和運用,我們需要記?。涸阡浺綦A段盡量使用24bit以上的深度;在母帶輸出時,根據(jù)作品最終的載體(CD/DVD/流媒體)選擇對應(yīng)標(biāo)準(zhǔn)下的深度。其他細(xì)節(jié)問題,比如抖動(Dither)等暫不在本文范圍。
本文作者:艾夫
音樂制作人、編曲人、混音師、艾楽音樂工作室主理人、華中科技大學(xué)光電信息專業(yè)碩士。

*文中觀點為作者獨立觀點,不完全代表本號立場,僅供參考交流學(xué)習(xí);
*本文部分配圖源自網(wǎng)絡(luò),不用于商業(yè)用途;如有侵權(quán),請聯(lián)系本號處理。