聊一聊一些熒幕和現(xiàn)場背后的音頻故事(17)——抖動(dithering)為啥導(dǎo)出變難聽了?
? ? ? ? ? ? ? ? 抖動是數(shù)字系統(tǒng)的信號完整性測試的核心內(nèi)容之一,是時鐘和串行信號的最重要測量參數(shù)(注:并行總線的最重要測量參數(shù)是建立時間和保持時間)。一般這樣定義抖動:“信號的某特定時刻相對于其理想時間位置上的短期偏離為抖動”。
? ? ? ? ? ? ??抖動”是印刷行業(yè)和出版業(yè)中常用的一種工藝,老式的針式打印機(jī)只能打印出來黑點和白點,可是黑白圖片是有灰度級的,那么如何打印出來圖片呢?“抖動”由此而生,抖動試圖通過在白色背景上生成黑色的二值圖像來給出色調(diào)變化的直觀印象,可以假想一下,黑點越密,那么遠(yuǎn)距離觀察就越黑,如何控制黑點的分布就是“抖動”算法的核心,

抖動是音樂制作詞典中最不被理解的詞匯之一,但它又是數(shù)字音頻處理中一個必不可少的因素。
那么,什么是抖動呢?它其實是一種低電平形式的噪音,在渲染向更低的位深時,被刻意添加到數(shù)字音頻文件中。抖動的概念可能聽似“反直覺”,但卻是一個很有效的處理方式。抖動噪音實際上掩蓋了所謂的“量化失真”,后者會導(dǎo)致數(shù)字音頻出現(xiàn)噪聲和不自然感。
? ? ? ? ??當(dāng)音頻通過數(shù)模轉(zhuǎn)換器(ADC)被數(shù)字化處理時——也就是當(dāng)錄音通過音頻接口發(fā)送給DAW時,來自話筒或DI盒的模擬音頻信號將被轉(zhuǎn)換為一系列的1和0,音頻被表現(xiàn)為數(shù)字形式。為此,ADC設(shè)備獲取音頻快照(也稱為“樣本”)時要通過特定的速率和大小——也就是采樣率(Sample Rate)和位深度(Bit Depth,或稱比特深度)。
采樣率控制著轉(zhuǎn)換器在一秒鐘內(nèi)捕捉到并進(jìn)行數(shù)字化處理的音頻采樣數(shù)量,它在頻率響應(yīng)方面至關(guān)重要。基于奈奎斯特定理(Nyquist Theorem)的一般規(guī)則,你的采樣率必須大于或等于音頻最高頻率的兩倍。否則,被稱為“混疊”(Aliasing)的失真就會損壞聲音。
為了獲得到高至20kHz的頻率——人類聽覺的頻率上限,通常使用的最低采樣率是44.1kHz(CD介質(zhì)的速率)。但是現(xiàn)在,48kHz或更高的頻率也很常用。采樣率越高,重現(xiàn)頻率范圍的精度就越高。
位深度(也稱可之為“字長”)是指每個樣本的大小,即它所包含的0和1的數(shù)量。它量化了振幅的精確程度,因此動態(tài)范圍(可捕獲到的最大響度和底噪之間的差距)得以在數(shù)字化時得到體現(xiàn)。
位深越高,對振幅的描述就越精確。比較16位(Bit,比特)和24位音頻時,分辨率的差異非常驚人。16位音頻可以讓振幅表現(xiàn)高至65536個等級,而24位則能達(dá)到16777216個等級。在動態(tài)范圍方面,一個比特相當(dāng)于6dB。16位時,你就有96dB(16x6),24位時則有144dB(24x6)。

? ? 量化失真
當(dāng)你將文件從24bit轉(zhuǎn)換為16bit時,數(shù)字音頻軟件將會刪除(“截斷”)最后8位,并且必須將數(shù)據(jù)四舍五入以適合至可用的較小位數(shù)。這個過程被稱為“量化”(Quantization)。它與你在MIDI中量化音符的過程不同,但概念類似。在MIDI序列中,如果將十六分音符樂句量化為八分音符,你的DAW必須將未落在八分音符上的任何十六分音符都重新指定到最接近的音符上。這樣就降低了音樂的精度。

將24位音頻轉(zhuǎn)換為16位(或從32位固點轉(zhuǎn)換為24位等等)時,DAW或音頻編輯器會進(jìn)行比特量化,反映到振幅上,層級就明顯更少了。結(jié)果就是,整數(shù)化可能會導(dǎo)致所謂的量化錯誤(也稱為“量化失真”或“截斷失真”),具體表現(xiàn)為低電平噪音或著失真。
p.s:通常這種變化在24bit向16bit兼容的時候會比較少,但如果整體音頻是從32bit以上向下壓制成為16bit,中間會發(fā)生非常多的失真噪音,所以這種時候加入抖動就會變得非常的必要。
當(dāng)抖動被添加到有量化失真的音頻時,它會掩蓋量化失真,使其出現(xiàn)得更加隨機(jī),讓耳朵難以辨別。與粗糙刺耳的結(jié)果相反,抖動處理將量化失真轉(zhuǎn)變?yōu)榉€(wěn)定的低水平的模擬感嘶聲。
另一個在有抖動功能的軟件和插件中常見的術(shù)語是“噪音塑形”(Noise-shaping)。這基本上是指抖動均衡處理,旨在改變抖動噪音的頻率特性,使其處于人耳最難聽辨的范圍。

抖,還是不抖?
何時添加抖動,是一個讓人困惑甚至極具爭議的話題??创淖詈唵畏绞绞?,在位深下降時,始終應(yīng)該進(jìn)行抖動。所以,如果從24bit變?yōu)?6bit,應(yīng)該抖動;如果從32bit變?yōu)?4bit或16bit,也應(yīng)該抖動。
但是,如果你將混音并軌到MP3或AAC等數(shù)據(jù)壓縮編譯碼文件上,抖動則不是必要之舉。這類格式都會將修飾感加入到信號中,抖動是無法彌補的。
在給如MP3和AAC這些有損編解碼器編碼時,你能做的最好的努力是使用最高的比特率,同時確保文件大小可以達(dá)到流媒體平臺的限制要求。不要將比特率與位深混淆。比特率測量的是信號流的傳輸速度,最常見的是以kbps(千比特/秒)或mbps(兆比特/秒)表示。比特率越高,質(zhì)量越好,文件也就越大。

同樣的,對圖片制作適度的銳化和對高采樣圖片后期導(dǎo)出成為較低采樣深度的色彩圖的時候也可以適度的添加銳化來減少這種量化失真帶來的影響
那么下次再見