聊一聊一些熒幕和現(xiàn)場(chǎng)背后的音頻故事(27)--wav是無(wú)損? mp3是垃圾? 那就導(dǎo)出flac吧
因?yàn)樗腥四芙佑|倒數(shù)字音頻的渠道是不一樣的,有些人是通過(guò)電視機(jī)的揚(yáng)聲器,有些人是通過(guò)聽(tīng)歌耳機(jī),甚至是游戲耳機(jī),所以,如果你問(wèn)我在最終沒(méi)人得到對(duì)于同一個(gè)音頻的聽(tīng)感是什么樣的,我會(huì)說(shuō),那應(yīng)該是都不一樣的把,
但是,后期的目的,其實(shí)就是為了,讓這個(gè)聲音能夠在所有的播放端達(dá)到一樣(不然做后期意義是為了什么那,直接一個(gè)限制器響度拉滿不就行了嗎←打死)
所以,既然是用來(lái)保證最終音頻質(zhì)量的步奏,自然逃不開(kāi)一個(gè)問(wèn)題,
數(shù)字音頻的編碼格式
這次,我們來(lái)挖老底
以能夠在所有平臺(tái)流通的音頻壓縮格式做一個(gè)匯總
aac?
一個(gè)和Mpge編碼幾乎同期誕生的音頻編碼格式,我們常見(jiàn)的流媒體,在線視頻平臺(tái)常用的音頻壓縮格式(因?yàn)榇蠹叶际怯玫膍p4格式)

2.mp3
因?yàn)橐苿?dòng)播放器盛行開(kāi)始流行的音頻數(shù)字編碼格式,特點(diǎn)是非常高的壓縮比,但缺點(diǎn)是19k以上會(huì)發(fā)生斜坡式跌落,以至于幾乎不存在二次加工的可能性

3.wav

PCM信號(hào)未經(jīng)過(guò)任何編碼和壓縮處理(無(wú)損壓縮)。與模擬信號(hào)比,它不易受傳送系統(tǒng)的雜波及失真的影響。動(dòng)態(tài)范圍寬,可得到音質(zhì)相當(dāng)好的效果。編碼上采用A律13折線編碼。
A律13折線
A律是PCM非均勻量化中的一種對(duì)數(shù)壓擴(kuò)形式。數(shù)字脈沖編碼調(diào)制(PCM)是目前模擬信號(hào)數(shù)字化的基本方法,PCM包括采樣、量化、編碼三個(gè)步驟,其中量化是對(duì)抽樣值的取值離散,根據(jù)量化間隔的不同選取分為均勻量化和非均勻量化,非均勻量化可以有效地改善信號(hào)的量化信噪比。語(yǔ)音信號(hào)的量化常采用ITU建議的兩種對(duì)數(shù)形式的非均勻量化壓縮特性:A律和μ律,A律編碼主要用于30/32路一次群系統(tǒng), A律PCM用于歐洲和中國(guó)。
人對(duì)頻率的識(shí)別范圍是 20HZ - 20000HZ, 如果每秒鐘能對(duì)聲音做 20000 個(gè)采樣, 回放時(shí)就足可以滿足人耳的需求.
8000hz 為電話采樣。
22050 的采樣頻率是常用的。
44100已是CD音質(zhì), 超過(guò)48000的采樣對(duì)人耳已經(jīng)沒(méi)有意義
對(duì)采樣率為44.1kHz的AAC(Advanced Audio Coding)音頻進(jìn)行解碼時(shí),一幀的解碼時(shí)間須控制在23.22毫秒內(nèi)。通常是按1024個(gè)采樣點(diǎn)一幀。
為什么這里需要說(shuō)下音頻幀呢?
音頻的幀的概念沒(méi)有視頻幀那么清晰,幾乎所有視頻編碼格式都可以簡(jiǎn)單的認(rèn)為一幀就是編碼后的一副圖像。但音頻幀跟編碼格式相關(guān),它是各個(gè)編碼標(biāo)準(zhǔn)自己實(shí)現(xiàn)的。因?yàn)槿绻訮CM(未經(jīng)編碼的音頻數(shù)據(jù))來(lái)說(shuō),它根本就不需要幀的概念,根據(jù)采樣率和采樣精度就可以播放了。比如采樣率為44.1kHZ,采樣精度為16位的音頻,你可以算出bitrate(比特率)是4410016kbps,每秒的音頻數(shù)據(jù)是固定的4410016/8 字節(jié)。
但是我們不希望每一次采樣都返回給我們進(jìn)行處理,我們希望的是返回一段時(shí)間內(nèi)的所有采樣數(shù)據(jù)。這里的音頻幀就是每次返回給我們多少個(gè)采樣數(shù)據(jù),一般情況是下返回2048個(gè)采樣數(shù)據(jù)。
那么單聲道 采用16位采樣位數(shù) 2048個(gè)采樣數(shù)據(jù)的大小是多少呢 ?2048*16/8 = 4096字節(jié)。
采樣位數(shù)
每個(gè)采樣數(shù)據(jù)記錄的是振幅, 采樣精度取決于儲(chǔ)存空間(采樣位數(shù))的大小:
1 字節(jié)(也就是8bit) 只能記錄 256 個(gè)數(shù), 也就是只能將振幅劃分成 256 個(gè)等級(jí)
2 字節(jié)(也就是16bit) 可以細(xì)到 65536 個(gè)數(shù), 這已是 CD 標(biāo)準(zhǔn)了;
4 字節(jié)(也就是32bit) 能把振幅細(xì)分到 4294967296 個(gè)等級(jí), 實(shí)在是沒(méi)必要了
如果是雙聲道(stereo), 采樣就是雙份的, 文件也差不多要大一倍.
比特率
碼率是指經(jīng)過(guò)編碼后的音頻數(shù)據(jù)每秒鐘需要用多少個(gè)比特來(lái)表示.
pcm編碼本質(zhì)已經(jīng)是無(wú)損音頻了,再去糾錯(cuò)幾乎就是在雞蛋里挑骨頭
4.flac/ape

相較于老牌壓縮格式wav,flac在實(shí)用層面存在
(1)靈活的壓縮策略:與libflac使用是“質(zhì)量”的參數(shù),該參數(shù)變化從0(最快)至8(最?。?。雖然在壓縮過(guò)程(壓縮文件總是完美的“無(wú)損”表示的原始數(shù)據(jù))。涉及速度和容量之間的折衷,解碼過(guò)程中始終是相當(dāng)快的,而不是非常依賴于壓縮
(2)快速:FLAC更看重解碼的速度。解碼只需要整數(shù)運(yùn)算,并且相對(duì)于大多數(shù)編碼方式而言,對(duì)計(jì)算速度要求很低。在很普通的硬件上就可以輕松實(shí)現(xiàn)實(shí)時(shí)解碼。
(3)硬件支持:由于FLAC提供了免費(fèi)的解碼范例,而且解碼的復(fù)雜程度低,所以FLAC是目前少數(shù)獲得硬件支持的無(wú)損壓縮編碼之一。(APE格式也有少數(shù)硬件支持)
(4)可以流化:FLAC的每個(gè)數(shù)據(jù)幀都包含了解碼所需的全部信息。解碼當(dāng)前幀無(wú)需參照它前面或后面的數(shù)據(jù)幀。FLAC使用了同步代碼和CRC(類似于MPEG等編碼格式),這樣解碼器在數(shù)據(jù)流中跳躍定位時(shí)可以有最小的時(shí)間延遲。
(5)可以定位:FLAC支持快速采樣精確定位。這不僅對(duì)于播放有益,更使得FLAC文件便于編輯。
(6)富于彈性的metadata:可以定義和實(shí)現(xiàn)新類型的metadata數(shù)據(jù)塊,而不會(huì)影響舊的數(shù)據(jù)流和解碼器的使用。目前已有的metadata類型包括tag,cue表,和定位表。已經(jīng)注冊(cè)的應(yīng)用程序可以定義自己專用的metadata類型(這一點(diǎn)與MIDI標(biāo)準(zhǔn)相似)。
(7)便于對(duì)CD進(jìn)行備份:FLAC有一個(gè)cue表,表內(nèi)的metadata數(shù)據(jù)塊用于保存CD的內(nèi)容列表和所有音軌的索引點(diǎn)。你可以將一張CD保存到一個(gè)單一文件,并導(dǎo)入CD的cue表格,這樣一個(gè)FLAC文件就可以完整地記錄整張CD的全部信息。當(dāng)你的原來(lái)的CD損壞的時(shí)候,你就可以用這個(gè)文件恢復(fù)出與原來(lái)一模一樣的CD副本。
(8)抗損傷:由于FLAC的幀結(jié)構(gòu),當(dāng)數(shù)據(jù)流損壞時(shí),數(shù)據(jù)損失會(huì)被限制在受損的數(shù)據(jù)幀之內(nèi)。一般只會(huì)丟失很短的一個(gè)片段。而很多其他無(wú)損音頻壓縮格式在遇到損壞時(shí),一個(gè)損壞就會(huì)造成后面所有數(shù)據(jù)丟失。
反觀音頻壓縮格式,最終呈現(xiàn)的方式就是,音頻本身的動(dòng)態(tài)余量大小,換而言之,數(shù)字音頻最大的優(yōu)勢(shì)就是,能在保存后,仍舊保證一個(gè)音頻擁有“足夠大的動(dòng)態(tài)余量”來(lái)保證它的呼吸感,缺點(diǎn)就是因?yàn)榱炕4鎺?lái)的“晶化”質(zhì)感,但因?yàn)橛行r(shí)候,一些細(xì)節(jié)不是完全保留就是最好一樣(就像你聽(tīng)到了電聲樂(lè)器帶來(lái)的動(dòng)感體驗(yàn),但如果你聽(tīng)過(guò)它的底噪你可能會(huì)反而厭惡它一樣),反觀未來(lái),還是現(xiàn)在,并沒(méi)有一個(gè)理論能夠支持的住大于48000hz的采樣率能給記錄音樂(lè)載體帶來(lái)任何良性影響,所以在數(shù)字編碼領(lǐng)域大膽采用44100hz的無(wú)損壓縮格式去壓制音頻可能是對(duì)于音樂(lè)作品最好的保存方式,反觀影視和動(dòng)畫(huà)錄音可能以96000hz/48000hz以保留更多單獨(dú)人聲的細(xì)節(jié)比較合適