關于“視頻文件格式”的那些事兒
自1988年數(shù)字視頻出現(xiàn)以來,每年都會開發(fā)新的視頻格式,試圖在質量、文件大小和視頻回放方面提供改進。如今,伴隨著視頻的普及率呈指數(shù)式的快速增長,尤其伴隨著智能手機和5G信號的廣泛應用,觀看數(shù)字視頻幾乎成為每個人的生活和工作常態(tài)。然而,對于大多數(shù)人來說,視頻格式和工作原理仍然是一個令人困惑的問題。接下來我們將討論視頻文件的基礎知識和應用。
在現(xiàn)實工作當中,相當一部分人通常會把文件的擴展名稱為視頻格式,但這是并不完全正確的。文件擴展名實際上是封裝格式的另一種表達形式。當有人問一個視頻是什么格式的時候,他們通常是想知道這個視頻是用什么容器和編解碼器來制作的,還想知道它存儲在什么類型的介質上,并希望能找到可以播放它的設備。其實每個視頻文件都有一個容器(封裝格式)和一個編解碼器。無論你做什么類型的視頻制作,都能一個最優(yōu)解來實現(xiàn)它。
換句話說,視頻格式其實就是一種標準化的規(guī)則,規(guī)定了封裝格式的編碼方式、元數(shù)據(jù)甚至文件夾結構,它能夠實現(xiàn)在不同設備和播放器上的兼容播放。當一個大平臺決定在產(chǎn)品中支持某種格式的內容時,該視頻格式就會變得流行起來,通常是因為技術上的突破或者特殊的應用場景,這通常會造成一個閉環(huán)的生態(tài)圈,其中創(chuàng)作者會以該格式生成內容,從而能夠在大型平臺播放;最后其他平臺也不得不開始支持這種格式,因為大部分的視頻內容用該格式生成。

關于容器:

容器(封裝格式)會將視頻流和音頻流連同其他信息(元數(shù)據(jù))一起保存在單個文件中;視頻流告訴播放器屏幕上需要顯示的內容;而音頻流告訴播放器哪些聲音需要與視頻一起播放;元數(shù)據(jù)可以理解為是“關于數(shù)據(jù)的數(shù)據(jù)”,包含了關于視頻的所有其它信息,包括比特率類型、分辨率、幀率、字幕、設備信息和創(chuàng)作時間等等。并且不同容器最終會以不同的文件擴展名的形式出現(xiàn),如:.mov、.avi或.mp4等等。雖然有些容器只傾向于在特定的編解碼器中保存媒體,例如用于MPEG文件的.mpg文件容器。但是有些容器,比如.mov,可以保存各種音頻和視頻編解碼器中的數(shù)據(jù)。容器中有信息可以告訴你其中是否包含音頻和視頻數(shù)據(jù),因此媒體播放器之類的東西會知道立即播放它們。

關于視頻編解碼器:

如果你處理過視頻文件,你就會知道元數(shù)據(jù)中最重要的部分就是編解碼方式。編解碼器是一種用于編排音頻或視頻文件數(shù)據(jù)的順序,其方式可用于回放、編輯或更改為其他編解碼器(轉碼)。編解碼器用于組織媒體數(shù)據(jù),但這些數(shù)據(jù)保存在容器中。比如創(chuàng)建了一個編碼后的視頻流或音頻流,使得它更小更容易管理之后,播放器會根據(jù)編碼設置的規(guī)則對其進行編碼定義。而在此過程中對原始視頻的編碼方式就有成百上千種。而這些不同類型的音頻和視頻編解碼器,它們都有各自的優(yōu)點。下面讓我們來介紹一下最重要的編解碼方式以及他們的優(yōu)缺點吧。
1.?H.264 & H.265視頻編碼

H.264(AVC)是目前最常用的視頻編解碼器,主要是因為對于相同的文件大小它提供的比特率比H.263要低得多,因此它得到了廣泛的應用,使用H.264幾乎不會遇到任何兼容問題。它的升級版H.265(HEVC)的壓縮率幾乎是H.264的2倍,這意味著用HEVC編碼的文件,至少要比用AVC編碼的文件小40%左右。這對2K以上的分辨率的視頻流非常有利,但是另一方面HEVC的編碼要復雜很多,需要預備3倍的資源來解碼,也就意味著使用H.265需要后期配備高配置的電腦處理才行。值得說的是,H.265并不是開源的編解碼,使用時要收取專利使用費。


2.?Apple ProRes 視頻編碼

蘋果公司的Apple ProRes 編解碼器提供獨一無二的多碼流實時編輯性能、卓越圖像質量和降低的存儲率組合。Apple ProRes 編解碼器充分利用多核處理,并具有快速、降低分辨率的解碼模式。所有 Apple ProRes 編解碼器都支持全分辨率的所有幀尺寸(包括 SD、HD、2K、4K 和 5K)。數(shù)據(jù)速率有所不同,具體取決于編解碼器類型、圖像內容、幀尺寸以及幀速率。盡管ProRes編解碼器最初是為后期工作而設計的,并且它處理后的文件體積還是較大的;但由于編解碼器在用戶中的普及以及軟件公司對編解碼器的廣泛支持,如今,它也被許多攝影機和攝像機制造商用作拍攝格式。

關于音頻編碼格式:

另一方面,音頻編碼方式同樣重要。MP3是最著名的音頻編碼方式之一,1993年由MPEG開發(fā)這種有損音頻編碼方式,利用了人類聽覺的局限性(通常被稱為“聽覺掩蔽現(xiàn)象”),比如MP3通常會被壓縮到128KBPS只有CD文件大小的9%,但聽起來有類似于CD的效果。20多年過去了,MP3仍然是分享和回放音頻內容的主流格式,但它在視頻方面的功能有限,從而使得一些其他的音頻編碼,在這些年里越來越流行,例如AAC是緊跟MP3之后開發(fā)的專用音頻編碼方式。AAC的主要優(yōu)點是它得到了廣泛的兼容,而且在相同的比特率下,你可以得到更好的效果,這也使得AAC成為當今最流行的音頻編碼方式。AAC幾乎沒有兼容問題,大多數(shù)情況下它適用于音頻的最佳編碼方式,但是AAC在多音軌方面有局限性的,這意味著我們需要一個新的編碼方式來應對更強大的音頻體驗。如果您需要環(huán)繞聲或與杜比產(chǎn)品兼容,可以選擇AC-3。因為它擁有很好的多音軌支持功能,從而能夠完全兼容環(huán)繞聲音頻,但除了DVD播放器和數(shù)字電視,AC-3幾乎沒有像AAC一樣足夠的設備支持和兼容。


當然,除了以上介紹的幾種編解碼器外,還有很多其他的音視頻編解碼器。本文也不在一一贅述,之后有機會再詳細講解??偠灾?,通過上文對“視頻格式”的簡單講解,我們需要了解到:編碼格式五花八門,在實際應用過程中,我們要充分了解到市場主流編碼格式的特點;根據(jù)制作的不同需求,考慮到不同編碼的優(yōu)劣,匹配到最好的格式組合,從而達到最佳的播放以及傳播效果。