UTAU筆記 - 音源采樣率的分析

目前UTAU普遍使用的音源格式為:44100Hz,單聲道,16位,wav格式。
為獲得更好的采樣效果,擬使用48kHz,立體聲,32位,wav格式音頻進行音源測試,觀察不同格式下的音源會造成的變化。本次測試使用Moresampler引擎。
1. 位數(shù)測試
經(jīng)過測試,得出以下結論
16位音頻能夠正常顯示原音設定界面,雙擊P正常預覽。填詞音可正常播放。
24位音頻波形變得雜亂,充滿整個音軌,雙擊P預覽為刺耳的雜音。填詞音可正常播放。
32位音頻波形變得雜亂,充滿整個音軌,雙擊P預覽沒有聲音。填詞音可正常播放。
使用UTAU過程中發(fā)現(xiàn)原音設定是一大串雜亂的波形,那么就可以推測波形文件的位數(shù)不是16位。結論是仍然推薦使用16位wav音頻。



2. 聲道數(shù)測試




觀察及對比波形可以發(fā)現(xiàn),音源為立體聲和單聲道的情況下,兩者原音設定波形和輸出波形幾乎完全一致。
測試使用的立體聲錄制的時候左右聲道信息相近,沒有明顯的空間信息。在空間信息更明顯的情況下,波形應該有更大的差異,不過區(qū)別仍然非常小。由于UTAU輸出為單聲道波形,無法保留立體聲信息,因此使用立體聲音源意義不大。
個人推測UTAU會對輸入立體聲進行重采樣,使用某種混合模式,例如Auditon的左聲道和右聲道各50%混合的方式生成單聲道的文件,本質(zhì)上還是單聲道輸入。不過立體聲音源仍然可以正常使用(部分up主配布的音源里面就使用了立體聲wav波形)。
結論是仍然推薦使用單聲道wav音頻。
3.?采樣率測試




觀察發(fā)現(xiàn),48kHz和44.1kHz的原音設定波形完全一致,而輸出波形出現(xiàn)了波形和音量的變化,其中44.1kHz輸出音量比48kHz輸出音量大了1.2dB左右。其余音頻細節(jié)無法進行判斷,從聽感的角度出發(fā),以及各大引擎的兼容性,還是推薦使用44.1kHz的采樣率制作音源。但使用48kHz采樣率也是可行的。
4. 結語
本次測試針對的是Moresampler引擎,默認引擎以及其他引擎未進行測試,可能會出現(xiàn)不同的結果。本次測試可能存在不準確的地方,結論僅供參考。