使用非編軟件(如AU)進行音頻疊加去除BGM提取人聲
額……朋友們好啊,我鬼畜區(qū)老UP了(確信,記得13年那會兒天天整這玩意,剪輯渲染上傳什么的)。最近刷B站視頻發(fā)現(xiàn)首頁出現(xiàn)了一些人聲提取視頻,然后評論區(qū)有人問UP是怎么做的,這里我們作為老UP其實是記得當初非編軟件怎么用的,也看過當年那些人出的教程(現(xiàn)在自然是找不到了),只不過當年活字亂刷并沒有多流行所以并沒有提取干聲的需求,所以簡單再給各位更一期人聲提取教程吧。
視頻的效果大概是這個樣子的:
實際上這種方法也能去除掉短視頻里面很吵的BGM,只要有BGM和人聲+BGM的音頻軌就可以。相當于利用無人聲的BGM音頻軌和有人聲+BGM的音頻軌疊加實現(xiàn)消除BGM獲得人聲。所以實現(xiàn)的前提自然是有純無人聲(或者BGM中人聲也是一起需要消除的對象)的BGM音軌。
獲取的人聲干聲可以作為《玫瑰花的葬禮》,但是廢話文學 這種原聲翻唱調(diào)教作品的制作前置,如果各位想玩活字亂刷的話自然是很有必要的。
有興趣學習這種鬼畜視頻制作的可以看視頻教程: 【AU教程】利用反相伴奏(BGM)獲取人聲 DailyPixel (有空咱也會出視頻教程)
現(xiàn)在來看傳統(tǒng)的教程主要內(nèi)容都集中在降噪、中置聲道還有頻譜擦出等方法,而幾乎沒有人介紹,在有伴奏(BGM)原聲的情況下,可以利用伴奏反相去除背景音保留人聲。很多軟件都可以利用立體聲左右聲道混音消除人聲,比如早期的螃蟹網(wǎng)卡驅動和一些視頻播放器都可以消除/削弱人聲,理論上反向操作也可以無中生有得到人聲。而提取人聲其實操作也非常類似,只不過我們需要借助消聲音軌手動使用非編軟件疊加來實現(xiàn),這里我們使用COOL Edit的繼承者Audition來演示一下:
關于AU的安裝,咱本來想用手里現(xiàn)成的安裝包,具體是什么時候留下的不太記得,應該是我小弟留下的。對軟件安裝沒有興趣的可以直接跳過了
結果發(fā)現(xiàn)反正就是安裝不上,重啟也不是很管用
然后安裝后還要激活,找注冊碼沒用
倒不是沒有現(xiàn)成的注冊文件,安裝完畢后運行一次CS軟件,然后關閉,解壓復制amtlib.dll到CS5、6或CC文件夾覆蓋即可
但是到實際上注冊完了打開軟件還是無法使用,所以姑且認為安裝包是沒啥用的。好吧,直接選擇備用方案AU CS6綠色版
先給安裝版卸載
然后直接找AU CS6綠色版解壓并綠化,然后就可以開軟件了。最近思馬杰克丁好像不怎么牛逼了AU CS6的綠色版軟件包反正讓咱是這么輕而易舉的找到了,反正我能找到各位也能找到,所以這里要么也就先不提供鏈接了。
軟件這種東西不要追求最新,夠用就行,這還是咱當年和珊瑚大佬學的,作為老圖吧圖釘大佬的思想確實非常先進,頂級軟件也好配置也好都是外物對于整活做出好作品來說確實不是必要條件。過去有奔騰2渲染的星球大戰(zhàn),現(xiàn)在有用圖拉丁奔騰3渲染視頻的大佬和我,現(xiàn)在咱手里能用的上X200T這種雙核雙線的筆記本渲染視頻在當時看來確實是不可想象的事,X200的P8600都能吊打當年家里用的AMD X2 240了。
然后雙擊AU圖標打開AU CS6
開局先啥也不用管什么QuickTime不支持都不需要考慮,直接打開我們的音頻文件夾導入音頻素材
這里我們直接隨便導入一組帶卡拉OK消聲或者說去人聲/無人聲音軌(Off Vocal)的音頻文件
然后直接雙擊就可以打開當前音頻,如果現(xiàn)在已經(jīng)新建了混音項目可以直接拖動到混音中
然后軟件可能會提示采樣率不匹配之類的
這里我們可以用傳統(tǒng)MPC-HC播放器的Media info來獲取采樣率和位率根據(jù)參數(shù)來選擇重新新建多軌混音
也可以開局就不新建混音直接拉文件這個框下面的拖動條看音頻的參數(shù)再新建多軌混音
理論上如果屏幕分辨率夠大也可以不用拖動滾動條就能看見參數(shù)
這里我們先不做混音,雙擊音頻文件進入單個音頻之后選擇菜單欄效果-反轉,實際上就是相當于Vegas的反相效果,總之現(xiàn)在音頻的Y軸是完全倒過來了。
然后我們需要做的就是回到混音把兩個音頻拖動到兩個軌道后進行對點,直接拖動就行,上下拖動是調(diào)增益現(xiàn)在不要動左右拖動音頻就可以在軌道上移動對時間了。
讓反相后的音頻從時間上能完全對上,波峰對波谷,或者先不反相直接波峰對波峰也可以,都沒問題,總之這是個挺考驗眼力的活,如果眼力不好耐心也要有
對音頻精確對點需要放大波形視圖,所以按Ctrl+滾動鼠標滾輪可以實現(xiàn)放大視圖,當然反過來也可以縮小,改變指針位置來控制放大時的視角,尋找合適的需要放大的參考點作為對點的參考。
現(xiàn)在這個樣子基本就可以確定已經(jīng)成功對點了
然后自然就可以直接混音了,如果不放心還可以再放大看看具體到關鍵點的視圖
然后直接菜單文件-導出-多軌縮混
這里默認采樣率可以和源相同,咱這個混音項目就是參考素材的參數(shù)所以沒問題,也可以指定新的采樣類型,不過應該會受限于項目文件的參數(shù)。然后格式可以選很多,鑒于咱是用無損格式的素材做的混音輸出格式自然也是優(yōu)先選擇flac wav這種無損格式(相對無損,數(shù)字音源相比傳統(tǒng)模擬物理音源還是無法完全無損)
命名我們隨便改下源素材文件的名稱,原來正好有個OFF Vocal咱直接寫個Vocal就行了
然后導出完畢就可以聽了。實測這種操作對無人聲部分并沒有消除背景音的作用,反倒變得雜音很大,估計那些做提取人聲干聲的都是把無人聲伴奏部分直接剪掉或者直接用原聲了
那么提取出來的人聲有什么用呢?實際上如果不做素材的話確實沒啥用。自己聽純?nèi)寺暩杏X還不如聽無聲的。
一般來說不做鬼畜整活的話通常的操作是順手提取一下原CD的封面然后起小丸工具箱壓制一圖流視頻并上傳:Audition CS6綠色版翻轉疊加去人聲音軌混音實現(xiàn)提取人聲測試:未來は風のように (Vocal)
然后即使能過審也沒啥用,就交流測試看自己現(xiàn)在的對點水平和音軌均衡水平怎么樣。一般只要對點對準了基本不會有太大的問題,如果覺得消除效果還是不好考慮精確對點或者調(diào)整兩個軌道的增益達到一個實際平衡?!{(diào)這個地方。然后就沒有了,如果各位還是看不懂我們會直接出視頻教程,盡可能簡短些但是不落下關鍵的內(nèi)容讓各位在最短時間內(nèi)能掌握。
這里我真的想說出視頻教程的話需要考慮錄制視頻的體積啊,不然上傳動輒10來個G的視頻是非常麻煩的事,相比同樣清晰的1-2G的視頻處理起來太過于麻煩。
提取人聲的操作其實很容易,有眼有手就行。其實真正的難點是如何弄到卡拉OK消聲音頻軌,現(xiàn)在來看自從15年神魔大戰(zhàn)之后版權橫行,資源衰落,現(xiàn)在的年輕人普遍都不愿意去接觸過去傳統(tǒng)的字幕組模式,變得不會調(diào)播放器也不會用BT資源站自然就成了正版的受害者,也就不知道怎么獲取二次元相關的資源了。之前我記得我寫過一篇文章介紹過一般二次元資源的尋找方式來著:動漫的標準周邊產(chǎn)業(yè)鏈產(chǎn)品介紹 對,就這個,現(xiàn)在應該適當?shù)母乱幌?,主要是作為各位用戶如何去方便的獲取資源,之前好像咱還想過更新一期各位作為個人如何參與二次元周邊的創(chuàng)作和二次創(chuàng)作的教程來著,以后更一下吧?!兑话愣卧苓呝Y源獲取教程》更新預定,順帶動漫圖包獲取方法也可以更新一期powerful pixiv downloader的方案。
簡單來說各位需要找到NYAA下游的類似DMHY 36DM這種BT資源站,我用的是另一個資源站,里面有VCB NC Snow這種大組放的資源,然后搭配各字幕組的中文字幕,只需要會用BT下載(指utorrnet,不包括吸血雷)就能很容易的獲取資源,一般除非是特別冷門的片源不然都有能下動的源。
然后看里面的CD部分就能找到番劇配套的音頻資源了,一般只要發(fā)售時間在資源發(fā)布時間之前的都能有。然后就直接下載導入到AU或者Pr什么的就行了(Au還行,Pr很多時候舊版本不支持H265 10BIT編碼所以導入不進去或者無法導入)。
就這樣,謝謝朋友們!