linux ubuntu上運行uvr5人聲分離器
1.?inux ubuntu運行uvr5人聲分離器
github地址:?https://github.com/NanKeRen2020/UVR5_Linux
安裝&運行
這些說明適用于安裝 UVR 5.4 的用戶,也許 UVR 5.x 也可以工作,需要 python 3.8/3.9。
sudo apt-get 安裝 sox
sudo apt-get 安裝 ffmpeg
克隆源代碼。
pip install --no-cache-dir -r requirements.txt
pip 安裝 torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f?https://download.pytorch.org/whl/torch_stable.html
通過應用程序中的“設置”菜單下載模型或從原始項目 [1] 下載。
運行python3.9 UVR.py,主界面如下圖
2.?Windows 安裝
關(guān)于
此應用程序使用最先進的源分離模型從音頻文件中去除人聲。UVR 的核心開發(fā)人員訓練了此包中提供的所有模型(Demucs v3 和 v4 4-stem 模型除外)。
核心開發(fā)人員
安祖07
aufr33
支持項目
捐
安裝
這些包包含 UVR 接口、Python、PyTorch 和其他有效運行應用程序所需的依賴項。不需要先決條件。
Windows 安裝
請注意:
此安裝程序適用于運行 Windows 10 或更高版本的用戶。
不保證運行 Windows 7 或更低版本的系統(tǒng)的應用程序功能。
不保證 Intel Pentium 和 Celeron CPU 系統(tǒng)的應用程序功能。
您必須將 UVR 安裝到主 C:\ 驅(qū)動器。將 UVR 安裝到輔助驅(qū)動器會導致不穩(wěn)定。
通過以下鏈接下載適用于 Windows 的 UVR 安裝程序:
主要下載鏈接
主下載鏈接鏡像
已安裝 UVR 的更新包說明:
如果您已經(jīng)安裝了 UVR,則可以在其上安裝此軟件包或直接從應用程序下載。
Windows 手動安裝
安裝
請注意:
此捆綁包適用于運行 macOS Catalina 及更高版本的用戶。
不保證運行 macOS Mojave 或更低版本的系統(tǒng)的應用程序功能。
不保證舊版或廉價 Mac 系統(tǒng)的應用程序功能。
安裝完所有內(nèi)容后,應用程序可能需要 5-10 分鐘才能首次啟動(取決于您的 Macbook)。
通過以下鏈接之一下載適用于 MacOS 的 UVR dmg:
主要下載鏈接
主下載鏈接鏡像
主要下載鏈接
主下載鏈接鏡像
Mac M1(arm64)用戶:
Mac 英特爾 (x86_64) 用戶:
MacOS 用戶:打開 UVR 時遇到問題?手動 MacOS 安裝
Linux安裝
請參閱 Linux 安裝說明
其他應用筆記
Nvidia RTX 1060 6GB 是 GPU 轉(zhuǎn)換的最低要求。
建議使用至少具有 8GB V-RAM 的 Nvidia GPU。
目前不支持 AMD Radeon GPU。
此應用程序僅與 64 位平臺兼容。
此應用程序依賴于 Rubber Band 庫的時間拉伸和變調(diào)選項。
此應用程序依賴 FFmpeg 來處理非 wav 音頻文件。
該應用程序?qū)⒃陉P(guān)閉時自動記住您的設置。
轉(zhuǎn)換時間將在很大程度上取決于您的硬件。
這些模型是計算密集型的。
更改日志
最近的變化:
修復了下載中心型號列表問題。
修復了合奏模式下的音頻片段。
修復了集成模式下的輸出模型名稱問題。
為 MDX-Net 添加了“批處理模式”以提高性能。
批處理模式的內(nèi)存效率更高。
無論批量大小如何,批處理模式都能產(chǎn)生最佳輸出。
為 VR 架構(gòu)添加了批處理模式。
為 Demucs 添加了混音器模式。
此選項可以改進某些 4 桿模型的分離。
從 UVR v5.4 到 v5.5 的修復和更改:
進度條現(xiàn)在與應用程序中的每個進程完全同步。
拖放功能現(xiàn)在應該每次都能使用。
用戶現(xiàn)在可以將大量文件和目錄作為輸入。刪除目錄后,應用程序?qū)⑺阉魅魏尉哂幸纛l擴展名的文件并將其添加到輸入列表中。
固定低分辨率圖標。
添加了在應用程序無法連接到 Internet 時手動下載模型的功能。
下載中心的各種錯誤修復。
各種設計變更。
表現(xiàn):
模型加載時間更快。
導入/導出音頻文件更快。
新選項:
“選擇保存的設置”選項 - 允許用戶保存整個應用程序的當前設置。您還可以加載保存的設置或?qū)⑺鼈冎刂脼槟J設置。
“右鍵單擊”菜單 - 允許快速訪問重要選項。
“幫助提示”選項 - 啟用后,用戶可以將鼠標懸停在選項上以查看描述該選項的彈出文本。右鍵單擊選項還允許復制“幫助提示”文本。
二級模型模式 - 此選項是僅適用于 MDX-Net 的“Demucs 模型”選項的擴展版本。除了現(xiàn)在,此選項在所有三個 AI 網(wǎng)絡和任何詞干中都可用。任何模型現(xiàn)在都可以是次要的,用戶可以選擇它對最終結(jié)果的影響程度。
集成模式的強大緩存,允許更快的處理時間。
單擊“輸入”字段將彈出一個新窗口,允許用戶瀏覽所有選定的音頻輸入。在此菜單中,用戶可以:
刪除輸入。
驗證輸入。
創(chuàng)建選定輸入的樣本。
“示例模式”選項 - 允許用戶僅處理軌道的一部分以示例設置或模型,而無需運行完整的轉(zhuǎn)換。
括號中的數(shù)字是生成樣本的當前秒數(shù)。
您可以在“其他設置”菜單中選擇從曲目中提取的秒數(shù)。
虛擬現(xiàn)實架構(gòu):
能夠切換“高端處理”。
支持最新的VR架構(gòu)
Crop Size 和 Batch Size 專門針對僅使用最新架構(gòu)的模型。
MDX-網(wǎng):
“降噪輸出”選項會產(chǎn)生更清晰的結(jié)果,但處理時間會更長。此選項已取代降噪。
“光譜反轉(zhuǎn)”選項使用光譜反轉(zhuǎn)技術(shù)來獲得更清晰的二級詞干結(jié)果。此選項可能會減慢音頻導出過程。
輔助詞干現(xiàn)在具有與主詞干相同的截止頻率。
Demucs:
現(xiàn)在支持 Demucs v4 模型,包括 6 桿模型。
僅當用戶未選擇“所有詞干”時才組合剩余詞干而不是將選定詞干與混合物反轉(zhuǎn)。
一種“預處理”模型,允許用戶通過強大的聲樂或樂器模型進行推理,并將剩余的詞干從其生成的樂器混音中分離出來。此選項可以顯著減少其他 Demucs 生成的非人聲詞干中的人聲滲出。
預處理模型旨在用于除人聲和樂器之外的所有詞干的 Demucs 分離。
合奏模式:
集成模式已擴展為包括以下內(nèi)容:
“平均”是一種對最終結(jié)果進行平均的新算法。
合奏中的無限模型。
能夠保存不同的合奏。
能夠為所有單獨的詞干類型集成輸出。
能夠選擇獨特的集成算法。
能夠一次集成所有 4 個 Demucs 詞干。
故障排除
常見問題
如果未安裝 FFmpeg,如果用戶嘗試轉(zhuǎn)換非 WAV 文件,應用程序?qū)伋鲥e誤。
內(nèi)存分配錯誤通??梢酝ㄟ^降低“塊大小”來解決。
問題報告
發(fā)布新問題時請盡可能詳細。
如果可能,點擊“開始處理”按鈕左側(cè)的“設置按鈕”,點擊“錯誤日志”按鈕,可以提供給我們詳細的錯誤信息。
執(zhí)照
Ultimate Vocal Remover GUI代碼是MIT 許可的。
請注意:對于所有希望使用我們模型的第三方應用程序開發(fā)人員,請通過向 UVR 及其開發(fā)人員提供信用來遵守 MIT 許可證。
學分
DilanBoskan?- 你在這個項目開始時的貢獻對 UVR 的成功至關(guān)重要。謝謝你!
Bas Curtiz?- 設計了官方 UVR 徽標、圖標、橫幅和初始屏幕。
tsurumeso?- 開發(fā)了原始的 VR 架構(gòu)代碼。
Kuielab & Woosung Choi?- 開發(fā)了原始的 MDX-Net AI 代碼。
Adefossez & Demucs?- 開發(fā)了原始的 Demucs AI 代碼。
KimberleyJSN?- 為 MDX-Net 和 Demucs 的訓練腳本的實施提供建議和幫助。謝謝你!
Hv?- 幫助將塊實現(xiàn)到 MDX-Net AI 代碼中。謝謝你!
貢獻
對于任何對Ultimate Vocal Remover GUI的持續(xù)開發(fā)感興趣的人,請向我們發(fā)送拉取請求,我們將對其進行審核。
這個項目是 100% 開源的,任何人都可以免費使用和修改。
我們只維護對Ultimate Vocal Remover GUI和提供的模型的開發(fā)和支持。