手機站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » DeepFaceLab下載教程-2023年最新版本

DeepFaceLab下載教程-2023年最新版本

2023-01-15 22:18 作者:井月螢秋 0人讀過 | 我要投稿

今天來給大家講解2023年最新版本DeepFaceLab新手入門教程。

新手小白一文看懂！總共7個操作步驟，請大家耐心看完！

本文僅為教程使用，如果有其他問題可以自行到官網(wǎng)查看。

安裝軟件

官網(wǎng)下載地址：www.kx401.com

這里給大家提供DeepFaceLab三種軟件包，都是集成好的綠色免安裝

具體內(nèi)容包含:

1.DeepFaceLab官方英文原版

2.DeepFaceLab中文漢化版

3.DeepFaceLab圖形界面漢化版

PS：對于新手可以直接使用中文漢化版和圖形界面漢化版！特別是圖形界面漢化版和正常使用軟件差不多

不過建議不管下載那種版本都看完本文，入門之后再挑選自己喜歡的版本！

----

官方英文版對于大部分國人不太友好，本篇主要講解dfl中文漢化版的使用教程：

首先通過網(wǎng)盤下載：DeepFaceLab中文漢化版

解壓打開看漢化版的會看到這個目錄：

不輸入就是上面這種結(jié)果。然后你點1，2，3，4每個步驟都點不動。因為不看英文或者大意，犯這個錯誤的也不少。

正確的打開方式是這樣的。里面會有_internal和workplace文件夾。前者放的是源代碼和軟件相關(guān)的內(nèi)容，后者是工作目錄，上一篇有講過。除此之外還有一堆.bat結(jié)尾的文件。可以把這些稱為腳本或者批處理文件。里面是一行行的DOS命令。

批處理文件打開方式和EXE一模一樣，Double kill ~~Double click ?雙擊打開！每一個批處理文件都干一件事情，我們要做的就是按一定的順序點擊這些文件，就能完成換臉。是不是挺簡單？

執(zhí)行步驟

DFL換臉的思路是，想將視頻轉(zhuǎn)換成圖，從圖片中提取人臉，從人臉中學(xué)習(xí)特征。然后應(yīng)用模型，先對圖片進行換臉，然后把圖片合成視頻，同時帶上原視頻的音軌。

具體來說可以分為如下幾步：

源視頻轉(zhuǎn)圖片
目標(biāo)視頻轉(zhuǎn)圖片
提取源頭像
提取目標(biāo)頭像
訓(xùn)練模型
應(yīng)用模型
合成視頻

批處理文件步驟如下：

源視頻轉(zhuǎn)圖片 extract images from video data_src.bat
目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat
提取源頭像 data_src faceset extract.bat
目標(biāo)頭像提取 data_dst faceset extract.bat
訓(xùn)練輕量級模型 train Quick96.bat/SAE/AMP
應(yīng)用輕量級模型 merge Quick96.bat /SAE/AMP
合成 MP4 視頻 merged to mp4.bat

雜七雜八交代清楚了就可以開始操作，本文會將每一個步驟截圖說明。但是為了控制文章的體型，以操作為主。一些常見錯誤或者參數(shù)詳解，會在后續(xù)文章中完成。關(guān)于操作，這里做一個重點提示：遇事不決按回車！

1：源視頻轉(zhuǎn)圖片

跳出黑色窗口，輸入10回車，然后輸入jpg回車，就會自動開始將視頻分解為圖片。

FPS：視頻有一個指標(biāo)叫幀率，常見有24，30，60等，代表一秒鐘有幾張。第一個參數(shù)輸入10指的是一秒鐘只取10張；不輸入直接回車，默認幀率是30就取30張。因為很多影視劇畫面相對固定，沒必要全部取，否則后面會浪費大量提取時間，而且模型訓(xùn)練壓力也會加大。

Format: ?圖片格式，主要是jpg和png。png是無損格式，但是JPG能在保證畫質(zhì)的情況下減少巨量的空間。所以如果不是要求特別變態(tài)，一般都用jpg。這樣可以減少空間，節(jié)省時間

正常情況下，這個步驟執(zhí)行非?？?，出現(xiàn)“搞定/done” 的字樣就是執(zhí)行完成了。完成后，workplace/data_src下面就會出現(xiàn)很多圖片，這就是從視頻里分解出來的圖片。文件名一般為0000x.jpg，其實這里面命名可以隨意，沒有強制要求。這里還有一個aligned的文件夾，是為后面步驟準(zhǔn)備的。

2：目標(biāo)視頻轉(zhuǎn)圖片

雙擊批處理文件目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat

和上面的步驟類似，這次處理的是dst視頻。因為dst必須一幀不落，所以沒有FPS選項，只有圖片格式這一個選項。

處理完后的圖片保存在workspace/data_dst里面。

3：提取源頭像

雙擊批處理文件提取源頭像 data_src faceset extract.bat

這一步的作用是提取源素材圖片中的人臉。這里有六個參數(shù)，一般只需一路回車即可。第一次使用需要緩存GPU內(nèi)核，需要稍微等一等。開始提取后底部有顯示進度，當(dāng)進度到100%，會顯示圖片數(shù)量和提取到的人臉數(shù)量，并出現(xiàn)“搞定?。。　?就證明已經(jīng)出來成功并且處理完成。

處理完成后，頭像保存在data_src/aligned下面。

不少人在這個環(huán)節(jié)會遇到問題。

常見問題是：

驅(qū)動不夠新，去官網(wǎng)下載更新到最新版本即可。
軟件不夠新，deepfaker.xyz 上獲取新版
顯卡軟件不匹配， A卡用Directx12，不要用rtx3000版。

提取完之后，如果src素材比較復(fù)雜，就需要做一些篩選。這個篩選可以寫一篇很長的文章。這里簡要說一下。主要是把一些不需要的素材刪除：

很模糊的可以直接刪除
不是目標(biāo)人物的可以直接刪除
圖片殘缺的刪除
臉部有遮擋的刪除
臉部光照差異特別大的刪除
…..

4：提取目標(biāo)頭像

雙擊批處理文件目標(biāo)頭像提取 data_dst faceset extract.bat

這一步的作用是提取目標(biāo)素材圖片中的人臉。和上一步非常類似，這里就是少了一個“保存調(diào)試圖片”的參數(shù)。其實也不是少了，而是默認就執(zhí)行了。

提取的頭像保存在data_dst/aligned的文件夾里。

提取完之后也要對素材進行一個篩選。

把不是目標(biāo)人物的素材刪掉，把頭像旋轉(zhuǎn)的圖片刪掉。一般來說文件名后綴_1的都可以刪掉。dst的刪除核心原則是要換的人臉留下，不要換的統(tǒng)統(tǒng)刪掉。

這些圖標(biāo)保存在aligned_debug里面

大概其中一張圖片，可以看到人臉上有三種顏色的線框。

紅色就是頭像截取的區(qū)域，藍色是面部區(qū)域，綠色是人臉輪廓，以及五官定位的點。其實就是人臉的landmark。通過debug你可以直觀的看到人臉識別算法識別了哪些區(qū)域，有沒有識別正確。

5：訓(xùn)練模型

雙擊批處理文件訓(xùn)練輕量級模型 train Quick96.bat

這一步是訓(xùn)練模型，所有步驟中最重要，最難，也是最耗時間的部分。目前新版本中主要包含三類模型，分別是Quick96,SAEHD,AMP 。

我把Quick96翻譯為輕量級模型，優(yōu)點是所需配置低，顯存低，速度快，操作簡單。缺點是不能自定義，像素比較低，合成效果差一些。

這個模型很簡單，所以也非常適合拿來入門。所以本文就用這個來舉例。

Quick96使用非常簡單，雙擊批處理文件后，選擇執(zhí)行設(shè)備即可，這里一般都是選顯卡，直接回車即可。設(shè)備選擇完成之后，程序就會自動加載素材，并顯示模型的參數(shù)，底部會有跳動的數(shù)字，然后會跳出一個預(yù)覽窗口。

先來說說底部的數(shù)字，總共五列，分別代表：模型保存時間，迭代次數(shù)，單次迭代時間，源損失，目標(biāo)損失。迭代次數(shù)是越多越好，損失是越低越好，零就是無損了嘛~不過，不可能達到！

下面來說說預(yù)覽窗口

預(yù)覽窗口包含操作提示、loss曲線，人臉區(qū)域。人臉區(qū)域總共五列。第一列是src，第三列是dst。第二，四，五列為算法生成列，剛開始是純色，啥頭像都沒有。隨著訓(xùn)練的進行，會慢慢出現(xiàn)輪廓，鼻子，眼睛，然后慢慢變清晰。

訓(xùn)練的過程就是等待這幾列變清晰的過程，最后一列就是換臉后的效果。

這一個步驟并不會自動結(jié)束，需要自己判斷，然后手動結(jié)束。可以通過損失值和預(yù)覽圖來進行判斷。一般來說損失值（loss）值到了0.1x就差不多了。但是素材質(zhì)量和數(shù)量不一樣，會影響這個指標(biāo)的變化速度。比如素材特別少，這個值降的特別快，特別低。圖片不是很清晰，這個值也降的特別快，特別低。反過來，圖片質(zhì)量高，數(shù)量多，這個就很難降低。但是這樣情況下訓(xùn)練出來的模型更好。

相比數(shù)字而已，通過預(yù)覽圖來判斷就更加直觀了。只要觀察第二列是否無限接近第一列，第四列是否無限接近第三列。第五列的表情是否無限接近第四列。所有列的圖片是否都足夠清晰。如果答案是“Yes” ，那么按回車或者直接關(guān)閉窗口，進入下一步。

正常情況下模型會過幾十分鐘保存一次，也可以手動按S直接保存。關(guān)閉后，可以重新點擊批處理文件繼續(xù)訓(xùn)練，不用擔(dān)心丟失進度。當(dāng)然，要防止意外關(guān)機和重啟，可能會損壞模型。

6：應(yīng)用模型

雙擊批處理文件應(yīng)用輕量級模型 merge Quick96.bat

這個步驟要做的是將圖片進行換臉。應(yīng)用Quick96模型也很簡單。啟動直接按回車選中或者輸入對應(yīng)的數(shù)字選中上一步已經(jīng)訓(xùn)練好的模型。然后軟件就會加載模型并顯示模型參數(shù)。

然后需要配置兩個參數(shù)：

一個是是否啟用交互模式，直接回車，默認啟用。

一個是線程數(shù)量，輸入小于等于8的數(shù)字，回車。注意，如果你核心特別多，默認回車會報錯的！

稍等一會兒會彈出幫助界面。

這個界面并沒有任何功能上的用處，只是顯示了這個環(huán)節(jié)可以使用的快捷鍵。每個快捷鍵旁邊都有中文注釋，可以看個大概，具體的參數(shù)含義我會在后面的文章中做一個詳細的介紹。

點擊這個界面，確保輸入法為英文，按下鍵盤上的Tab，就可以進入合成預(yù)覽界面

進來后，默認情況下都會有人皮面具的感覺，這是正?，F(xiàn)象。因為我們參數(shù)還沒有調(diào)整！就這個素材來說，只要調(diào)整W/S，E/D 快捷鍵即可。調(diào)整后的效果如下：

黑色窗口會顯示所有的合成參數(shù)，并且顯示進度條，等100%完成之后，手動關(guān)閉窗口即可。

此時，在data_dst下面已經(jīng)多了兩個文件，一個是merged，一個是merged_mask

進入merged可以看到很多圖，這些圖片中的人臉已經(jīng)完全換臉。

進入merged_mask可以看到一些黑色的圖片，中間有一個白色的區(qū)域。這些文件是為了方便后期制作。我們單純使用DFL的不用太關(guān)心。

7：合成視頻

雙擊批處理文件合成 MP4 視頻 merged to mp4.bat

這個步驟是將已經(jīng)換好臉的圖片轉(zhuǎn)換成視頻，并且會自動讀取源視頻的配置信息，包括幀率，音軌這些。這個環(huán)節(jié)只有一個輸出碼率的參數(shù)，常規(guī)來說3就夠了。

除了合成mp4之外，還可以合成無損視頻，AVI ，MOV等格式，便于后期處理。

執(zhí)行完成后，workspace下面多了兩個文件，分別是result.mp4 和 result_mask.mp4 。前者就是我們需要的最終視頻，后者是遮罩視頻，供后期使用。

雙擊打開視頻，就可以看到最終效果啦。

步驟其實不難，細節(jié)很多。有些是可以直接照搬別人經(jīng)驗的。有些需要自己不斷摸索。這并不是什么傻瓜軟件，要做出好的效果肯定是要花時間研究。就像即便送你PS，PR，你沒有一定的學(xué)習(xí)積累不可能做出酷炫的效果。但是我可以保證，市面上幾乎所有神乎其技的換臉視頻都是基于DFL，有些可能專門準(zhǔn)備了道具場景并使用了后期制作。

標(biāo)簽：