DeepFaceLab下載教程-2023年最新版本
今天來給大家講解2023年最新版本DeepFaceLab新手入門教程。
新手小白一文看懂!總共7個操作步驟,請大家耐心看完!
本文僅為教程使用,如果有其他問題可以自行到官網(wǎng)查看。
安裝軟件
官網(wǎng)下載地址:www.kx401.com
這里給大家提供DeepFaceLab三種軟件包,都是集成好的綠色免安裝
具體內(nèi)容包含:
1.DeepFaceLab官方英文原版
2.DeepFaceLab中文漢化版
3.DeepFaceLab圖形界面漢化版
PS:對于新手可以直接使用中文漢化版和圖形界面漢化版!特別是圖形界面漢化版和正常使用軟件差不多
不過建議不管下載那種版本都看完本文,入門之后再挑選自己喜歡的版本!
----
官方英文版對于大部分國人不太友好,本篇主要講解dfl中文漢化版的使用教程:
首先通過網(wǎng)盤下載:DeepFaceLab中文漢化版
解壓打開看漢化版的會看到這個目錄:

不輸入就是上面這種結(jié)果。然后你點1,2,3,4每個步驟都點不動。因為不看英文或者大意,犯這個錯誤的也不少。

正確的打開方式是這樣的。里面會有_internal和workplace文件夾。前者放的是源代碼和軟件相關(guān)的內(nèi)容,后者是工作目錄,上一篇有講過。除此之外還有一堆.bat結(jié)尾的文件。可以把這些稱為腳本或者批處理文件。里面是一行行的DOS命令。
批處理文件打開方式和EXE一模一樣,Double kill ~~Double click ?雙擊打開!每一個批處理文件都干一件事情,我們要做的就是按一定的順序點擊這些文件,就能完成換臉。是不是挺簡單?
執(zhí)行步驟
DFL換臉的思路是,想將視頻轉(zhuǎn)換成圖,從圖片中提取人臉,從人臉中學(xué)習(xí)特征。然后應(yīng)用模型,先對圖片進行換臉,然后把圖片合成視頻,同時帶上原視頻的音軌。
具體來說可以分為如下幾步:
源視頻轉(zhuǎn)圖片
目標(biāo)視頻轉(zhuǎn)圖片
提取源頭像
提取目標(biāo)頭像
訓(xùn)練模型
應(yīng)用模型
合成視頻
批處理文件步驟如下:
源視頻轉(zhuǎn)圖片 extract images from video data_src.bat
目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat
提取源頭像 data_src faceset extract.bat
目標(biāo)頭像提取 data_dst faceset extract.bat
訓(xùn)練輕量級模型 train Quick96.bat/SAE/AMP
應(yīng)用輕量級模型 merge Quick96.bat /SAE/AMP
合成 MP4 視頻 merged to mp4.bat
雜七雜八交代清楚了就可以開始操作,本文會將每一個步驟截圖說明。但是為了控制文章的體型,以操作為主。一些常見錯誤或者參數(shù)詳解,會在后續(xù)文章中完成。關(guān)于操作,這里做一個重點提示:遇事不決按回車!
1:源視頻轉(zhuǎn)圖片

跳出黑色窗口,輸入10回車,然后輸入jpg回車,就會自動開始將視頻分解為圖片。
FPS:視頻有一個指標(biāo)叫幀率,常見有24,30,60等,代表一秒鐘有幾張。第一個參數(shù)輸入10指的是一秒鐘只取10張;不輸入直接回車,默認幀率是30就取30張。因為很多影視劇畫面相對固定,沒必要全部取,否則后面會浪費大量提取時間,而且模型訓(xùn)練壓力也會加大。
Format: ?圖片格式,主要是jpg和png。png是無損格式,但是JPG能在保證畫質(zhì)的情況下減少巨量的空間。所以如果不是要求特別變態(tài),一般都用jpg。這樣可以減少空間,節(jié)省時間

正常情況下,這個步驟執(zhí)行非???,出現(xiàn)“搞定/done” 的字樣就是執(zhí)行完成了。完成后,workplace/data_src下面就會出現(xiàn)很多圖片,這就是從視頻里分解出來的圖片。文件名一般為0000x.jpg,其實這里面命名可以隨意,沒有強制要求。這里還有一個aligned的文件夾,是為后面步驟準(zhǔn)備的。
2:目標(biāo)視頻轉(zhuǎn)圖片
雙擊批處理文件目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat

和上面的步驟類似,這次處理的是dst視頻。因為dst必須一幀不落,所以沒有FPS選項,只有圖片格式這一個選項。

處理完后的圖片保存在workspace/data_dst里面。
3:提取源頭像
雙擊批處理文件提取源頭像 data_src faceset extract.bat

這一步的作用是提取源素材圖片中的人臉。這里有六個參數(shù),一般只需一路回車即可。第一次使用需要緩存GPU內(nèi)核,需要稍微等一等。開始提取后底部有顯示進度,當(dāng)進度到100%,會顯示圖片數(shù)量和提取到的人臉數(shù)量,并出現(xiàn)“搞定?。。 ?就證明已經(jīng)出來成功并且處理完成。

處理完成后,頭像保存在data_src/aligned下面。
不少人在這個環(huán)節(jié)會遇到問題。
常見問題是:
驅(qū)動不夠新,去官網(wǎng)下載更新到最新版本即可。
軟件不夠新,deepfaker.xyz 上獲取新版
顯卡軟件不匹配, A卡用Directx12,不要用rtx3000版。
提取完之后,如果src素材比較復(fù)雜,就需要做一些篩選。這個篩選可以寫一篇很長的文章。這里簡要說一下。主要是把一些不需要的素材刪除:
很模糊的可以直接刪除
不是目標(biāo)人物的可以直接刪除
圖片殘缺的刪除
臉部有遮擋的刪除
臉部光照差異特別大的刪除
…..
4:提取目標(biāo)頭像
雙擊批處理文件目標(biāo)頭像提取 data_dst faceset extract.bat

這一步的作用是提取目標(biāo)素材圖片中的人臉。和上一步非常類似,這里就是少了一個“保存調(diào)試圖片”的參數(shù)。其實也不是少了,而是默認就執(zhí)行了。

提取的頭像保存在data_dst/aligned的文件夾里。
提取完之后也要對素材進行一個篩選。
把不是目標(biāo)人物的素材刪掉,把頭像旋轉(zhuǎn)的圖片刪掉。一般來說文件名后綴_1的都可以刪掉。dst的刪除核心原則是要換的人臉留下,不要換的統(tǒng)統(tǒng)刪掉。

這些圖標(biāo)保存在aligned_debug里面

大概其中一張圖片,可以看到人臉上有三種顏色的線框。

紅色就是頭像截取的區(qū)域,藍色是面部區(qū)域,綠色是人臉輪廓,以及五官定位的點。其實就是人臉的landmark。通過debug你可以直觀的看到人臉識別算法識別了哪些區(qū)域,有沒有識別正確。
5:訓(xùn)練模型
雙擊批處理文件 訓(xùn)練輕量級模型 train Quick96.bat

這一步是訓(xùn)練模型,所有步驟中最重要,最難,也是最耗時間的部分。目前新版本中主要包含三類模型,分別是Quick96,SAEHD,AMP 。
我把Quick96翻譯為輕量級模型,優(yōu)點是所需配置低,顯存低,速度快,操作簡單。缺點是不能自定義,像素比較低,合成效果差一些。
這個模型很簡單,所以也非常適合拿來入門。所以本文就用這個來舉例。
Quick96使用非常簡單,雙擊批處理文件后,選擇執(zhí)行設(shè)備即可,這里一般都是選顯卡,直接回車即可。設(shè)備選擇完成之后,程序就會自動加載素材,并顯示模型的參數(shù),底部會有跳動的數(shù)字,然后會跳出一個預(yù)覽窗口。
先來說說底部的數(shù)字,總共五列,分別代表:模型保存時間,迭代次數(shù),單次迭代時間,源損失,目標(biāo)損失。迭代次數(shù)是越多越好,損失是越低越好,零就是無損了嘛~不過,不可能達到!
下面來說說預(yù)覽窗口

預(yù)覽窗口包含操作提示、loss曲線,人臉區(qū)域。人臉區(qū)域總共五列。第一列是src,第三列是dst。第二,四,五列為算法生成列,剛開始是純色,啥頭像都沒有。隨著訓(xùn)練的進行,會慢慢出現(xiàn)輪廓,鼻子,眼睛,然后慢慢變清晰。
訓(xùn)練的過程就是等待這幾列變清晰的過程,最后一列就是換臉后的效果。
這一個步驟并不會自動結(jié)束,需要自己判斷,然后手動結(jié)束。可以通過損失值和預(yù)覽圖來進行判斷。一般來說損失值(loss)值到了0.1x就差不多了。但是素材質(zhì)量和數(shù)量不一樣,會影響這個指標(biāo)的變化速度。比如素材特別少,這個值降的特別快,特別低。圖片不是很清晰,這個值也降的特別快,特別低。反過來,圖片質(zhì)量高,數(shù)量多,這個就很難降低。但是這樣情況下訓(xùn)練出來的模型更好。

相比數(shù)字而已,通過預(yù)覽圖來判斷就更加直觀了。只要觀察第二列是否無限接近第一列,第四列是否無限接近第三列。第五列的表情是否無限接近第四列。所有列的圖片是否都足夠清晰。如果答案是“Yes” ,那么按回車或者直接關(guān)閉窗口,進入下一步。

正常情況下模型會過幾十分鐘保存一次,也可以手動按S直接保存。關(guān)閉后,可以重新點擊批處理文件繼續(xù)訓(xùn)練,不用擔(dān)心丟失進度。當(dāng)然,要防止意外關(guān)機和重啟,可能會損壞模型。
6:應(yīng)用模型
雙擊批處理文件 應(yīng)用輕量級模型 merge Quick96.bat

這個步驟要做的是將圖片進行換臉。應(yīng)用Quick96模型也很簡單。啟動直接按回車選中或者輸入對應(yīng)的數(shù)字選中上一步已經(jīng)訓(xùn)練好的模型。然后軟件就會加載模型并顯示模型參數(shù)。
然后需要配置兩個參數(shù):
一個是是否啟用交互模式,直接回車,默認啟用。
一個是線程數(shù)量,輸入小于等于8的數(shù)字,回車。注意,如果你核心特別多,默認回車會報錯的!
稍等一會兒會彈出幫助界面。

這個界面并沒有任何功能上的用處,只是顯示了這個環(huán)節(jié)可以使用的快捷鍵。每個快捷鍵旁邊都有中文注釋,可以看個大概,具體的參數(shù)含義我會在后面的文章中做一個詳細的介紹。
點擊這個界面,確保輸入法為英文,按下鍵盤上的Tab,就可以進入合成預(yù)覽界面

進來后,默認情況下都會有人皮面具的感覺,這是正?,F(xiàn)象。因為我們參數(shù)還沒有調(diào)整!就這個素材來說,只要調(diào)整W/S,E/D 快捷鍵即可。調(diào)整后的效果如下:

黑色窗口會顯示所有的合成參數(shù),并且顯示進度條,等100%完成之后,手動關(guān)閉窗口即可。

此時,在data_dst下面已經(jīng)多了兩個文件,一個是merged,一個是merged_mask

進入merged可以看到很多圖,這些圖片中的人臉已經(jīng)完全換臉。

進入merged_mask可以看到一些黑色的圖片,中間有一個白色的區(qū)域。這些文件是為了方便后期制作。我們單純使用DFL的不用太關(guān)心。
7:合成視頻
雙擊批處理文件 合成 MP4 視頻 merged to mp4.bat

這個步驟是將已經(jīng)換好臉的圖片轉(zhuǎn)換成視頻,并且會自動讀取源視頻的配置信息,包括幀率,音軌這些。這個環(huán)節(jié)只有一個輸出碼率的參數(shù),常規(guī)來說3就夠了。
除了合成mp4之外,還可以合成無損視頻,AVI ,MOV等格式,便于后期處理。

執(zhí)行完成后,workspace下面多了兩個文件,分別是result.mp4 和 result_mask.mp4 。前者就是我們需要的最終視頻,后者是遮罩視頻,供后期使用。

雙擊打開視頻,就可以看到最終效果啦。
步驟其實不難,細節(jié)很多。有些是可以直接照搬別人經(jīng)驗的。有些需要自己不斷摸索。這并不是什么傻瓜軟件,要做出好的效果肯定是要花時間研究。就像即便送你PS,PR,你沒有一定的學(xué)習(xí)積累不可能做出酷炫的效果。但是我可以保證,市面上幾乎所有神乎其技的換臉視頻都是基于DFL,有些可能專門準(zhǔn)備了道具場景并使用了后期制作。