最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

DeepFaceLab下載教程-2023年最新版本

2023-01-15 22:18 作者:井月螢秋  | 我要投稿

今天來給大家講解2023年最新版本DeepFaceLab新手入門教程。

新手小白一文看懂!總共7個操作步驟,請大家耐心看完!

本文僅為教程使用,如果有其他問題可以自行到官網(wǎng)查看。

安裝軟件

官網(wǎng)下載地址:www.kx401.com

這里給大家提供DeepFaceLab三種軟件包,都是集成好的綠色免安裝

具體內(nèi)容包含:

1.DeepFaceLab官方英文原版

2.DeepFaceLab中文漢化版

3.DeepFaceLab圖形界面漢化版

PS:對于新手可以直接使用中文漢化版和圖形界面漢化版!特別是圖形界面漢化版和正常使用軟件差不多

不過建議不管下載那種版本都看完本文,入門之后再挑選自己喜歡的版本!

----

官方英文版對于大部分國人不太友好,本篇主要講解dfl中文漢化版的使用教程:

首先通過網(wǎng)盤下載:DeepFaceLab中文漢化版

解壓打開看漢化版的會看到這個目錄:

不輸入就是上面這種結(jié)果。然后你點1,2,3,4每個步驟都點不動。因為不看英文或者大意,犯這個錯誤的也不少。

正確的打開方式是這樣的。里面會有_internal和workplace文件夾。前者放的是源代碼和軟件相關(guān)的內(nèi)容,后者是工作目錄,上一篇有講過。除此之外還有一堆.bat結(jié)尾的文件。可以把這些稱為腳本或者批處理文件。里面是一行行的DOS命令。

批處理文件打開方式和EXE一模一樣,Double kill ~~Double click ?雙擊打開!每一個批處理文件都干一件事情,我們要做的就是按一定的順序點擊這些文件,就能完成換臉。是不是挺簡單?

執(zhí)行步驟

DFL換臉的思路是,想將視頻轉(zhuǎn)換成圖,從圖片中提取人臉,從人臉中學(xué)習(xí)特征。然后應(yīng)用模型,先對圖片進行換臉,然后把圖片合成視頻,同時帶上原視頻的音軌。

具體來說可以分為如下幾步:

  • 源視頻轉(zhuǎn)圖片

  • 目標(biāo)視頻轉(zhuǎn)圖片

  • 提取源頭像

  • 提取目標(biāo)頭像

  • 訓(xùn)練模型

  • 應(yīng)用模型

  • 合成視頻

批處理文件步驟如下:

  • 源視頻轉(zhuǎn)圖片 extract images from video data_src.bat

  • 目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat

  • 提取源頭像 data_src faceset extract.bat

  • 目標(biāo)頭像提取 data_dst faceset extract.bat

  • 訓(xùn)練輕量級模型 train Quick96.bat/SAE/AMP

  • 應(yīng)用輕量級模型 merge Quick96.bat /SAE/AMP

  • 合成 MP4 視頻 merged to mp4.bat

雜七雜八交代清楚了就可以開始操作,本文會將每一個步驟截圖說明。但是為了控制文章的體型,以操作為主。一些常見錯誤或者參數(shù)詳解,會在后續(xù)文章中完成。關(guān)于操作,這里做一個重點提示:遇事不決按回車!

1:源視頻轉(zhuǎn)圖片

跳出黑色窗口,輸入10回車,然后輸入jpg回車,就會自動開始將視頻分解為圖片。

FPS:視頻有一個指標(biāo)叫幀率,常見有24,30,60等,代表一秒鐘有幾張。第一個參數(shù)輸入10指的是一秒鐘只取10張;不輸入直接回車,默認幀率是30就取30張。因為很多影視劇畫面相對固定,沒必要全部取,否則后面會浪費大量提取時間,而且模型訓(xùn)練壓力也會加大。

Format: ?圖片格式,主要是jpg和png。png是無損格式,但是JPG能在保證畫質(zhì)的情況下減少巨量的空間。所以如果不是要求特別變態(tài),一般都用jpg。這樣可以減少空間,節(jié)省時間

正常情況下,這個步驟執(zhí)行非???,出現(xiàn)“搞定/done” 的字樣就是執(zhí)行完成了。完成后,workplace/data_src下面就會出現(xiàn)很多圖片,這就是從視頻里分解出來的圖片。文件名一般為0000x.jpg,其實這里面命名可以隨意,沒有強制要求。這里還有一個aligned的文件夾,是為后面步驟準(zhǔn)備的。

2:目標(biāo)視頻轉(zhuǎn)圖片

雙擊批處理文件目標(biāo)視頻轉(zhuǎn)圖片 extract images from video data_dst FULL FPS.bat

和上面的步驟類似,這次處理的是dst視頻。因為dst必須一幀不落,所以沒有FPS選項,只有圖片格式這一個選項。

處理完后的圖片保存在workspace/data_dst里面。

3:提取源頭像

雙擊批處理文件提取源頭像 data_src faceset extract.bat

這一步的作用是提取源素材圖片中的人臉。這里有六個參數(shù),一般只需一路回車即可。第一次使用需要緩存GPU內(nèi)核,需要稍微等一等。開始提取后底部有顯示進度,當(dāng)進度到100%,會顯示圖片數(shù)量和提取到的人臉數(shù)量,并出現(xiàn)“搞定?。。 ?就證明已經(jīng)出來成功并且處理完成。

處理完成后,頭像保存在data_src/aligned下面。

不少人在這個環(huán)節(jié)會遇到問題。

常見問題是:

  • 驅(qū)動不夠新,去官網(wǎng)下載更新到最新版本即可。

  • 軟件不夠新,deepfaker.xyz 上獲取新版

  • 顯卡軟件不匹配, A卡用Directx12,不要用rtx3000版。

提取完之后,如果src素材比較復(fù)雜,就需要做一些篩選。這個篩選可以寫一篇很長的文章。這里簡要說一下。主要是把一些不需要的素材刪除:

  • 很模糊的可以直接刪除

  • 不是目標(biāo)人物的可以直接刪除

  • 圖片殘缺的刪除

  • 臉部有遮擋的刪除

  • 臉部光照差異特別大的刪除

  • …..

4:提取目標(biāo)頭像

雙擊批處理文件目標(biāo)頭像提取 data_dst faceset extract.bat

這一步的作用是提取目標(biāo)素材圖片中的人臉。和上一步非常類似,這里就是少了一個“保存調(diào)試圖片”的參數(shù)。其實也不是少了,而是默認就執(zhí)行了。

提取的頭像保存在data_dst/aligned的文件夾里。

提取完之后也要對素材進行一個篩選。

把不是目標(biāo)人物的素材刪掉,把頭像旋轉(zhuǎn)的圖片刪掉。一般來說文件名后綴_1的都可以刪掉。dst的刪除核心原則是要換的人臉留下,不要換的統(tǒng)統(tǒng)刪掉。

這些圖標(biāo)保存在aligned_debug里面

大概其中一張圖片,可以看到人臉上有三種顏色的線框。

紅色就是頭像截取的區(qū)域,藍色是面部區(qū)域,綠色是人臉輪廓,以及五官定位的點。其實就是人臉的landmark。通過debug你可以直觀的看到人臉識別算法識別了哪些區(qū)域,有沒有識別正確。

5:訓(xùn)練模型

雙擊批處理文件 訓(xùn)練輕量級模型 train Quick96.bat

這一步是訓(xùn)練模型,所有步驟中最重要,最難,也是最耗時間的部分。目前新版本中主要包含三類模型,分別是Quick96,SAEHD,AMP 。

我把Quick96翻譯為輕量級模型,優(yōu)點是所需配置低,顯存低,速度快,操作簡單。缺點是不能自定義,像素比較低,合成效果差一些。

這個模型很簡單,所以也非常適合拿來入門。所以本文就用這個來舉例。

Quick96使用非常簡單,雙擊批處理文件后,選擇執(zhí)行設(shè)備即可,這里一般都是選顯卡,直接回車即可。設(shè)備選擇完成之后,程序就會自動加載素材,并顯示模型的參數(shù),底部會有跳動的數(shù)字,然后會跳出一個預(yù)覽窗口。

先來說說底部的數(shù)字,總共五列,分別代表:模型保存時間,迭代次數(shù),單次迭代時間,源損失,目標(biāo)損失。迭代次數(shù)是越多越好,損失是越低越好,零就是無損了嘛~不過,不可能達到!

下面來說說預(yù)覽窗口

預(yù)覽窗口包含操作提示、loss曲線,人臉區(qū)域。人臉區(qū)域總共五列。第一列是src,第三列是dst。第二,四,五列為算法生成列,剛開始是純色,啥頭像都沒有。隨著訓(xùn)練的進行,會慢慢出現(xiàn)輪廓,鼻子,眼睛,然后慢慢變清晰。

訓(xùn)練的過程就是等待這幾列變清晰的過程,最后一列就是換臉后的效果。

這一個步驟并不會自動結(jié)束,需要自己判斷,然后手動結(jié)束。可以通過損失值和預(yù)覽圖來進行判斷。一般來說損失值(loss)值到了0.1x就差不多了。但是素材質(zhì)量和數(shù)量不一樣,會影響這個指標(biāo)的變化速度。比如素材特別少,這個值降的特別快,特別低。圖片不是很清晰,這個值也降的特別快,特別低。反過來,圖片質(zhì)量高,數(shù)量多,這個就很難降低。但是這樣情況下訓(xùn)練出來的模型更好。

相比數(shù)字而已,通過預(yù)覽圖來判斷就更加直觀了。只要觀察第二列是否無限接近第一列,第四列是否無限接近第三列。第五列的表情是否無限接近第四列。所有列的圖片是否都足夠清晰。如果答案是“Yes” ,那么按回車或者直接關(guān)閉窗口,進入下一步。

正常情況下模型會過幾十分鐘保存一次,也可以手動按S直接保存。關(guān)閉后,可以重新點擊批處理文件繼續(xù)訓(xùn)練,不用擔(dān)心丟失進度。當(dāng)然,要防止意外關(guān)機和重啟,可能會損壞模型。

6:應(yīng)用模型

雙擊批處理文件 應(yīng)用輕量級模型 merge Quick96.bat

這個步驟要做的是將圖片進行換臉。應(yīng)用Quick96模型也很簡單。啟動直接按回車選中或者輸入對應(yīng)的數(shù)字選中上一步已經(jīng)訓(xùn)練好的模型。然后軟件就會加載模型并顯示模型參數(shù)。

然后需要配置兩個參數(shù):

一個是是否啟用交互模式,直接回車,默認啟用。

一個是線程數(shù)量,輸入小于等于8的數(shù)字,回車。注意,如果你核心特別多,默認回車會報錯的!

稍等一會兒會彈出幫助界面。

這個界面并沒有任何功能上的用處,只是顯示了這個環(huán)節(jié)可以使用的快捷鍵。每個快捷鍵旁邊都有中文注釋,可以看個大概,具體的參數(shù)含義我會在后面的文章中做一個詳細的介紹。

點擊這個界面,確保輸入法為英文,按下鍵盤上的Tab,就可以進入合成預(yù)覽界面

進來后,默認情況下都會有人皮面具的感覺,這是正?,F(xiàn)象。因為我們參數(shù)還沒有調(diào)整!就這個素材來說,只要調(diào)整W/S,E/D 快捷鍵即可。調(diào)整后的效果如下:

黑色窗口會顯示所有的合成參數(shù),并且顯示進度條,等100%完成之后,手動關(guān)閉窗口即可。

此時,在data_dst下面已經(jīng)多了兩個文件,一個是merged,一個是merged_mask

進入merged可以看到很多圖,這些圖片中的人臉已經(jīng)完全換臉。

進入merged_mask可以看到一些黑色的圖片,中間有一個白色的區(qū)域。這些文件是為了方便后期制作。我們單純使用DFL的不用太關(guān)心。

7:合成視頻

雙擊批處理文件 合成 MP4 視頻 merged to mp4.bat

這個步驟是將已經(jīng)換好臉的圖片轉(zhuǎn)換成視頻,并且會自動讀取源視頻的配置信息,包括幀率,音軌這些。這個環(huán)節(jié)只有一個輸出碼率的參數(shù),常規(guī)來說3就夠了。

除了合成mp4之外,還可以合成無損視頻,AVI ,MOV等格式,便于后期處理。

執(zhí)行完成后,workspace下面多了兩個文件,分別是result.mp4 和 result_mask.mp4 。前者就是我們需要的最終視頻,后者是遮罩視頻,供后期使用。

雙擊打開視頻,就可以看到最終效果啦。

步驟其實不難,細節(jié)很多。有些是可以直接照搬別人經(jīng)驗的。有些需要自己不斷摸索。這并不是什么傻瓜軟件,要做出好的效果肯定是要花時間研究。就像即便送你PS,PR,你沒有一定的學(xué)習(xí)積累不可能做出酷炫的效果。但是我可以保證,市面上幾乎所有神乎其技的換臉視頻都是基于DFL,有些可能專門準(zhǔn)備了道具場景并使用了后期制作。

DeepFaceLab下載教程-2023年最新版本的評論 (共 條)

分享到微博請遵守國家法律
库尔勒市| 嘉荫县| 丰台区| 文成县| 绿春县| 洪洞县| 蓬溪县| 天门市| 鹤山市| 和田市| 建昌县| 巴南区| 吉木萨尔县| 泸定县| 克拉玛依市| 南江县| 雷山县| 南木林县| 塔城市| 枣强县| 调兵山市| 台南县| 江华| 道真| 卓尼县| 新晃| 高青县| 奎屯市| 西乌珠穆沁旗| 融水| 淮南市| 东源县| 武胜县| 宜良县| 汾西县| 株洲市| 霍林郭勒市| 莎车县| 博兴县| 剑阁县| 岳普湖县|