AutoDL租用顯卡訓(xùn)練embeddings模型(教程)

AutoDL官網(wǎng):?www.autodl.com/home
我的注冊(cè)邀請(qǐng)鏈接:
https://www.autodl.com/register?code=1737273a-6bb4-43f5-808c-5bd368630a14
鏡像原作者(小李xiaolxl)教程:
www.bilibili.com/video/BV1Av4y1m7Th/
embeddings模型訓(xùn)練方法, 參考我之前發(fā)的專欄(和本地訓(xùn)練沒(méi)有任何區(qū)別):
www.bilibili.com/read/cv20049885

(1)網(wǎng)頁(yè)信息:
官網(wǎng)鏈接, 進(jìn)入官網(wǎng)后, 自行摸索完成注冊(cè)

2.常用三個(gè)選項(xiàng)(算力市場(chǎng), 幫助文檔, 控制臺(tái)):

算力市場(chǎng)可以看到不同分區(qū)現(xiàn)在的可用機(jī)組數(shù)量, 價(jià)格, 型號(hào), 配置等信息

幫助文檔可以看到顯卡算力等信息

控制臺(tái)可以看到你租用的實(shí)例等信息


(2).如何創(chuàng)建新實(shí)例:
點(diǎn)擊我的實(shí)例:

2.點(diǎn)擊租用新實(shí)例:

3.選擇你想要的實(shí)例, 我一般用的是蕪湖的A5000, 內(nèi)蒙古區(qū)比蕪湖更便宜, 但是有些時(shí)候會(huì)出現(xiàn)無(wú)法拉取鏡像的問(wèn)題, 看自己取舍.

4. 像這樣選擇好你想要的機(jī)組

5. 拉取鏡像, 點(diǎn)擊算法鏡像, 在下方的輸入框里寫入nov, 選擇第二個(gè)鏡像.

6. 點(diǎn)擊完成創(chuàng)建

7.等待鏡像拉取完成


(3)如何開(kāi)機(jī)并使用實(shí)例:
1.實(shí)例開(kāi)機(jī)后,點(diǎn)擊jupyter

2. 運(yùn)行1 和 4 代碼塊即可, 2學(xué)術(shù)加速看情況開(kāi), 一般我不會(huì)去打開(kāi)他, 因?yàn)榻?jīng)常有反效果.


3. 設(shè)置運(yùn)行目錄為數(shù)據(jù)盤

4. 等待依賴包安裝

5.顯示端口的時(shí)候, 表示已成功啟動(dòng)

6.回到控制臺(tái)目錄, 選擇自定義服務(wù)

7.成功進(jìn)入webui界面


(3). 訓(xùn)練相關(guān)文件結(jié)構(gòu)(! ! ! 在jupyter內(nèi)操作 ! ! !?):
如果你是按照我前面的方法啟動(dòng)的, 那文件目錄位置會(huì)是根目錄下的autodl-tmp內(nèi)

2.我習(xí)慣上會(huì)在autodl-tmp文件夾內(nèi)新建兩個(gè)文件夾:?img_Pretreatment(預(yù)處理后圖像),?img_raw_data(未處理原始圖像)

3.在訓(xùn)練集文件夾內(nèi)根據(jù)角色名再創(chuàng)建一個(gè)文件夾, 要來(lái)放置圖片


(4).圖像預(yù)處理
回到webui頁(yè)面的預(yù)處理界面, 這里因?yàn)槲覄倓倓?chuàng)建的文件夾和框架是同一父目錄下的不同文件夾, 所以引用的時(shí)候是../
../意為上級(jí)目錄
./意為同級(jí)目錄
原始數(shù)據(jù)地址為../img_raw_data/角色名
預(yù)處理后存儲(chǔ)位置為../img_Pretreatment/角色名

2. 關(guān)于訓(xùn)練速度與成本:
因?yàn)楝F(xiàn)在改去租A5000實(shí)例了,顯存24G可以把數(shù)據(jù)集的分辨率造高一點(diǎn),試了三個(gè)分辨率渲染速度。
768*768速度為1.32it/s,折算過(guò)來(lái)大概4750步一小時(shí)?
704*704速度為1.78it/s,折算過(guò)來(lái)就是6400步一小時(shí)?
640*640速度為2.31it/s,折算過(guò)來(lái)就是8300步一小時(shí)?
我的訓(xùn)練平均步數(shù)是65000步,就是768^2是13.7小時(shí),704^2是10.2小時(shí),640^2是7.8小時(shí)。?
實(shí)例價(jià)格是1.3—1.4元一小時(shí)(此為蕪湖區(qū)價(jià)格, 內(nèi)蒙古區(qū)為1.1-1.2元一小時(shí)),按1.3算 就是
768^2素材一次訓(xùn)練花費(fèi)17.8元?
704^2素材一次訓(xùn)練花費(fèi)13.26元?
640^2素材一次訓(xùn)練花費(fèi)10.14元?
實(shí)際上算上預(yù)處理之類的時(shí)間會(huì)更長(zhǎng)
大概就三檔:20,15,12
3.需要注意, 這個(gè)webui的setting下載VAE是有問(wèn)題的, 需要手動(dòng)到
models/Stable-diffusion 目錄下的 model.vae.pt 文件改名為1model.vae.pt? ?(!?!?!?在jupyter內(nèi)操作?!?!?!?)
單純?cè)趕ettings里設(shè)置為無(wú)vae重啟內(nèi)核仍不生效
改完名字后, 再選擇重啟內(nèi)核, 然后按照之前啟動(dòng)框架的方法重新打開(kāi)就完成VAE卸載, 可以開(kāi)始訓(xùn)練.


4.具體訓(xùn)練方法, 參考我之前發(fā)的專欄(和本地訓(xùn)練沒(méi)有任何區(qū)別):
www.bilibili.com/read/cv20049885

(5).其他問(wèn)題
1. 遇到這種報(bào)錯(cuò): 試試關(guān)閉學(xué)術(shù)加速或打開(kāi)學(xué)術(shù)加速
