5倍性能提升!A100超強(qiáng)加速
一、環(huán)境配置
本次訓(xùn)練采用的是經(jīng)典的LeNet網(wǎng)絡(luò),實(shí)現(xiàn)手寫數(shù)字識(shí)別任務(wù),選取的兩個(gè)對照服務(wù)器均為煉丹俠A100服務(wù)器。
首先通過tabby連接煉丹俠A100云服務(wù)器,之后安裝對應(yīng)的環(huán)境,本次采用的環(huán)境為cuda11.7+python3.8+pytorch/torchaudio/torchvision(cuda11.7對應(yīng)版本),訓(xùn)練代碼在下方網(wǎng)址內(nèi):https://blog.csdn.net/eroDuanDian123456/article/details/125665521
二、訓(xùn)練優(yōu)化
原代碼只做了cpu上訓(xùn)練的部分,作為對照,在原代碼基礎(chǔ)上將網(wǎng)絡(luò)結(jié)果,數(shù)據(jù)等內(nèi)容全部移到了GPU上,使A100能充分應(yīng)用到代碼訓(xùn)練加速中,修改后的代碼如下
三、訓(xùn)練過程

四、運(yùn)行結(jié)果
CPU版本訓(xùn)練總共耗時(shí)152秒

煉丹俠A100加速版本訓(xùn)練總共耗時(shí)33秒
