Tesla M40 24G 相關(guān)調(diào)試及應(yīng)用

?? Tesla M40擁有3072個CUDA核心,24GB 384bit GDDR5顯存,在AI等對大顯存顯卡需求日益增長的今天,Tesla M40又有了一定折騰的空間。但目前使用這類顯卡一般會遇到如下幾種問題:
由于Tesla系列計算卡一般沒有主動散熱,需要自己動手diy主動散熱。
目前一般有兩種散熱方案,
(1)使用部分品牌1080Ti的散熱模組,需要修整散熱器散熱鰭片,優(yōu)點在于風扇聲音較小,缺點是該方案需要較強的動手能力,也可以去某寶或者小黃魚找一些已經(jīng)改好了的,但一般價格偏高。

? (2)在側(cè)面安裝暴力扇,可以使用一些比較原始的方法粘在側(cè)面,但由于該卡是側(cè)面供電空間上可能會比較擠,也可以在小黃魚等商家購買3D打印的風扇罩,一般來說比較便宜二三十塊錢就可以搞定。優(yōu)點就是較為經(jīng)濟不用調(diào)整原有的被動散熱模組,缺點就是暴力扇噪音較大,且整卡的長度可能會到330-350mm,機箱空間可能會不夠。
2.硬件支持
(1)BIOS需要設(shè)置關(guān)閉CSM模式,需要打開Above 4G功能以提供支持,系統(tǒng)要求GPT分區(qū)表。
(2)由于Tesla系列計算卡沒有顯示接口,一般會使用獨顯或核顯雙顯卡混合使用,核顯+Tesla M40或者獨顯+Tesla M40,使用后者方案需要主板至少有2條PCIEx16槽,且應(yīng)注意部分主板的第二條PCIEx16槽會和主板上第二或者第三個M.2硬盤插槽共用走芯片組的PCIE通道。
(3)Tesla M40是側(cè)面8pin供電,和目前市面上電源的PCIE6+2pin有區(qū)別,需要一根雙6+2pin轉(zhuǎn)8pin的轉(zhuǎn)接線。

3.WDDM模式與TCC模式轉(zhuǎn)換
本人使用的是Geforce顯卡(3090Ti你就當他是亮機卡就好了)+Tesla顯卡的方案,先安裝3090Ti的驅(qū)動(本人使用的是最新的Geforce版驅(qū)動,要使用studio穩(wěn)定版本的,game ready可能不能識別),再安裝Tesla M40,開機后會發(fā)現(xiàn)在任務(wù)管理器中無法識別Tesla M40。
原因是Tesla M40默認為TCC模式(純計算模式),沒有圖形功能,查看顯卡目前的運行模式可以使用PowerShell命令 nvidia-smi ,如下圖所示:

可以看到圖中3090Ti運行在WDDM模式,Tesla M40運行在TCC模式。這是如果我們直接輸入nvidia-smi -dm 0 (切換所有顯卡到WDDM模式)會出現(xiàn)以下問題:

這時我們打開注冊表,找到如下注冊表:

如果不清楚上圖列表中000X具體代表的是哪一張顯卡,可以通過DriverDesc鍵值查看。這里我們修改DriverDesc鍵值為NVIDIA Tesla M40 24GB的000X:
需要修改的注冊表鍵值如下:
① AdapterType ? dword值?? 改為1
② FeatureScore ? dword值? cf改為d1(十六進制)
③ 新建 "GridLicensedFeatures"?? dword值?? 為 7

重新啟動電腦,再次打開nvidia-smi,再次輸入nvidia-smi -dm 0,可以看到兩張顯卡均被切換到WDDM模式。

打開任務(wù)管理器和GPU-Z查看效果。


4.Tesla M40的一些簡單應(yīng)用
(1)Tesla M40是具有解碼/編碼功能的,可以在OBS中調(diào)用這張卡進行編碼(雖然大材小用,但也不是不行)。

OBS中選擇的GPU編號和任務(wù)管理器中的GPU編號并不對應(yīng),可以自己多試一試。
(2)使用Tesla M40作為圖形首選項,Geforce卡僅作為圖形輸出
在完成上述 “3.WDDM模式與TCC模式轉(zhuǎn)換” 后,打開注冊表編輯器,找到下圖所示位置:

進行如下修改:
①在DriverDesc鍵值顯示為NVIDIA Tesla M40 24GB的000X中
刪除 AdapterType ? dword值
添加一個? EnableMsHybrid? dword值為1
②在DriverDesc鍵值顯示為NVIDIA GeForce xxxxx的000X中
添加一個? EnableMsHybrid? dword值為2
完成上述步驟后重新啟動電腦,在windows右鍵——顯示設(shè)置——圖形設(shè)置——圖形性能首選項中:選擇需要運行的游戲,如下圖所示:選擇高性能即可

打開游戲可以看到Tesla M40滿載,3090Ti(就當他是Geforce亮機卡)作為顯示輸出卡基本沒有負載。

(3)可以運用于本地部署的stable diffusion AI繪圖
有些環(huán)境下可以直接使用TCC模式的卡進行AI繪圖,有些環(huán)境下又只能使用WDDM模式的卡,比較玄學,與個人使用環(huán)境有關(guān),一般來說如果能直接在TCC模式下調(diào)用Tesla M40進行AI繪圖就可以忽略上述修改顯卡工作模式,直接在TCC模式下使用就行。以下是本人讓Tesla M40 工作在WDDM模式下進行AI繪畫:


上述參數(shù)下嘗試了一下,大概十秒左右一張圖,速度還算可以,運行過程中核心熱點穩(wěn)定在72度左右。
寫在最后
總體來說體驗還可以,目前該卡價格不改散熱模組的大概400-500左右,拿來玩一玩還是可以的,以上流程僅是在Geforce+Tesla這種組合下可以正常運行,不保證使用其他顯卡組合方式使用同方法也可以正常運行,由于本人沒有多余的Geforce卡,本人使用的3090Ti可以換成任意英偉達Geforce的顯卡,例如1030,但如果要使用Quadro+Tesla這種組合可能驅(qū)動選擇上會和本文有一定出入。