NVIDIA Tesla P40 跑Stable Diffuison和玩游戲快速避坑要點(diǎn)
先說(shuō)結(jié)論,不推薦折騰這張卡,不值當(dāng)
1. 硬件避坑
主板上凡是沒(méi)有above 4G decoding或者above 4G XXXX選項(xiàng)的,請(qǐng)直接放棄嘗試或者買(mǎi)新主板,就算是有的,太老的平臺(tái)也不一定支持。比如我嘗試過(guò)一張華碩的Z97-AR主板,雖然有這個(gè)選項(xiàng),但還是不支持,插上顯示代碼12錯(cuò)誤。此外Tesla P4和Tesla T4是另外兩張不同的卡,新手勿弄錯(cuò)。
推薦100系以上的主板,AMD主板那邊我很多年沒(méi)關(guān)注了,如果你用的是A板,那你看看BIOS有沒(méi)有上面的選項(xiàng),如果有,越新的,支持概率越大。此外有些處理器因?yàn)镻CIE通道和BIOS適配的問(wèn)題,也有可能不兼容。
跑stable diffusion推薦至少16GB及以上內(nèi)存,我嘗試過(guò)8G,結(jié)果啟動(dòng)的時(shí)候模型載入系統(tǒng)卡得難受,內(nèi)存不足。此外最好使用對(duì)稱(chēng)雙通道方案比如8+8或者4+4+4+4,8+8+8+8這樣的方案,不推薦8+4或者非對(duì)稱(chēng)雙通道方案,可能會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定,或者系統(tǒng)啟動(dòng)有時(shí)過(guò)不了內(nèi)存自檢。或者開(kāi)XMP容易產(chǎn)生故障。
散熱:如果是加裝彎道渦扇方案,那么整張卡出風(fēng)口到彎道尾的長(zhǎng)度有30cm左右,厚度有8cm,當(dāng)P40插在頂上第一個(gè)PCIEx16插槽上,那么那個(gè)凸出來(lái)的渦扇就會(huì)擋住第二個(gè)PCIEx16插槽的后面,使得如果你沒(méi)有核顯要裝一張亮機(jī)卡輸出的話(huà),那么長(zhǎng)度必須控制在16.5cm以?xún)?nèi),否則裝不下。如果是非彎道渦扇方案,而是尾部風(fēng)道加裝風(fēng)扇,那么整張卡會(huì)更長(zhǎng),達(dá)到35~40cm長(zhǎng)大概,這就更加考驗(yàn)?zāi)愕臋C(jī)箱是否能裝下了。只要不是X79/X99/299這樣的HEDT平臺(tái)的主板,第二個(gè)PCIEx16插槽的實(shí)際針腳通常都只有x8或者x4,所以為了保障P40帶寬吃滿(mǎn)基本上的操作都把它放在滿(mǎn)速的第一個(gè)PCIEx16插槽。
當(dāng)然你可以用改散熱的方案,比如也有把1080的渦輪散熱器挪到P40上面用,不過(guò)這也是要增加預(yù)算,要一兩百到幾百不等。
就我個(gè)人來(lái)說(shuō),買(mǎi)的那個(gè)單渦輪風(fēng)扇方案扛不住那個(gè)溫度,分分鐘上8/90度,所以又在機(jī)箱內(nèi)加了一個(gè)12cm的風(fēng)扇給那個(gè)渦扇送風(fēng),機(jī)箱外在出風(fēng)口粘了一個(gè)風(fēng)扇把P40產(chǎn)生的熱風(fēng)抽出去,這樣總算是把滿(mǎn)載溫度壓到5/60度了,不過(guò)這樣那個(gè)抽風(fēng)風(fēng)扇把機(jī)箱背后PCI擋板區(qū)域給擋住后,要接亮機(jī)卡的線(xiàn)還得需要90度的彎頭DP/HDMI延長(zhǎng)線(xiàn)。
2. 軟件安裝與設(shè)置
硬件的問(wèn)題都解決后,P40裝官方默認(rèn)驅(qū)動(dòng)是TCC模式(純計(jì)算用),裝好驅(qū)動(dòng)后在cmd窗口里可以用nvidia-smi指令查看到,而如果是想在任務(wù)管理器里看到,并且用來(lái)玩游戲,那就需要改WDDM模式,改WDDM模式的方法請(qǐng)參考https://blog.csdn.net/qq_45673245/article/details/128555342
M40似乎是可以在CMD下用上面的nvidia-smi -g {M40的id}?-dm?0這樣的指令輕松轉(zhuǎn)換TCC模式到WDDM模式,但是到P40這代就不行了,要么用皮衣黃的vGPU(收費(fèi)的,不過(guò)有90天試用時(shí)間),要么就改注冊(cè)表,像上面的辦法一樣。
上面csdn的方法是針對(duì)核顯而言的,如果是Quadro亮機(jī)卡 + Tesla P40的組合,若Quadro非常老,已經(jīng)停止支持了,但只要你的Quadro卡的驅(qū)動(dòng)最后一版出來(lái)的時(shí)間是在P40第一版驅(qū)動(dòng)發(fā)布之后,理論上Quadro卡的驅(qū)動(dòng)都會(huì)包含Tesla卡的驅(qū)動(dòng),所以只要裝好Quadro卡的驅(qū)動(dòng),那么P40同樣也會(huì)被打上驅(qū)動(dòng),且能在NVIDIA控制面板里面看到兩張卡和對(duì)其進(jìn)行配置。極端情況是亮機(jī)卡沒(méi)有驅(qū)動(dòng),只裝P40的驅(qū)動(dòng)那么設(shè)備管理器里面就會(huì)出現(xiàn)Microsoft基本顯示器和下面的P40,用微軟的基本顯示器輸出需要忍受屏幕閃爍圖形功能不全,分辨率異常等問(wèn)題。
Quadro卡和Tesla卡共存相對(duì)簡(jiǎn)單。就當(dāng)我以GTX/RTX卡和P40共存十分困難之時(shí),看某位UP主放的方法操作起來(lái)也挺簡(jiǎn)單的?還是改注冊(cè)表的方法,GTX/RTX卡和P40共存方法視頻鏈接請(qǐng)參考
https://www.bilibili.com/video/BV13W4y1s7so
原視頻是實(shí)況錄制,為了節(jié)省時(shí)間我把過(guò)程精簡(jiǎn)一下放下面:
2.1 確認(rèn)GTX/RTX卡的驅(qū)動(dòng)里是否包含Tesla的驅(qū)動(dòng)
下載驅(qū)動(dòng)后在運(yùn)行諸如527.56-xxx···xxx-whql.exe這樣的程序后,它會(huì)先讓你找個(gè)地方提取文件,提取好到運(yùn)行安裝程序讓你點(diǎn)安裝按鈕的期間,進(jìn)驅(qū)動(dòng)文件提取后存儲(chǔ)的目錄,找到\Display.Driver\nv_dispsig.inf 這個(gè)文件打開(kāi),然后在里面搜有沒(méi)有你的GTX/RTX卡和P40的型號(hào),如果有,那說(shuō)明這個(gè)驅(qū)動(dòng)是支持兩塊卡共存的。那么就可以放心大膽地裝GTX/RTX卡的驅(qū)動(dòng),裝好了之后,兩張卡都是能正常在設(shè)備管理器里看到的。
2.2 修改注冊(cè)表切換WDDM模式
這一步其實(shí)和前面CSDN里的那個(gè)內(nèi)容大體上相似。
打開(kāi)注冊(cè)表管理器,直接Windows搜索框里輸入regedit,找到計(jì)算機(jī)\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class\{4d36e968-e325-11ce-bfc1-08002be10318}
然后在下面的子文件夾諸如“0001”,“0002”等文件夾里找,在右側(cè)內(nèi)容窗口里找項(xiàng)的名稱(chēng)叫DriverDesc的然后值為NVIDIA Tesla P40的,找到了就在這里操作。
修改AdapterType,改為1
右鍵新建DWORD(32-位)(值),命名為GridLicensedFeatures,值改為?7
右鍵新建DWORD(32-位)(值),命名為EnableMsHybrid,值改為?1
然后參考上面同樣的方法找到亮機(jī)卡GTX/RTX的子文件夾,轉(zhuǎn)到這下面操作
右鍵新建DWORD(32-位)(值),命名為EnableMsHybrid,值改為?2
刷新注冊(cè)表(F5),然后重啟電腦,這個(gè)時(shí)候啟動(dòng)就可以看到P40在任務(wù)管理器里了,說(shuō)明其已經(jīng)切換到了WDDM模式。
上面的UP主是裝了GTX750的驅(qū)動(dòng)后發(fā)現(xiàn)P40沒(méi)有驅(qū)動(dòng)然后通過(guò)手動(dòng)查找驅(qū)動(dòng)目錄安裝的T4的驅(qū)動(dòng),再改的注冊(cè)表,我個(gè)人測(cè)試時(shí)用的是3060TI+P40的組合,沒(méi)有出現(xiàn)P40需要手動(dòng)安裝驅(qū)動(dòng)的這步,直接就裝上了,驅(qū)動(dòng)是531.41 NSD版本。
要指定程序的運(yùn)行在哪張卡上的話(huà),在Windows圖形設(shè)置里面把應(yīng)用程序的exe執(zhí)行文件添加進(jìn)去,然后選擇對(duì)應(yīng)的顯卡即可,比如下面的山谷跑分軟件我指定在P40上運(yùn)行:

3 后記&附言
其實(shí)P40這張卡真不咋地,除了那24G顯存外,真沒(méi)有什么讓人垂涎的地方,價(jià)格7/800多,改個(gè)散熱少則幾十,多則幾百,有的主板用核顯內(nèi)存延遲猛增,畫(huà)面走核顯輸出性能損失也比較明顯。沒(méi)有核顯的X79/99/299平臺(tái)還需要張亮機(jī)卡,同時(shí),由于帕斯卡架構(gòu)實(shí)屬有些老了,而這張P40對(duì)fp16支持=0,同時(shí)也沒(méi)有tensor core,玩DL/AI的效率著實(shí)有點(diǎn)低,我也測(cè)試過(guò)P40和3080的性能差距,3080的性能是P40的好幾倍,比如跑SD一張圖,同樣的參數(shù)設(shè)置,P40用了4/5分鐘,而3080用了4/50秒。剛需人士想要大顯存嫌3090/4090太貴的話(huà),其實(shí)2080Ti改22G這樣的折衷方案也勉強(qiáng)可以接受,前提是要找個(gè)好點(diǎn)的改方。
萬(wàn)一你這些都不聽(tīng),就饞它24G的顯存,平時(shí)你用SD老是內(nèi)存不足,或者是A卡的玩家,某天終于下定決心冒險(xiǎn)買(mǎi)回來(lái),結(jié)果發(fā)現(xiàn)主板不兼容,是忍痛再買(mǎi)一套板U套裝,還是把卡退了洗手?結(jié)果發(fā)現(xiàn)機(jī)箱太短,結(jié)果發(fā)現(xiàn)卡太熱,等等問(wèn)題層出不窮,若你的時(shí)間不值錢(qián),或者是僅僅出于興趣折騰,那么買(mǎi)來(lái)玩倒是無(wú)所謂,如果確實(shí)是預(yù)算捉襟見(jiàn)肘又想體驗(yàn)SD繪圖,以及有些需要大顯存場(chǎng)合的需求,那么折騰的方案如上所述,坑基本已經(jīng)被前面的人踩平,可以放心大但地買(mǎi),不過(guò)M40比P40更便宜些,而且驅(qū)動(dòng)模式切換更方便,性能相比P40是相對(duì)落后些,但是在圖靈和安培核心面前它們都是弟弟。
先寫(xiě)到這,有必要再更新。