Ubuntu NVIDIA驅(qū)動常見故障處理
2023-08-16 20:59 作者:Sunshine丨J | 我要投稿
一、Failed to initialize NVML: Driver/library version mismatch
現(xiàn)象:
原因:
這個問題出現(xiàn)的原因是 kernel mod 的 Nvidia?driver 的版本沒有更新,一般情況下,重啟機(jī)器就能夠解決,如果因為某些原因不能夠重啟的話,也有辦法 reload kernel mod。
解決方案:
1. 重新加載模塊
2. 重裝驅(qū)動
重新加載模塊無效,重啟無效,直接重裝驅(qū)動發(fā)現(xiàn)系統(tǒng)顯示驅(qū)動版本還是舊版
cat ?/proc/driver/nvidia/version
完全卸載驅(qū)動
二、ubuntu重啟后顯卡掛了:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
現(xiàn)象:
原因:
由于內(nèi)核版本與安裝驅(qū)動時的版本不匹配造成的。
解決方案:
三、RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment
現(xiàn)象:
解決方案:
重新安裝相同版本的顯卡驅(qū)動,如果還有該錯誤信息,執(zhí)行apt-get install nvidia-modprobe
https://blog.csdn.net/weixin_47156261/article/details/116717563
標(biāo)簽:NVIDIA