深度學(xué)習(xí)環(huán)境搭建
搭建深度學(xué)習(xí)環(huán)境
材料準(zhǔn)備
????????安裝Anaconda環(huán)境包含了python
??安裝NVIDA顯卡驅(qū)動(dòng)
??安裝CUDA
??安裝CUDNN
??安裝TensorFlow
??安裝pytorch
? ? ? ? ?其他的以后補(bǔ)充
首先確定想要安裝的版本,CUDA與顯卡驅(qū)動(dòng)對應(yīng)的版本,TensorFlow-GPU與CUDA cudnn Python版本
先看顯卡參數(shù):
1.win+r輸入cmd打開命令行,輸入nvidia-smi,查看顯卡驅(qū)動(dòng)版本,在Linux系統(tǒng)中相同


2.打開顯卡控制面板點(diǎn)左下角的系統(tǒng)信息,在信息欄可以看到驅(qū)動(dòng)版本,在組件里可以看到支持的cuda版本


如果需要更新驅(qū)動(dòng)就到官網(wǎng)下載適合自己系統(tǒng)的驅(qū)動(dòng),在下面這個(gè)地址查看自己顯卡驅(qū)動(dòng)對應(yīng)的cuda版本
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

找到對應(yīng)的cuda版本和cuDNN版本,然后去下載
cuda版本:https://developer.nvidia.com/cuda-toolkit-archive
cuDNN版本:https://developer.nvidia.com/rdp/cudnn-archive


cuDNN的下載,最新版本需要注冊登錄,部分archive版本,右鍵復(fù)制鏈接,粘貼至迅雷即可下載。
下載anaconda
https://www.anaconda.com/download

pytorch需要使用命令安裝
https://pytorch.org/get-started/locally/

選擇穩(wěn)定版,我的環(huán)境是:cuda=11.4,cudnn=8.2,python=3.10
安裝anaconda
1、找到Anaconda*.sh安裝包,用?sh?命令執(zhí)行?.sh?文件,開始安裝

2、按回車觀看更多許可信息,按 Q 鍵跳過,是否接受許可條款, 輸入yes回車,按提示安裝。安裝完畢后需要重新打開終端terminal,就會(huì)看到base環(huán)境在啟動(dòng)時(shí)自動(dòng)激活。

若不想在啟動(dòng)時(shí)自動(dòng)激活base,使用指令? conda? config??--set? auto_activate_base? false
重新打開命令窗口就看不到base了,若想恢復(fù),使用?把上面的 false 改為 true
輸入 conda -V 和 conda list 分別能看到版本和安裝的包

輸入python,可以看到python版本和進(jìn)入python編輯環(huán)境

anaconda會(huì)自動(dòng)將環(huán)境變量添加到PATH里面,如果后面你發(fā)現(xiàn)輸出?conda?,提示沒有該命令,那么需要添加環(huán)境變量
使用? sudo? vi ~/.bashrc? 在最下面添加?export PATH=/home/用戶名/anaconda3/bin:$PATH
更新配置? source ~/.bashrc,若有就不必添加了

創(chuàng)建虛擬環(huán)境 指令:? conda? create? -n? new_env(環(huán)境名字)? python=3.10(包版本名) 創(chuàng)建名為new_env的python3.10的環(huán)境


激活虛擬環(huán)境:source activate new_env(虛擬環(huán)境名稱)
查看創(chuàng)建的虛擬環(huán)境:conda env list
進(jìn)入虛擬環(huán)境: conda activate new_env (環(huán)境名)
退出虛擬環(huán)境: conda deactivate
刪除虛擬環(huán)境:conda remove -n new_env?--all
安裝顯卡驅(qū)動(dòng)
安裝顯卡驅(qū)動(dòng)之前要禁用nouveau驅(qū)動(dòng):sudo vim /etc/modprobe.d/blacklist.conf? ?
在文本最后添加: blacklist? nouveau? 和 options? nouveau? modeset=0? ?
然后執(zhí)行:sudo? update-initramfs -u? ?
然后重啟后,執(zhí)行以下指令 lsmod? |? grep? nouveau
如果屏幕沒有輸出,說明禁用nouveau成

到官網(wǎng)下載適合自己的驅(qū)動(dòng)安裝。
安裝cuda
首先區(qū)分cuda的兩種API,運(yùn)行時(shí)API(runtime API )和 驅(qū)動(dòng)API(Driver API)
用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安裝的。? ?nvidia-smi就屬于這一類API。
用于支持runtime API的必要文件(如libcudart.so以及nvcc)時(shí)由CUDA Toolkit installer 安裝的
安裝指令:sudo sh?cuda_*_linux.run

需要運(yùn)行一會(huì),配置好的會(huì)很快,

提示GCC版本不匹配,重新安裝并忽略
點(diǎn)擊Versioned Online Documentation鏈接

點(diǎn)擊? Linux安裝指南


查看系統(tǒng)的GCC版本,不忽略就升級到所需版本

輸入accept同意

若有[X]Drive,將光標(biāo)移到[X]Driver處,按enter鍵,取消勾選安裝驅(qū)動(dòng),因?yàn)榍懊嬉呀?jīng)安裝過驅(qū)動(dòng)了。移動(dòng)光標(biāo)到? ”Install“ 按 Enter 進(jìn)行安裝。
安裝完成后,配置環(huán)境變量,使用 sudo vi ~/.bashrc 在最后面加上如下信息
export CUDA_HOME=/usr/local/cuda-11.4
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64 export PATH=${CUDA_HOME}/bin:${PATH}
更新配置使其生效? source? ~/.bashrc


卸載cuda
cd /usr/local/cuda-11.4/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-11.4
cuDNN安裝
下載與cuda對應(yīng)的cuDNN:?https://developer.nvidia.com/rdp/cudnn-archive

解壓壓縮包:?tar -zxvf??cudnn-11.4-linux-x64-v8.2.4.15.tgz

將cuDNN解壓后得到的CUDA目錄下的 lib64 和 include 兩個(gè)文件夾里內(nèi)容復(fù)制到cuda對應(yīng)的文件夾下
sudo? cp? lib64/*?? /usr/local/cuda-11.4/lib64/
sudo cp include/* /usr/local/cuda-11.4/include/
安裝完以后,使用:
?cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2? ?
查看cuDNN版本信息

安裝Pytorch? GPU版
使用下載頁給的鏈接下載,或者找到版本關(guān)系,去鏡像網(wǎng)站下載到本地
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

查看python版本 例如:python=3.10.9
https://pypi.org/project/torchvision/

安裝完成后檢查是否安裝成功:

安裝 TensorFlow
https://tensorflow.google.cn/install/pip?hl=zh-cn#system-install