因?yàn)閜ytorch版本與cuda版本有一定的對應(yīng)要求,服務(wù)器上的cuda是不能自己隨便動的,所以需要在自己賬戶中安裝其他版本的cuda,而不能影響其他賬戶中已安裝的cuda。這里參考了多篇博文總結(jié)出以下要點(diǎn)。
1. nvcc和nvidia-smi顯示的版本不一致的問題
首先關(guān)注一個問題:自己賬戶中安裝了其他版本的cuda后,nvcc -V命令會顯示自己安裝的cuda版本,但nvidia-smi顯示的版本不會被更改,關(guān)于兩者cuda版本的關(guān)系,這里直接引用這篇博客:
?這里需要注意,按照上面的博客,自己安裝的cuda版本(nvcc -V中顯示的runtime api版本),是不能高于nvidia-smi中顯示的cuda driver api版本的。
2. 安裝cuda
從官網(wǎng)下載對應(yīng)版本的cuda,注意,理論上如果要求cuda版本為11.3,那么下載11.3.x版本的cuda都是可以的。以下以11.3.0為例。
?這里推薦下載runfile版本,與deb版本不同的是,runfile可以選擇是否安裝顯卡驅(qū)動,因?yàn)樯婕暗筋~外版本的cuda安裝,所以一般是已安裝過顯卡驅(qū)動的,所以不推薦以deb類型安裝。按照紅框內(nèi)的命令行下載和安裝。
如果第二行安裝命令報錯:“?Failed to verify gcc version. See log at /var/log/cuda-installer.log for details.”
只需在后面加“--override”即可:
sudo sh cuda_11.3.0_465.19.01_linux.run --override
如下具體的安裝過程參考這篇博文:
1. 存在驅(qū)動,是否刪除之前的驅(qū)動繼續(xù)下面的操作?
Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing. Abort
Continue
選擇 [Continue],回車
2. 是否接受協(xié)議
Do you accept the above EULA? (accept/decline/quit):?
accept
選擇 [accept],回車
3. 選擇安裝選項(xiàng)
CUDA Installer ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
?- [ ] Driver ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
? ? ? [ ] 450.51.05 ? ? ? ? ? ? ? ? ? ? ? ??
?+ [X] CUDA Toolkit 11.0 ? ? ? ? ? ? ? ? ? ??
? ?[X] CUDA Samples 11.0 ? ? ? ? ? ? ? ? ? ??
? ?[X] CUDA Demo Suite 11.0 ? ? ? ? ? ? ? ??
? ?[X] CUDA Documentation 11.0 ? ? ? ? ? ? ??
? ?Options ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
? ?Install
不選驅(qū)動(向上移動到“Driver”處,取消“X”),選擇 [Install],回車
4. 是否創(chuàng)建軟鏈接
A symlink already exists at /usr/local/cuda. Update to this installation?
Yes
No?
#首次安裝,選Yes,安裝額外的版本,選No
這里是指將“/usr/local/cuda”所指向的原版本,重新指向新安裝的cuda,由于其他賬戶很可能使用了這個默認(rèn)的軟鏈接,這里如果選yes,可能會導(dǎo)致該系統(tǒng)下的其他賬戶需要重新設(shè)置。而我們可以后續(xù)在自己賬戶里重新編輯cuda路徑,而不使用這個軟鏈接,因此這里選擇 [No],回車。
3. 安裝cudnn
cudnn版本需要和cuda版本對應(yīng),如11.3可以下載8.5、8.6或8.7,這里以8.5的Tar版本為例。
?下載后首先解壓:
$ tar -xvf cudnn-linux-x86_64-8.5.0.96_cuda11-archive.tar.xz
之后在解壓后的文件夾下打開終端,運(yùn)行以下命令:文章來源:http://www.zghlxwxcb.cn/news/detail-744492.html
sudo cp include/cudnn.h /usr/local/cuda-11.3/include
sudo cp lib/libcudnn* /usr/local/cuda-11.3/lib64
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn.h /usr/local/cuda-11.3/lib64/libcudnn*
安裝完成,可以刪除下載和解壓的cudnn文件了。運(yùn)行nvcc -V命令可以看一下是否安裝成功。文章來源地址http://www.zghlxwxcb.cn/news/detail-744492.html
到了這里,關(guān)于Linux Ubuntu安裝多個cuda版本的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!