1.確認(rèn)GPU型號(hào)和操作系統(tǒng)版本,本示例中以A100以及操作系統(tǒng)為Centos 7.9進(jìn)行操作。
準(zhǔn)備GPU驅(qū)動(dòng)和CUDA 11.2軟件包,在nvidia官網(wǎng)進(jìn)行驅(qū)動(dòng)包和CUDA包下載
鏈接: link
linux系統(tǒng)均選擇 Linux 64-bit
CUDA Toolkit選擇最新版本
如您需要老版本CUDA,請(qǐng)前往老版本CUDA下載
本示例中使用CUDA 11.2。
訪問nvidia官網(wǎng),下載CUDA,cuda的鏈接為:https://developer.nvidia.com/cuda-downloads
選擇runfile文件來安裝。
2.檢查服務(wù)器GPU識(shí)別情況
3.安裝GPU驅(qū)動(dòng)之前需要在操作系統(tǒng)下查看GPU卡是否能夠完全識(shí)別,如不能識(shí)別需要進(jìn)行重新插拔、對(duì)調(diào)測(cè)試等步驟進(jìn)行硬件排查。
查看到所有的GPU
lspci | grep -i nvidia
4.老版本軟件包卸載(可選)
GPU驅(qū)動(dòng)卸載
/usr/bin/nvidia-uninstall
CUDA卸載方法:
/usr/local/cuda/bin/cuda-uninstaller
6.禁用系統(tǒng)自帶的nouveau模塊
檢查nouveau模塊是否加載,已加載則先禁用
lsmod | grep nouveau
7.安裝gcc、g++編譯器
cuda安裝samples測(cè)試程序進(jìn)行make時(shí)需要g++,但安裝cuda軟件包時(shí)不需要。
yum -y install gcc gcc-c++ kernel-devel make
8.禁用系統(tǒng)自帶的nouveau模塊
檢查nouveau模塊是否加載,已加載則先禁用
lsmod | grep nouveau
9.沒有blacklist-nouveau.conf文件則創(chuàng)建
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
執(zhí)行如下命令使內(nèi)核生效(需要重啟服務(wù)器后才可真正禁用nouveau)
dracut -force
10.重啟操作系統(tǒng)
reboot
11.重啟系統(tǒng),然后檢查禁用nouveau模塊配置與文本模式是否生效。
lsmod | grep nouveau
12.修改系統(tǒng)運(yùn)行級(jí)別為文本模式 GPU驅(qū)動(dòng)安裝必須在文本模式下進(jìn)行
systemctl set-default multi-user.target
GPU驅(qū)動(dòng)安裝
root用戶下進(jìn)行GPU驅(qū)動(dòng)
chmod +x NVIDIA-Linux-x86_64-450.80.02.run
./NVIDIA-Linux-x86_64-450.80.02.run --no-opengl-files --ui=none --no-questions --accept-license
配置GPU驅(qū)動(dòng)內(nèi)存常駐模式
nvidia-persistenced
設(shè)置開機(jī)自啟動(dòng)
vim /etc/rc.d/rc.local
在文件中添加一行
nvidia-persistenced
賦予/etc/rc.d/rc.local文件可執(zhí)行權(quán)限
chmod +x /etc/rc.d/rc.local
若無/etc/rc.d/rc.local,也可修改
vim /etc/rc.local
chmod +x /etc/rc.local
安裝完GPU驅(qū)動(dòng)后查看GPU狀態(tài)查看及相關(guān)配置。
nvidia-smi
重啟圖形化界面
sudo service lightdm restart
CUDA安裝
安裝CUDA
安裝CUDA時(shí)需注意,如果已經(jīng)安裝過GPU驅(qū)動(dòng),安裝CUDA時(shí)就不要再選擇GPU驅(qū)動(dòng)安裝了。
chmod +x cuda_11.1.1_455.32.00_linux.run
sh cuda_11.1.1_455.32.00_linux.run --no-opengl-libs
新版本CUDA安裝界面: 注意Driver選項(xiàng),表示是否安裝GPU驅(qū)動(dòng),如果已經(jīng)安裝了GPU驅(qū)動(dòng),這里不要再勾選。
配置環(huán)境變量
添加到/etc/profile文件中,對(duì)所有用戶生效
vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile
測(cè)試cuda安裝是否正確,環(huán)境變量是否識(shí)別成功
nvcc -V
參考鏈接
鏈接: link文章來源:http://www.zghlxwxcb.cn/news/detail-550249.html
Docker - 解決could not select device driver…gpu問題(安裝nvidia-container-runtime)
鏈接: [link]https://www.hangge.com/blog/cache/detail_3184.html)
鏈接: link文章來源地址http://www.zghlxwxcb.cn/news/detail-550249.html
到了這里,關(guān)于linux(centos7)離線安裝A100顯卡驅(qū)動(dòng)cuda/cudnn 以及解決docker not select device driver...gpu的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!