基本是follow下面教程修復(fù)的
nvidia-smi報錯:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解決方案_打拳的土豆的博客-CSDN博客
1 背景分析:
可能是由于斷電重啟造成的
當(dāng)再次跑實(shí)驗(yàn)時,發(fā)現(xiàn)cuda不可用,于是輸入“nvidia-smi”才發(fā)現(xiàn)了一個錯誤,如下:
????? NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver
這是由于重啟機(jī)器,linux內(nèi)核升級導(dǎo)致的,由于linux內(nèi)核升級,之前的Nvidia驅(qū)動就不匹配連接了,但是此時Nvidia驅(qū)動還在,可以通過命令 nvcc -V 找到答案。、
2,安裝dkms:
sudo apt-get install dkms
3,查看本機(jī)連接不上的驅(qū)動版本:
ls -l /usr/src/
可以看到有一個nvidia的文件,我這里是 nvidia-470.94
4 使用dkms重新安裝適合驅(qū)動:
??? sudo dkms install -m nvidia -v 470.103.01
這條命令 -v 后面需要填寫本機(jī)的nvidia驅(qū)動版本,根據(jù)第3步得到
到了這里,如果安裝成功,此時輸入nvidia-smi就會成功連接了
?
?文章來源地址http://www.zghlxwxcb.cn/news/detail-486994.html文章來源:http://www.zghlxwxcb.cn/news/detail-486994.html
?
到了這里,關(guān)于nvidia-smi報錯(已解決):NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!