導語:同一個鏡像在不同的顯卡驅動的機器上無法使用gpu 。報錯Error 803: system has unsupported display driver / cuda driver combination
查看2個鏡像對應的cuda driver
同鏡像tag ge2206300210 宿主機驅動465.27 鏡像cuda driver是465.27
同鏡像 tag ge2206300210宿主機驅動470.63 鏡像cuda driver是465.27
這里宿主機的driver掛進去自己修改了軟鏈。
令一個鏡像 tag only_cta220630宿主機驅動465.27 鏡像cuda driver是470.63
這里宿主機的cuda driver掛載進去了 但是并沒有替換鏡像里的driver。
令一個鏡像 tag only_cta220630宿主機驅動470.63 鏡像cuda driver是470.63
也是沒問題的。
打開宿主機上/etc/nvidia-container-runtime/config.toml中的debug開關,啟動容器,就會看到啟動日志(/var/log/nvidia-container-toolkit.log)
[nvidia-container-cli]
debug = "/var/log/nvidia-container-toolkit.log"
log-level = "debug"
測試
確實會mount宿主機上的相關cuda so包。這里已經把對應的libcuda.so.465.27做到鏡像里了 所以可能沒有對應的掛載日志
這里估計選擇了最新的
對于這條做了測試
鏡像中存在libcuda.so.465.27 和 libcuda.so.470.63.01時 nvidia-docker會將軟鏈指到libcuda.so.470.63.01
造成這個的原因我認為是低版本的driver不會覆蓋鏡像中高版本的driver導致,詳細可以參考如下圖片和鏈接。
參考文章來源:http://www.zghlxwxcb.cn/news/detail-698260.html
https://zhuanlan.zhihu.com/p/361545761文章來源地址http://www.zghlxwxcb.cn/news/detail-698260.html
到了這里,關于[問題已處理]-Error 803- system has unsupported display driver cuda driver combination的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!