国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法

這篇具有很好參考價值的文章主要介紹了docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法

賀志國
2023.4.11

今天在Docker內(nèi)部編譯程序,發(fā)現(xiàn)與CUDA相關的代碼居然沒有編譯,于是在Docker內(nèi)部執(zhí)行Nvidia顯卡驅(qū)動檢測命令nvidia-smi,執(zhí)行完畢后,無任何輸出,也沒有任何報錯信息,但在Docker外部執(zhí)行該命令,結(jié)果如下圖所示,沒有任何異常:
docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法
最開始我以為是Docker啟動有問題,于是連續(xù)重啟兩次,仍然是nvidia-smi命令無任何輸出。仔細觀察啟動Docker的提示,說是Docker內(nèi)部的Nvidia顯卡驅(qū)動異常,未能啟用Nvidia顯卡,于是按照Nvidia官方網(wǎng)站https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker的方法重新安裝NVIDIA Container Toolkit。安裝命令羅列如下(我也是在官網(wǎng)抄過來的):

# 重新安裝Docker
curl https://get.docker.com | sh   && sudo systemctl --now enable docker

# 設置安裝包和GPG key的倉庫地址
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
            sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
            sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 更新安裝源
sudo apt-get update

# 安裝nvidia-container-toolkit
sudo apt-get install -y nvidia-container-toolkit

# 配置Docker以便正確識別NVIDIA的容器運行時庫
sudo nvidia-ctk runtime configure --runtime=docker

# 重啟Docker
sudo systemctl restart docker

本以為萬事大吉,結(jié)果非常不幸,執(zhí)行第一步curl https://get.docker.com | sh && sudo systemctl --now enable docker就出現(xiàn)如下錯誤:

E: Conflicting values set for option Signed-By regarding source https://nvidia.github.io/libnvidia-container/stable/ubuntu18.04/amd64/ /: /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg !=
E: The list of sources could not be read.

官方網(wǎng)站https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/troubleshooting.html提到的第一個難點解疑就是針對該問題的,具體辦法就是執(zhí)行如下兩行命令,找到重復的安裝源并刪除之:

grep -l "nvidia.github.io" /etc/apt/sources.list.d/* | grep -vE "/nvidia-container-toolkit.list\$"

sudo rm /etc/apt/sources.list.d/nvidia-docker.list 

接下來再依次執(zhí)行上述命令,就可修復Docker內(nèi)部的Nvidia工具箱,操作截圖如下所示:
docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法
docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法
docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法
進入Docker,執(zhí)行命令nvidia-smi,就可以看到正確的Nvidia顯卡信息了:
docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法文章來源地址http://www.zghlxwxcb.cn/news/detail-466524.html

到了這里,關于docker內(nèi)部執(zhí)行nvidia-smi無任何顯示的解決方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 沒有NVIDIA控制面板,在cmd中使用nvidia-smi命令不顯示CUDA Version的解決方案

    沒有NVIDIA控制面板,在cmd中使用nvidia-smi命令不顯示CUDA Version的解決方案

    Environment_set 沒有NVIDIA控制面板,在cmd中使用nvidia-smi命令不顯示CUDA Version 先在控制面板中查看是否被隱藏了,查看方式選擇:小圖標 這里若沒有NVIDIA控制面板,而NVIDIA驅(qū)動已安裝,則可能是缺少組件:NVIDIA control panel,可以單獨下載,推薦更新NVIDIA驅(qū)動,直接安裝適合本電腦

    2024年02月06日
    瀏覽(25)
  • 解決 Ubuntu 重啟后輸入 nvidia-smi 顯示 no devices were found 的問題

    解決 Ubuntu 重啟后輸入 nvidia-smi 顯示 no devices were found 的問題

    根據(jù)下面的鏈接,使用 ubuntu-drivers devices 和 sudo ubuntu-drivers install 安裝推薦的版本后 Ubuntu 卸載重裝 Nvidia 顯卡驅(qū)動-CSDN博客 第一次重啟電腦是可以使用顯卡驅(qū)動的,但是之后每次再重啟后再輸入 nvidia-smi,就會顯示:no devices were found 最初一周我一直都懶得搜到底是為什么會出

    2024年01月23日
    瀏覽(25)
  • nvcc --version和nvidia-smi顯示的CUDA Version不一致

    nvcc --version和nvidia-smi顯示的CUDA Version不一致

    CUDA有兩種API,一個是驅(qū)動API(Driver Version),依賴NVIDIA驅(qū)動,由nvidia-smi查看,另一個是運行API(Runtime Version)是軟件運行所需要的,一般驅(qū)動API版本=運行API版本即可。 驅(qū)動API的依賴文件由GPU driver installer安裝,nvidia-smi屬于這一類API; 運行API的依賴文件由CUDA Toolkit installer安

    2024年02月10日
    瀏覽(24)
  • 阿里云服務器執(zhí)行nvidia-smi命令后提示【No devices were found】

    阿里云服務器執(zhí)行nvidia-smi命令后提示【No devices were found】

    服務器有一段時間沒用了,今天想拿來跑模型,結(jié)果我查詢顯卡的時候居然提示“No devices were found”,也不算是報錯吧,但是起碼是不對的,這個意思就是找不到設備資源了。 這個著實就很奇怪,我并沒有做過任何事情就很莫名其妙。 首先查看下顯卡是否還在,如下: 結(jié)果

    2024年02月11日
    瀏覽(114)
  • ubuntu20.04裝顯卡驅(qū)動nvidia-smi顯示成功的血淚史

    ubuntu20.04裝顯卡驅(qū)動nvidia-smi顯示成功的血淚史

    注意這只是我個人在安裝驅(qū)動過程中踩過的坑,不要直接照著我的方法裝 在csnd上看了許多教程,最終選擇直接命令行輸入 ubuntu-drivers devices 可以看到推薦的版本是525 于是執(zhí)行sudo apt install nvidia-driver-525(好像這一步執(zhí)行完后沒有報錯) 打開軟件更新看到 ?然后我就根據(jù)網(wǎng)上

    2023年04月15日
    瀏覽(24)
  • nvidia-smi報錯(已解決):NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因分析

    nvidia-smi報錯(已解決):NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因分析

    基本是follow下面教程修復的 nvidia-smi報錯:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解決方案_打拳的土豆的博客-CSDN博客 1 背景分析: 可能是由于斷電重啟造成的 當再次跑實驗時,發(fā)現(xiàn)cuda不可用,于是輸入“nvidia-smi”才發(fā)現(xiàn)了一個錯誤,如下:

    2024年02月09日
    瀏覽(48)
  • Ubuntu下nvidia-smi失敗,使用dkms解決

    nvidia-smi顯示無法與驅(qū)動通訊 一般來說是因為機器重啟linux內(nèi)核自動更新導致,可以嘗試回退內(nèi)核版本,或者使用dkms安裝該內(nèi)核下驅(qū)動配套的包,這里主要介紹使用dkms如何處理 查看已安裝的nvidia驅(qū)動版本 顯示 說明我電腦上nvidia驅(qū)動的版本是nvidia-525.116.04 安裝dkms和相關包 安

    2024年02月13日
    瀏覽(20)
  • ubuntu服務器關機重新開機之后nvidia-smi不顯示但nvcc -C沒問題

    ubuntu服務器關機重新開機之后nvidia-smi不顯示但nvcc -C沒問題

    安裝stable diffusion webui過程中發(fā)現(xiàn)的問題。 出現(xiàn)報錯: AssertionError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check 然后來看nvidia-smi 的時候發(fā)現(xiàn)驅(qū)動掛了 1. nvcc -V,查看cuda是可以看到的 說明之前至少安裝cuda的時候沒掛,應該是服務器啟動的

    2024年02月12日
    瀏覽(23)
  • 【已解決】nvidia-smi報錯:NVIDIA-SMI has failed because it couldn’t communicate with the ... 阿里云GPU服務器

    如題,起因是在阿里云GPU服務器上,使用原先正常運行的鏡像生成了容器,但容器的顯卡驅(qū)動出問題了,使用nvidia-smi命令會報錯 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. 嘗試使用官網(wǎng).run文件重新安裝顯卡驅(qū)動會報錯ERROR: Unable to load the kernel module ‘nvidia

    2024年02月11日
    瀏覽(23)
  • 解決ubuntu cuda版本nvcc -V和nvidia-smi不一致問題

    解決ubuntu cuda版本nvcc -V和nvidia-smi不一致問題

    在使用nvcc -V和nvidia-smi查看cuda版本時不一致: nvcc -V版本是10.1 nvidia-smi的版本是12.2 上面如果能顯示版本,所以是已經(jīng)有驅(qū)動,首先要刪除之前的驅(qū)動: 此時執(zhí)行nvidia-smi,會提示Command \\\'nvidia-smi\\\' not found,按照提示安裝即可: 安裝成功后,再次執(zhí)行nvidia-smi,成功,顯示cuda版本

    2024年02月15日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包