1. 根據(jù) NVIDIA 顯卡型號,下載對應(yīng)的顯卡驅(qū)動
- 首先確定自己的顯卡型號
lspci | grep -i vga
可以看到顯卡型號是 GeForce RTX 2080
- 然后去NVIDIA 官網(wǎng)下載對應(yīng)的顯卡驅(qū)動
顯卡驅(qū)動下載地址
然后把下載好的驅(qū)動程序放到一個英文文件夾(否則進入非圖形化界面時可能中文亂碼),例如我這里新建了一個 driver
- 安裝所需依賴
sudo apt-get update
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
- 卸載原有 NVIDIA 驅(qū)動
sudo apt-get remove --purge nvidia*
- 禁用 nouveau (nouveau 是通用的驅(qū)動程序)
sudo gedit /etc/modprobe.d/blacklist.conf
在 blacklist.conf 末尾添加以下兩行,保存后關(guān)閉文本
blacklist nouveau
options nouveau modeset=0
在終端輸入如下更新,更新結(jié)束后重啟電腦(必須)
sudo update-initramfs -u
重啟后輸入如下指令,如無輸出則已關(guān)閉 nouveau
lsmod | grep nouveau
- 關(guān)閉 Secure Boot
重新啟動按 F2 進入自己電腦的 BIOS 設(shè)置
關(guān)閉Secure Boot,并且清除安全啟動密鑰,保存后退出重啟
- 安裝過程需要在非圖形化界面中進行,輸入以下命令進入非圖形化界面
#進入文本界面
sudo telinit 3
# 如果需要回到圖形化界面,則用這條指令
sudo telinit 5
- 輸入用戶名、密碼
- 關(guān)閉顯示服務(wù)
sudo service gdm3 stop
- 為驅(qū)動程序賦予權(quán)限,然后運行安裝
cd /home/yao/driver/NVIDIA-Linux-x86_64-535.113.01.run
sudo chmod 777 NVIDIA-Linux-x86_64-535.113.01.run
# 安裝:–no-opengl-files 只安裝驅(qū)動文件,不安裝OpenGL文件
sudo ./NVIDIA-Linux-x86_64-535.113.01.run --no-opengl-files
安裝過程中有一些選項
- 選擇 continue installation
- Install Nvidia’s 32-bit compatibility libraries? 選擇 No
- Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 選擇 No
- Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 選擇 No 如果選 yes 可能會有問題
- 安裝完成后重新開啟顯示服務(wù)
sudo service gdm3 start
- 驅(qū)動安裝完成后,檢查一下
nvidia-smi
可以看到顯卡驅(qū)動版本是 535.113.01
支持的 CUDA 最高版本是 12.2
- 調(diào)出 NVIDIA 設(shè)置界面,說明沒問題了
nvidia-settings
2. 根據(jù)顯卡驅(qū)動,下載對應(yīng)的 CUDA
- CUDA 是由 NVIDIA 開發(fā)的并行計算平臺和應(yīng)用程序編程接口(API)
CUDA 是一個底層的平臺,它提供了對 GPU 的直接訪問和控制。開發(fā)者可以使用 CUDA 編寫 GPU 核函數(shù),并在主機端(CPU)上調(diào)用這些核函數(shù),實現(xiàn)并行計算。CUDA 提高了一套 API 來管理 GPU 的內(nèi)存、線程調(diào)度和數(shù)據(jù)傳輸?shù)炔僮?,使開發(fā)者能夠更方便地利用 GPU 的并行計算能力。
- CUDA 需要和你上面安裝的
顯卡驅(qū)動
對應(yīng)起來
顯卡驅(qū)動和CUDA的適配關(guān)系
我裝的顯卡驅(qū)動:NVIDIA-Linux-x86_64-535.113.01.run
支持的 CUDA 最高版本為 12.2
不過我這里準(zhǔn)備裝 CUDA 11.7
,因為看網(wǎng)上基本上都裝的這個版本
- 安裝 CUDA
CUDA 下載
選擇自己的操作系統(tǒng)、芯片架構(gòu)、Linux發(fā)行版本、安裝方式
官網(wǎng)提供了安裝指令
我這里用的是 deb(local) 方式安裝?。?!注意:千萬別用這種方式安裝?。?!我這里留著是為了避坑?。?!
如果這樣裝了之后,重啟之后拓展屏就識別不到了,我猜它是把我之前裝的顯卡驅(qū)動給卸載了
我后面是按上面的方式重新裝了顯卡驅(qū)動才解決的!?。?/p>
我這里是新建了一個 CUDA 文件夾,在這個目錄下運行這些指令
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
最后一步會報錯,因為這種方法安裝會自動安裝顯卡驅(qū)動,和我們之前裝的顯卡驅(qū)動不是同一個版本??!
我們?nèi)绻麑︼@卡版本有要求的話,建議不用這種方式安裝
現(xiàn)在換成 runfile(loacl) 安裝方式,就不會報錯
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
sudo sh cuda_11.7.0_515.43.04_linux.run
選擇 Continue
輸入 accept
選擇需要安裝的內(nèi)容([X]代表安裝,[ ]代表不安裝)
按下 空格鍵
取消安裝驅(qū)動,因為之前裝過了
然后選擇 install
這樣就說明安裝成功了
- 配置環(huán)境變量
sudo gedit ~/.bashrc
將 CUDA 的環(huán)境變量加到最后
export PATH=/usr/local/cuda-11.7/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存并關(guān)閉文件
重新加載當(dāng)前用戶的 bash 配置文件 ~/.bashrc
查看 CUDA 編譯器(nvcc)的版本信息
source ~/.bashrc
nvcc -V
3. 根據(jù) CUDA版本,下載對應(yīng)的 cuDNN 庫
- cuDNN 是 NVIDIA 專門為深度學(xué)習(xí)任務(wù)開發(fā)的加速庫
cuDNN 提供了一系列高性能的深度學(xué)習(xí)基本操作的實現(xiàn),如卷積、池化、歸一化等。cuDNN 是基于 CUDA 的,它利用了 CUDA 提供的并行計算能力和相關(guān)的 API。通過使用 cuDNN,開發(fā)者可以更輕松地構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型,并且在 GPU 上獲得更好的性能。cuDNN 已經(jīng)成為深度學(xué)習(xí)領(lǐng)域廣泛使用的庫,許多深度學(xué)習(xí)框架(如 TensorFlow、PyTorch)都集成了對 cuDNN 的支持,以獲得更高的計算性能。
- cuDNN 需要和上面安裝的 CUDA 版本對應(yīng)起來
cuDNN 只是一個即插即用的庫,不需要擔(dān)心不小心裝錯,因為只是將庫文件放置再cuda目錄下而已
如果版本裝錯,只需要刪除再安裝新的版本即可
CUDA 11.7 對應(yīng)的 cuDNN 版本就比較多了,我這里安裝的是 cuDNN 8.6.0
- 安裝 cuDNN
官網(wǎng)下載需要注冊賬號
cuDNN 下載
解壓 cuDNN 文件
tar -xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz
將以下文件復(fù)制到 CUDA 目錄(/usr/local/cuda/
文件夾下面的 include
和 lib64
)
cd /home/yao/cuDNN
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
驗證是否安裝成功文章來源:http://www.zghlxwxcb.cn/news/detail-764371.html
sudo cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
這樣就說明裝好了
裝 cuDNN 本質(zhì)上很簡單,就是把你下載的這些 include
和 lib
中的文件移動到 CUDA 對應(yīng)的目錄下文章來源地址http://www.zghlxwxcb.cn/news/detail-764371.html
到了這里,關(guān)于二十、Ubuntu22.04 + RTX2080 配置顯卡驅(qū)動 + CUDA + cuDNN的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!