騰訊云國際站GPU 云服務(wù)器是基于 GPU 的快速、穩(wěn)定、彈性的計算服務(wù),主要應(yīng)用于深度學(xué)習(xí)訓(xùn)練/推理、圖形圖像處理以及科學(xué)計算等場景。 GPU 云服務(wù)器提供和標準騰訊云國際 CVM 云服務(wù)器一致的方便快捷的管理方式。
GPU 云服務(wù)器通過其強大的快速處理海量數(shù)據(jù)的計算性能,有效解放用戶的計算壓力,提升業(yè)務(wù)處理效率與競爭力。騰訊云國際站提供全面廣泛的服務(wù)內(nèi)容。無-需-綁-定PayPal,代-充-值騰訊云國際站、阿里云國際站、AWS亞馬遜云、GCP谷歌云,官方授權(quán)經(jīng)銷商!靠譜!T-G 飛機 @unirech_dingding
下面主要以以 CentOS 操作系統(tǒng)為例,介紹騰訊云國際GPU云服務(wù)器如何安裝 Tesla Driver。
操作場景
騰訊云國際站GPU 云服務(wù)器正常工作需提前安裝正確的基礎(chǔ)設(shè)施軟件,對 NVIDIA 系列 GPU 而言,有以下兩個層次的軟件包需要安裝:
- 驅(qū)動 GPU 工作的硬件驅(qū)動程序。
- 上層應(yīng)用程序所需要的庫。
操作步驟
Linux 驅(qū)動安裝
Linux 驅(qū)動安裝采用 Shell 腳本安裝方式,適用于任何 Linux 發(fā)行版,包括 CentOS,Ubuntu 等。
NVIDIA Telsa GPU 的 Linux 驅(qū)動在安裝過程中需要編譯 kernel module,系統(tǒng)需提前安裝 gcc 和編譯 Linux Kernel Module 所依賴的包,例如 kernel-devel-$(uname -r)
等。
1.執(zhí)行以下命令,檢查當前系統(tǒng)中是否已安裝 dkms。
rpm -qa | grep -i dkms
返回結(jié)果如下圖,則表示已安裝 dkms。
如未安裝 dkms,則執(zhí)行以下命令進行安裝。
sudo yum install -y dkms
2.登錄 NVIDIA 驅(qū)動下載 或訪問 http://www.nvidia.com/Download/Find.aspx
。
3.選擇操作系統(tǒng)和安裝包,并單擊【SEARCH】搜尋驅(qū)動,選擇要下載的驅(qū)動版本。本文以 V100 為例,如下圖所示:
注意: 操作系統(tǒng)(Operating System)選擇 Linux 64-bit 即表示下載 shell
安裝文件。如果選擇具體的發(fā)行版,則下載的文件是對應(yīng)的包安裝文件。
4.選擇特定的版本進入下載頁面,單擊【DOWNLOAD】。如下圖所示:
5.如有填寫個人信息的頁面可選擇直接跳過,當出現(xiàn)以下頁面時,右鍵單擊【AGREE&DOWNLOAD】并選擇菜單中的【復(fù)制鏈接地址】。如下圖所示:
6.參考 使用標準方式登錄 Linux 實例(推薦),登錄 GPU 實例。您也可以根據(jù)實際操作習(xí)慣,選擇其他不同的登錄方式:
- 使用遠程登錄軟件登錄 Linux 實例
- 使用 SSH 登錄 Linux 實例
7.使用 wget
命令, 粘貼 步驟5 中已獲取的鏈接地址,下載安裝包。如下圖所示:
或者您可在本地系統(tǒng)下載 NVIDIA 安裝包,再上傳到 GPU 實例的服務(wù)器。
8.執(zhí)行以下命令,對安裝包添加執(zhí)行權(quán)限。 例如,對文件名為 NVIDIA-Linux-x86_64-418.126.02.run
添加執(zhí)行權(quán)限。
chmod +x NVIDIA-Linux-x86_64-418.126.02.run
9.依次執(zhí)行以下命令,檢查當前系統(tǒng)中是否已安裝 gcc 和 kernel-devel 包。
rpm -qa | grep kernel-devel
rpm -qa | grep gcc
返回結(jié)果如下,則表示已安裝 gcc 和 kernel-devel。
如未安裝,則請執(zhí)行以下命令進行安裝。
sudo yum install -y gcc kernel-devel
注意: 如升級了 kernel 版本,則需要將 kernel-devel 升級至與 kernel 相同的版本。
10.執(zhí)行以下命令,運行驅(qū)動安裝程序,并按提示進行后續(xù)操作。
sudo sh NVIDIA-Linux-x86_64-418.126.02.run
11.安裝完成后,執(zhí)行以下命令進行驗證。
nvidia-smi
如返回信息類似下圖中的 GPU 信息,則說明驅(qū)動安裝成功。
Windows 驅(qū)動安裝
-
參考 使用 RDP 文件登錄 Windows 實例(推薦),登錄 GPU 實例。
-
訪問 NVIDIA 驅(qū)動下載 官網(wǎng)。
-
選擇操作系統(tǒng)和安裝包,并選擇對應(yīng)驅(qū)動程序。本文以 V100 為例,如下圖所示:
-
打開下載驅(qū)動程序所在的文件夾,雙擊安裝文件開始安裝,按照界面上的提示安裝驅(qū)動程序并根據(jù)需要重啟實例。
安裝完成后,如需驗證 GPU 是否正常工作,請查看設(shè)備管理器。文章來源:http://www.zghlxwxcb.cn/news/detail-685145.html
安裝失敗原因
Linux 系統(tǒng)驅(qū)動安裝失敗表現(xiàn)為 nvidia-smi 無法工作,通常原因如下:文章來源地址http://www.zghlxwxcb.cn/news/detail-685145.html
- 系統(tǒng)缺乏編譯 kernel module 所需要的包,如 gcc,kernel-devel-xxx 等,導(dǎo)致無法編譯,最終安裝失敗。
- 系統(tǒng)里面存在多個版本的 kernel,由于 DKMS 的不正確配置,導(dǎo)致驅(qū)動編譯為非當前版本 kernel 的 kernelmodule,導(dǎo)致 kernel module 安裝失敗。
- 安裝驅(qū)動后,升級了 kernel 版本導(dǎo)致原來的安裝失效。
到了這里,關(guān)于騰訊云國際代充-GPU服務(wù)器安裝驅(qū)動教程NVIDIA Tesla的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!