整體流程概述
TensorFlow 與 CUDA Toolkit
TensorFlow 是一個(gè)基于數(shù)據(jù)流圖的深度學(xué)習(xí)框架
- TensorFlow是一個(gè)基于數(shù)據(jù)流圖的深度學(xué)習(xí)框架,它使用張量(Tensor)作為數(shù)據(jù)的基本單位,在GPU上進(jìn)行張量運(yùn)算可以極大地提高深度學(xué)習(xí)模型的訓(xùn)練和推理速度。而CUDA則提供了在GPU上執(zhí)行高性能并行計(jì)算所需的API和運(yùn)行時(shí)環(huán)境,能夠?qū)崿F(xiàn)深度學(xué)習(xí)任務(wù)的加速。
CUDA 充分利用 NIVIDIA GPU 的計(jì)算能力
- 安裝 TensorFlow 之前需要首先安裝 CUDA,準(zhǔn)確的說是 CUDA Toolkit。是因?yàn)?TensorFlow 使用 CUDA 作為其后端計(jì)算引擎。CUDA 是由 NVIDIA 提供的并行計(jì)算平臺(tái)和編程模型,可以充分利用 NVIDIA GPU 的計(jì)算能力,實(shí)現(xiàn)高性能的并行計(jì)算。
CUDA Toolkit
- 即 TensorFlow 默認(rèn)會(huì)安裝與系統(tǒng)和 GPU 兼容的版本,這需要依賴 CUDA Toolkit。CUDA Toolkit 包含 GPU 驅(qū)動(dòng)程序、CUDA Runtime 庫和相關(guān)工具,使 TensorFlow 能夠與 NVIDIA GPU 進(jìn)行交互并利用其計(jì)算能力。
cuDNN
-
在安裝 TensorFlow 之前需要安裝 cuDNN(CUDA Deep Neural Network library),是因?yàn)?TensorFlow 使用 cuDNN 來加速深度神經(jīng)網(wǎng)絡(luò)的計(jì)算。cuDNN 是由 NVIDIA 開發(fā)的用于深度學(xué)習(xí)的 GPU 加速庫,它針對(duì)深度神經(jīng)網(wǎng)絡(luò)的計(jì)算任務(wù)進(jìn)行了高度優(yōu)化,可以顯著加快訓(xùn)練和推理過程。
-
TensorFlow 通過調(diào)用 cuDNN 的 API 來利用 GPU 上的硬件加速功能,特別是在卷積操作等深度學(xué)習(xí)任務(wù)中,cuDNN 能夠提供很大的性能提升。在沒有 cuDNN 的情況下,TensorFlow 會(huì)使用 CPU 來執(zhí)行這些計(jì)算任務(wù),但是由于 CPU 的計(jì)算速度相對(duì)較慢,處理大規(guī)模的深度學(xué)習(xí)模型時(shí)可能會(huì)非常耗時(shí)。
安裝詳細(xì)流程
整理流程一:安裝 CUDA Toolkit
步驟一:獲取CUDA版本信息
桌面 > 右鍵 >
NVIDIA控制面板
> 查看系統(tǒng)信息
> 點(diǎn)擊組件
> 查看NVCUDA64.DLL
的 CUDA版本 > 成功獲取CUDA版本信息;
步驟二:下載安裝 CUDA Toolkit
訪問 CUDA Toolkit Archive https://developer.nvidia.com/cuda-toolkit-archive 下載對(duì)應(yīng)版本的
CUDA Toolkit
,根據(jù)步驟一中的 CUDA 版本信息(例如我的CUDA版本為12.0.134
),選擇下載 Toolkit 版本:
并開始下載,耐心等待10分鐘;
步驟三:按照默認(rèn)步驟安裝
按照向?qū)нM(jìn)行安裝即可;
步驟四:檢查CUDA安裝成功
安裝完成后,你可以在命令提示符或 PowerShell 中輸入以下命令來驗(yàn)證 CUDA 是否成功安裝:
nvcc -V
或者同:
nvcc --version
如果安裝成功,將會(huì)輸出 CUDA 的版本號(hào)。下面我們進(jìn)行安裝 cuDNN;
整體流程二:安裝cuDNN
步驟一:下載 cuDNN
-
訪問 cuDNN 下載網(wǎng)址:https://developer.nvidia.com/rdp/cudnn-download;
-
出現(xiàn)下圖界面說明你需要首先登陸你的 NIVIDIA 賬戶;
- 出現(xiàn)如下界面,需要根據(jù)本機(jī)的 CUDA 版本選擇安裝,如何獲取本機(jī)的 CUDA 版本?如下:
獲取CUDA版本信息:
桌面 > 右鍵 >NVIDIA控制面板
> 查看系統(tǒng)信息
> 點(diǎn)擊組件
> 查看NVCUDA64.DLL
的 CUDA版本 > 成功獲取CUDA版本信息,即12.x
- 根據(jù)上述獲得的 CUDA 版本信息,選擇下載
12.x
版本的cuDNN;
步驟二:解壓縮下載的 zip,并將其中的文件復(fù)制到 CUDA Toolkit 的相應(yīng)目錄
- 解壓縮后應(yīng)該包含三個(gè)文件夾和一個(gè)文件:
bin
、include
、lib
、LICENSE
- 將三個(gè)文件夾中的文件分別復(fù)制到各自的 CUDA Toolkit 目錄中
-
首先打開
bin
文件夾:
復(fù)制全部文件,粘貼到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\bin 文件夾中; -
然后打開
include
文件夾:
同樣復(fù)制全部文件,粘貼到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include 文件夾中; -
最后打開
lib\x64
文件夾:
將全部文件粘貼到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\lib\x64 文件夾中;
-
步驟三:配置環(huán)境變量
- 確保將 CUDA 和 cuDNN 的安裝路徑添加到系統(tǒng)的環(huán)境變量中,這樣 TensorFlow 才能正確地找到這些庫和頭文件;
- cuDNN 中不會(huì)默認(rèn)配置環(huán)境變量,需要讀者手動(dòng)配置環(huán)境變量:
- 首先打開 環(huán)境變量 path 欄目:
- 將解壓縮后的 cuDNN 文件夾的
\bin
絕對(duì)地址復(fù)制粘貼:
C:\Users\xhong\Downloads\cudnn-windows-x86_64-8.9.3.28_cuda12-archive\cudnn-windows-x86_64-8.9.3.28_cuda12-archive\bin
完成!
cuDNN的完成檢查需要等待下一步 tensorflow-gpu
安裝完成后;
整體流程三:安裝 TensorFlow-gpu
- 在安裝完 cuDNN 后,再安裝 TensorFlow 時(shí),TensorFlow 將能夠識(shí)別到你的 cuDNN 并自動(dòng)與之集成,從而在 GPU 上運(yùn)行深度學(xué)習(xí)任務(wù)時(shí)獲得顯著的加速效果??傊?,安裝cuDNN是為了充分發(fā)揮GPU的計(jì)算能力,提高TensorFlow的性能和效率,特別是在處理復(fù)雜的深度學(xué)習(xí)模型時(shí),cuDNN的優(yōu)化可以為你節(jié)省大量時(shí)間。
步驟一:Anaconda中創(chuàng)建新的環(huán)境
-
建議在
Anaconda Prompt
中創(chuàng)建一個(gè)新的環(huán)境,因?yàn)槲业?base
環(huán)境已經(jīng)安裝好了gpu
版本的torch
,而且如果都放在一個(gè)環(huán)境中更新環(huán)境會(huì)比較耗時(shí); -
創(chuàng)建環(huán)境
tensorflow
conda create -n tensorflow pip python=3.8
-
激活環(huán)境
tensorflow
activate tensorflow
步驟二:查看下載 tensorflow-gpu 的版本號(hào)
https://www.tensorflow.org/install/source_windows?hl=zh-cn
網(wǎng)址最下方有一個(gè)表格,列有 GPU 的 CUDA、cuDNN 對(duì)照的安裝的 tensorflow-gpu 版本號(hào)
-
很明顯,根據(jù)我的 cuDNN(8.9.3.28) 與 CUDA(12.0.134) 版本的短板效應(yīng),我穩(wěn)妥選擇
tensorflow_gpu-2.4.0
版本,建議讀者到這里也這么選擇,穩(wěn)定能用就是了; -
輸入命令:
pip install --ignore-installed --upgrade tensorflow_gpu==2.4.0 # 注意將2.4.0替換為你的版本號(hào)
等待安裝完成!
步驟三:檢查整體流程安裝成功
-
打開 Pycharm,記得將環(huán)境從 base 切換到剛剛創(chuàng)建配置的 tensorflow:
import tensorflow as tf # 檢查是否有可用的 GPU 設(shè)備 if tf.config.list_physical_devices('GPU'): print('GPU可用') else: print("GPU不可用")
-
出現(xiàn)上圖所示 True,即完成安裝步驟,若出現(xiàn)
curand64_10.dll is not found
等標(biāo)識(shí),即說明下載安裝相關(guān) CUDA Toolkit 版本出現(xiàn)意外錯(cuò)誤,解決辦法為通過將文件中已含有的curand64_11.dll
文件重命名可解決問題,如下圖所示: -
bin文件目錄地址為:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\bin
-
安裝 CUDA 后,再安裝 TensorFlow 時(shí),TensorFlow 將會(huì)自動(dòng)與 CUDA 進(jìn)行集成,并在 GPU 上利用 CUDA 的功能來加速深度學(xué)習(xí)任務(wù)。這樣,TensorFlow 能夠更高效地執(zhí)行張量計(jì)算,從而顯著提高模型訓(xùn)練和推理的速度。文章來源:http://www.zghlxwxcb.cn/news/detail-641020.html
步驟四:檢查 cuDNN 安裝成功可用
import tensorflow as tf
# 檢查TensorFlow-gpu是否可用
print("TensorFlow-gpu available:", tf.test.is_gpu_available())
# 檢查cuDNN是否可用
print("cuDNN version:", tf.config.list_physical_devices('GPU'))
完結(jié)撒花!?。?!~~~~文章來源地址http://www.zghlxwxcb.cn/news/detail-641020.html
到了這里,關(guān)于【TensorFlow】P0 Windows GPU 安裝 TensorFlow、CUDA Toolkit、cuDNN的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!