明明跑了一段時間?跑過一次完整的?怎么就出現(xiàn)這個報錯呢?代碼也未改動?而這就是現(xiàn)實!文章來源地址http://www.zghlxwxcb.cn/news/detail-609525.html
顯存不足?
- 觀察顯卡使用情況,多人共用同一服務(wù)器,項目各自運行,會搶占顯存,進(jìn)而報錯!
- 多個項目運行,占用增加,導(dǎo)致內(nèi)存用完報錯,還是很真實的!
- 文件是否設(shè)置了CUDA_VISIBLE_DEVICES?
- 只有一張卡的話,CUDA_VISIBLE_DEVICES對應(yīng)編號為0。
- 如果多張顯卡的話,不妨換張卡跑!Linux-ubuntu系統(tǒng)查看顯卡型號、顯卡信息詳解、顯卡天梯圖
windows10怎么查看gpu顯卡使用情況 - 位置參考:CUDA_VISIBLE_DEVICES設(shè)置要在模型加載到GPU上之前!
import os
os.environ['CUDA_VISIBLE_DEVICES'] = "2"
import torch
Pytorch版本?
- 未見明顯改善。
- cudatoolkit降級到10.1版可能可以解決這個問題。嘗試使用cudatoolkit 10.1重新安裝pytorch。
conda install pytorch torchvision cudatoolkit=10.1
編程設(shè)置?
# True:每次返回的卷積算法將是確定的,即默認(rèn)算法。
torch.backends.cudnn.deterministic = True
# 程序在開始時花額外時間,為整個網(wǎng)絡(luò)的每個卷積層搜索最適合它的卷積實現(xiàn)算法
# 實現(xiàn)網(wǎng)絡(luò)的加速。
torch.backends.cudnn.benchmark = True
- torch.backends.cudnn.benchmark = True
- torch.backends.cudnn.benchmark = False
- 建議優(yōu)先嘗試!True or False
文章來源:http://www.zghlxwxcb.cn/news/detail-609525.html
到了這里,關(guān)于【Pytorch報錯】RuntimeError:cuDNN error:CUDNN_STATUS_INTERNAL_ERROR 高效理解記錄及解決!的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!