国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

深度學(xué)習(xí)筆記--解決GPU顯存使用量不斷增加的問題

2年前作者：布吉島呀~分類：Toy博客閱讀(18)違法舉報

這篇具有很好參考價值的文章主要介紹了深度學(xué)習(xí)筆記--解決GPU顯存使用量不斷增加的問題。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

目錄

1--問題描述

2--問題解決

3--代碼

1--問題描述

??????? 基于 Pytorch 使用 VGG16 預(yù)訓(xùn)練模型進(jìn)行分類預(yù)測時，出現(xiàn) GPU 顯存使用量不斷增加，最終出現(xiàn) cuda out of memory 的問題；

??????? 出現(xiàn)上述問題的原因在于：輸入數(shù)據(jù)到網(wǎng)絡(luò)模型進(jìn)行推理時，會默認(rèn)構(gòu)建計(jì)算圖，便于后續(xù)反向傳播進(jìn)行梯度計(jì)算。而構(gòu)建完整的計(jì)算圖，會增加計(jì)算和累積內(nèi)存消耗，從而導(dǎo)致 GPU顯存使用量不斷增加；

??????? 由于博主只使用 VGG16 預(yù)訓(xùn)練模型進(jìn)行分類預(yù)測，不需要訓(xùn)練和反向傳播更新參數(shù)，所以不用構(gòu)建完整的計(jì)算圖。

2--問題解決

??????? 在推理代碼中增加以下指令，表明當(dāng)前計(jì)算不需要進(jìn)行反向傳播，即強(qiáng)制不進(jìn)行完整計(jì)算圖的構(gòu)建：

with torch.no_grad():
    ...
    ...

3--代碼

??????? 問題代碼：

def extract_rgb_feature(rgb_data):
    data = rgb_data.to(device_id[0]) # [40, 40, 3]
    data = data.permute(2, 0, 1).unsqueeze(0) # [1, 3, 40, 40]
    data = F.interpolate(data, size = (224, 224), mode='nearest').float() #[1, 3, 224, 224]
    data = model(data) # [1, linear_Class]
    return data

??????? 修正代碼：

def extract_rgb_feature(rgb_data):
    with torch.no_grad():
        data = rgb_data.to(device_id[0]) # [40, 40, 3]
        data = data.permute(2, 0, 1).unsqueeze(0) # [1, 3, 40, 40]
        data = F.interpolate(data, size = (224, 224), mode='nearest').float() #[1, 3, 224, 224]
        data = model(data) # [1, linear_Class]
        return data

??????? 完整代碼：文章來源地址http://www.zghlxwxcb.cn/news/detail-582128.html

from torchvision import models
import torch.nn as nn
import torch
import numpy as np
import cv2
import torch.nn.functional as F

class My_Net(nn.Module):
    def __init__(self, linear_Class):
        super(My_Net, self).__init__()
        self.linear_Class = linear_Class
        self.backbone = models.vgg16(pretrained=True) # 以 vgg16 作為 backbone
        self.backbone = self.process_backbone(self.backbone) # 對預(yù)訓(xùn)練模型進(jìn)行處理
 
        self.linear1 = nn.Linear(in_features = 4096, out_features = self.linear_Class)
 
    def process_backbone(self, model):
 
        # 固定預(yù)訓(xùn)練模型的參數(shù)
        for param in model.parameters():
            param.requires_grad = False
        
        # 刪除最后預(yù)測層    
        del model.classifier[6]
 
        return model
    
    def forward(self, x):
        x = self.backbone(x)
        x = self.linear1(x)
        return x

linear_Class = 2
device_id = [7]
model = My_Net(linear_Class).to(device_id[0]) # 初始化模型

def extract_rgb_feature(rgb_data):
    with torch.no_grad():
        data = rgb_data.to(device_id[0]) # [40, 40, 3]
        data = data.permute(2, 0, 1).unsqueeze(0) # [1, 3, 40, 40]
        data = F.interpolate(data, size = (224, 224), mode='nearest').float() #[1, 3, 224, 224]
        data = model(data) # [1, linear_Class]
        return data
                    
     
if __name__ == "__main__":

    CSub_train_txt_path = '../statistics/CSub_train.txt'
    CSub_test_txt_path = '../statistics/CSub_test.txt'
    
    CSub_train_data_path = './2J_rgb_patch_npy_file_40x40/CSub/train/'
    CSub_test_data_path = './2J_rgb_patch_npy_file_40x40/CSub/test/'
    
    CSub_train_txt = np.loadtxt(CSub_train_txt_path, dtype = str)
    CSub_test_txt = np.loadtxt(CSub_test_txt_path, dtype = str)
    
    CSub_train_save_path = './pre_vgg_feature/2J/CSub/train.npy'
    CSub_test_save_path = './pre_vgg_feature/2J/CSub/test.npy'
    
    save_data = []
    
    for (idx, name) in enumerate(CSub_test_txt):
        data_path = CSub_test_data_path + name + '.npy' 
        rgb_data = np.load(data_path) # T, M, N, H, W, C
        rgb_data = torch.from_numpy(rgb_data)#.to(device = device_id[0])
        
        T, M, N, H, W, C = rgb_data.shape
        Output = torch.zeros(T, M, N, 1, linear_Class)
        
        for t in range(T):
            for m in range(M):
                for n in range(N):
                    data = extract_rgb_feature(rgb_data[t, m, n])
                    Output[t, m, n] = data.cpu()
                    
        save_data.append(Output) 
        print("Processing " + name + ", Done !")
        
    np.save(CSub_test_save_path, save_data)
        
    print("All done!")

到了這里，關(guān)于深度學(xué)習(xí)筆記--解決GPU顯存使用量不斷增加的問題的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【Spark手機(jī)流量日志處理】使用SparkSQL按月統(tǒng)計(jì)流量使用量最多的用戶
?? 作者：“大數(shù)據(jù)小禪” ?? 文章簡介：本篇文章屬于Spark系列文章，專欄將會記錄從spark基礎(chǔ)到進(jìn)階的內(nèi)容 ?? 內(nèi)容涉及到Spark的入門集群搭建，核心組件，RDD，算子的使用，底層原理，SparkCore，SparkSQL，SparkStreaming等，Spark專欄地址.歡迎小伙伴們訂閱?? SparkSQL簡介 Spark
2023年04月15日
瀏覽(20)
如何檢查 Linux 內(nèi)存使用量是否耗盡?這5個命令堪稱絕了！
在 Linux 操作系統(tǒng)中，內(nèi)存是一個關(guān)鍵資源，用于存儲正在運(yùn)行的程序和操作系統(tǒng)本身的數(shù)據(jù)。如果系統(tǒng)的內(nèi)存使用量過高，可能會導(dǎo)致性能下降、應(yīng)用程序崩潰或者系統(tǒng)崩潰。因此，了解如何檢查 Linux 內(nèi)存使用量是否耗盡是非常重要的。下面是一些常用的方法，可以幫助您
2023年04月17日
瀏覽(14)
全網(wǎng)70,000+ GPTs分析：榜首使用量突破19萬次，AI交互的新紀(jì)元
從11月份OpenAI宣布開放GPTs到現(xiàn)在還不到2個月時間，GPTs的全網(wǎng)創(chuàng)建數(shù)量已經(jīng)接近100K+。 BeBeGPT Store作為最大的中文GPTs商店，不僅在GPTs的收集數(shù)量上名列前茅，同時利用大語言模型技術(shù)，全程依靠 Coding + AI 實(shí)現(xiàn)全站自動化更新運(yùn)營，相比同類網(wǎng)站而言，提供更為全面的 GPTs 中文
2024年01月17日
瀏覽(20)
【2023 年第二屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽】初賽 B：美國紐約公共自行車使用量預(yù)測分析問題一Python代碼分析
Citi Bike是紐約市在2013年啟動的一項(xiàng)自行車共享出行計(jì)劃，由“花旗銀行”(Citi Bank)贊助并取名為“花旗單車”(Citi Bike)。在曼哈頓，布魯克林，皇后區(qū)和澤西市有8,000輛自行車和500個車站。為紐約的居民和游客提供一種方便快捷，并且省錢的自行車出行方式。人們隨處都能借
2024年02月17日
瀏覽(19)
【2023 年第二屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽】初賽 B：美國紐約公共自行車使用量預(yù)測分析問題三時間序列預(yù)測Python代碼分析
【2023 年第二屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽】初賽 B：美國紐約公共自行車使用量預(yù)測分析問題一Python代碼分析【2023 年第二屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽】初賽 B：美國紐約公共自行車使用量預(yù)測分析問題二Python代碼分析【2023 年第二屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽】初賽
2024年02月15日
瀏覽(30)
在過去的十年里，云計(jì)算作為新興的IT技術(shù)領(lǐng)域出現(xiàn)了極大的變化。其最大的特點(diǎn)就是按需付費(fèi)，用戶只需要支付使用量的費(fèi)用，不需要購買昂貴的硬件，并且可以隨時擴(kuò)容，無限伸縮
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 在過去的十年里，云計(jì)算作為新興的IT技術(shù)領(lǐng)域出現(xiàn)了極大的變化。其最大的特點(diǎn)就是按需付費(fèi)，用戶只需要支付使用量的費(fèi)用，不需要購買昂貴的硬件，并且可以隨時擴(kuò)容，無限伸縮。眾多廠商相繼推出了自己的云服務(wù)平臺，如 Amazon Web Ser
2024年02月11日
瀏覽(22)
【AI】《動手學(xué)-深度學(xué)習(xí)-PyTorch版》筆記（十六）：自定義網(wǎng)絡(luò)層、保存/加載參數(shù)、使用GPU
自定義網(wǎng)絡(luò)層很簡單，三步即可完成繼承類：nn.Module 定義初始化函數(shù)：__init__中定義需要初始化的代碼定義向前傳播函數(shù)：forward 1）定義網(wǎng)絡(luò)層
2024年02月13日
瀏覽(24)
【已解決】探究CUDA out of memory背后原因，如何釋放GPU顯存？
研究過深度學(xué)習(xí)的同學(xué)，一定對類似下面這個CUDA顯存溢出錯誤不陌生 RuntimeError: CUDA out of memory. Tried to allocate 916.00 MiB (GPU 0; 6.00 GiB total capacity; 4.47 GiB already allocated; 186.44 MiB free; 4.47 GiB reserved in total by PyTorch) 本文探究CUDA的內(nèi)存管理機(jī)制，并總結(jié)該問題的解決辦法在實(shí)驗(yàn)開始前
2023年04月20日
瀏覽(24)
深度學(xué)習(xí)中指定特定的GPU使用
老生常談，同樣的問題，主要來源于： RuntimeError: CUDA error: out of memory 當(dāng)使用完之后，想從其他方式調(diào)試，具體可看我這篇文章的：出現(xiàn) CUDA out of memory 的解決方法如果還有的空間使用，可看我下面的方式執(zhí)行代碼的時候，出現(xiàn)如下問題：截圖如下所示：最終查看是否還有
2024年01月18日
瀏覽(25)
win10跑深度學(xué)習(xí)程序無法調(diào)用gpu的問題（已解決）
win10跑深度學(xué)習(xí)真的是一言難盡，但是windows系統(tǒng)又使用的比較習(xí)慣，過去使用過ubuntu系統(tǒng)，里面寫文檔什么的確實(shí)不習(xí)慣，所以自己做的實(shí)驗(yàn)項(xiàng)目也主要是以win10為主工具是常見的pycharm+anaconda+win10 采用的是keras2.3.1，更改了程序中一些代碼之后，每次跑模型都會中斷記錄一下
2024年01月16日
瀏覽(23)