国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

^{<rp id="s5qlo"></rp>}

<kbd id="s5qlo"><menu id="s5qlo"><tbody id="s5qlo"></tbody></menu></kbd>

<center id="s5qlo"></center>

<tfoot id="s5qlo"><xmp id="s5qlo">

模型推理詳細(xì)步驟以及如何排查模型和參數(shù)字典對(duì)不上的問題：Missing key(s) in state_dict: xxxx

2年前作者：小孫不夠睡分類：Toy博客閱讀(16)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了模型推理詳細(xì)步驟以及如何排查模型和參數(shù)字典對(duì)不上的問題：Missing key(s) in state_dict: xxxx。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

模型推理詳細(xì)步驟

模型加載步驟

首先，模型加載總共分為三步，第一步加載網(wǎng)絡(luò)結(jié)構(gòu)，需要和你訓(xùn)時(shí)的network結(jié)構(gòu)一樣。

model = Model.FeedBack3(cfg, config_path=None, pretrained=True).to(device)

第二步，加載訓(xùn)練好的參數(shù)，實(shí)際上雖然我們一直說訓(xùn)練模型，實(shí)際上訓(xùn)練出來的就是一組參數(shù)，這個(gè)參數(shù)是一個(gè)字典類型，一般保存的名稱為xxx.pt或者pth。里面存放的是模型每一層中的權(quán)重等數(shù)據(jù)。pytorch中對(duì)于加載參數(shù)使torch.load()

pretrained_dict = torch.load('outputmicrosoft-deberta-v3-base_fold3_best.pth')

第三步，將參數(shù)加載進(jìn)模型里

model.load_state_dict(pretrained_dict['model_state_dict'], strict=True)

以上就是加載模型的所有步驟了

關(guān)于模型參數(shù)和字典對(duì)不上的問題

一般報(bào)錯(cuò)為：Missing key(s) in state_dict: xxxx
最近在做模型部署的時(shí)候發(fā)現(xiàn)了這個(gè)問題，并且之前也遇到過，由于急于求成就簡單實(shí)在模型加載參數(shù)的時(shí)候用了strict=False這樣的條件，這個(gè)條件會(huì)使模型直接忽略所有對(duì)不上的參數(shù)，本質(zhì)上沒有解決問題。今天在debug時(shí)對(duì)模型每一層的參數(shù)排查終于發(fā)現(xiàn)了問題所在。
首先開啟debug模式，直接將斷點(diǎn)打在模型加載的代碼上：
首先查看model的結(jié)構(gòu)有沒有問題：
missing key(s) in state_dict:,深度學(xué)習(xí),深度學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
接下來進(jìn)行下一步，執(zhí)行到加載參數(shù)字典，同樣查看你的參數(shù)字典（這里由于參數(shù)過多就不詳細(xì)展示了）：

那么要如何排查呢，具體步驟如下：
首先參數(shù)字典里都是以鍵值對(duì)和tensor型式存儲(chǔ)的，那么我們只需要一一排查鍵值對(duì)和參數(shù)。比如首先是model建，那么只有你加載參數(shù)的時(shí)候只有加載里面的model建模型才能讀到參數(shù)，實(shí)際上我就是錯(cuò)在這里了，因?yàn)槲壹虞d的是通常使用的‘model_state_dict’這個(gè)建，因?yàn)槲矣?xùn)練部分是網(wǎng)上復(fù)制來的代碼，沒想到他把參數(shù)保存為model。
missing key(s) in state_dict:,深度學(xué)習(xí),深度學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)

也就是我只需要把前面的

model.load_state_dict(pretrained_dict['model_state_dict'])

改成

model.load_state_dict(pretrained_dict['model'])

就行了。
那么如果你的問題不是這里，接下來改如何排查呢
接著看OrderedDict里，這里面是模型每一層的參數(shù)，對(duì)照方法如下：
missing key(s) in state_dict:,深度學(xué)習(xí),深度學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
相當(dāng)于網(wǎng)絡(luò)結(jié)構(gòu)中的每一層都會(huì)變?yōu)橐粋€(gè)對(duì)應(yīng)的tensor
(model)(embeddings)(LayerNorm)在參數(shù)中就會(huì)存為：(‘model.embdeddings.LayerNorm’, tensor([xxxxx])
這樣就看懂了吧，如此對(duì)照每一層網(wǎng)絡(luò)結(jié)構(gòu)，只要你有耐心，就能找出來具體是那一層不對(duì)，不過大多情況下這種在網(wǎng)絡(luò)中間層出現(xiàn)參數(shù)不對(duì)的情況很少，出現(xiàn)的原因也肯定是你推理部分加載的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練時(shí)的網(wǎng)絡(luò)結(jié)構(gòu)不一致導(dǎo)致的。
順便推薦一個(gè)能幫你排查模型參數(shù)的代碼，他會(huì)輸出具體有多少參數(shù)使用了和沒使用：

def check_keys(model, pretrained_state_dict):
    ckpt_keys = set(pretrained_state_dict.keys())
    model_keys = set(model.state_dict().keys())
    used_pretrained_keys = model_keys & ckpt_keys
    unused_pretrained_keys = ckpt_keys - model_keys
    missing_keys = model_keys - ckpt_keys
    # filter 'num_batches_tracked'
    missing_keys = [x for x in missing_keys
                    if not x.endswith('num_batches_tracked')]
    if len(missing_keys) > 0:
        print('[Warning] missing keys: {}'.format(missing_keys))
        print('missing keys:{}'.format(len(missing_keys)))
    if len(unused_pretrained_keys) > 0:
        print('[Warning] unused_pretrained_keys: {}'.format(
            unused_pretrained_keys))
        print('unused checkpoint keys:{}'.format(
            len(unused_pretrained_keys)))
    print('used keys:{}'.format(len(used_pretrained_keys)))

    assert len(used_pretrained_keys) > 0, \
        'check_key load NONE from pretrained checkpoint'
    return True

模型推理中的數(shù)據(jù)處理

首先模型推理中數(shù)據(jù)最終的處理格式要和訓(xùn)練時(shí)輸入進(jìn)網(wǎng)絡(luò)中的格式一致，不過我們通常不再構(gòu)造新的dataset和使用dataloader，而是直接針對(duì)input處理成我們需要的格式。
主要步驟為，讀取數(shù)據(jù)，embedding，增加維度
讀取的數(shù)據(jù)可以是本地存的，如果你是要將模型部署在web上那么數(shù)據(jù)就是從客戶端傳來的json格式的數(shù)據(jù)，因此通常需要先將真正的input取出來。
接下來是向量化，這里步驟和訓(xùn)練中的一致，比如訓(xùn)練中使用了resize([800,800])和toTensor，那么推理中也要這樣設(shè)置。
由于我是NLP任務(wù)，那么處理的步驟為

inputs = cfg.tokenizer.encode_plus(
            input,
            return_tensors=None,
            add_special_tokens=True,
            max_length=cfg.max_lenth,
            pad_to_max_length=True,
            truncation=True
        )
 for k, v in inputs.items():
    inputs[k] = torch.tensor(v, dtype=torch.long)

至此，再次輸出此時(shí)的tensor和訓(xùn)練時(shí)輸入進(jìn)模型的tensor相比，只是少了一個(gè)維度，這個(gè)維度通?？梢岳斫馕覀?cè)谟?xùn)練的時(shí)候是有batch_size的，而推理時(shí)沒有，因此要手動(dòng)升維，升維度的函數(shù)有很多，通常使用unsequeeze(1)或者expand：

for k, v in inputs.items():
    s = v.shape
    inputs[k] = v.expand(1,-1).to(device) #-1自動(dòng)計(jì)算

這樣處理完數(shù)據(jù)格式就和訓(xùn)練時(shí)完全一致了，說白了還是要先debug一下訓(xùn)練時(shí)的數(shù)據(jù)，看看到底輸進(jìn)去的是什么格式，然后在推理部分照著一點(diǎn)一點(diǎn)改。文章來源地址http://www.zghlxwxcb.cn/news/detail-647935.html

到了這里，關(guān)于模型推理詳細(xì)步驟以及如何排查模型和參數(shù)字典對(duì)不上的問題：Missing key(s) in state_dict: xxxx的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

如何查看電腦顯卡詳細(xì)信息以及nvidia-smi各參數(shù)介紹
主要分為兩個(gè)部分：如何查看電腦顯卡詳細(xì)信息 nvidia-smi各參數(shù)介紹 1. 如何查看電腦顯卡詳細(xì)信息不論是windows系統(tǒng)還是linux，打開命令行，輸入 nvidia-smi 即可。 windows：顯卡型號(hào)為 GeForce MX150 Linux：兩塊 GeForce RTX 2080 卡 2. nvidia-smi各參數(shù)介紹一塊一塊介紹 GPU ：GPU的ID，對(duì)應(yīng)的
2024年02月03日
瀏覽(25)
深度學(xué)習(xí)模型的參數(shù)、計(jì)算量和推理速度統(tǒng)計(jì)
在沒有過擬合的情況下，相同模型結(jié)構(gòu)下，一般模型的參數(shù)量和計(jì)算量與最終的性能成正比，在比較不同模型性能時(shí)，最好能保持模型參數(shù)量和計(jì)算量在相同水平下，因此相應(yīng)參數(shù)的統(tǒng)計(jì)很重要。這里只進(jìn)行理論計(jì)算，最終的效果（內(nèi)存和速度）還和網(wǎng)絡(luò)結(jié)構(gòu)，代碼實(shí)現(xiàn)方式
2024年01月18日
瀏覽(22)
HugggingFace 推理 API、推理端點(diǎn)和推理空間相關(guān)模型部署和使用以及介紹
HugggingFace 推理 API、推理端點(diǎn)和推理空間相關(guān)模型部署和使用以及介紹。 Hugging Face是一家開源模型庫公司。 2023年5月10日，Hugging Face宣布C輪1億美元融資，由Lux Capital領(lǐng)投，紅杉資本、Coatue、Betaworks、NBA球星Kevin Durant等跟投，其估值增長到了20億美元。 2023年5月16日，Hugging Fac
2024年01月19日
瀏覽(21)
植物大戰(zhàn)僵尸針對(duì)植物的卡槽以及植物基地址尋找詳細(xì)步驟~包含排除不符合條件的地址的講解，以及如何觀察地址情況等
1.1.1采用卡槽中植物的冷卻計(jì)時(shí)增加的原理進(jìn)行尋找分析：在游戲剛開始使植物變?yōu)榭捎玫臓顟B(tài)，此時(shí)需要掃描精確的初始值0來表示這個(gè)植物的可用的狀態(tài)，然后種植這個(gè)植物，這個(gè)植物卡槽中就會(huì)呈現(xiàn)出CD的狀態(tài)，此時(shí)CD會(huì)正向的開始計(jì)時(shí)，直到增加到這個(gè)CD的固定數(shù)值時(shí)，
2024年02月06日
瀏覽(143)
yolov5的運(yùn)行環(huán)境配置、參數(shù)修改和訓(xùn)練命令，并將訓(xùn)練的pt模型轉(zhuǎn)換為rknn模型，并推理
目錄一.yolov5的運(yùn)行環(huán)境配置(Windows系統(tǒng)) 1、NVIDIA驅(qū)動(dòng)安裝與更新 ?2、Anaconda 的安裝 3、Pytorch環(huán)境安裝 ?4、pycharm安裝二.yolov5訓(xùn)練數(shù)據(jù)集，得到best.pt(Windows系統(tǒng)) ?1.下載YOLO項(xiàng)目代碼 ?2.環(huán)境安裝 3. 數(shù)據(jù)集下載：三.best.pt轉(zhuǎn)為onnx模型(Windows系統(tǒng)) 四.best.onnx轉(zhuǎn)為best.rknn模型(Linu
2024年02月13日
瀏覽(30)
基于中文金融知識(shí)的 LLaMA 系微調(diào)模型的智能問答系統(tǒng)：LLaMA大模型訓(xùn)練微調(diào)推理等詳細(xì)教學(xué)
項(xiàng)目設(shè)計(jì)集合（人工智能方向）：助力新人快速實(shí)戰(zhàn)掌握技能、自主完成項(xiàng)目設(shè)計(jì)升級(jí)，提升自身的硬實(shí)力（不僅限NLP、知識(shí)圖譜、計(jì)算機(jī)視覺等領(lǐng)域）：匯總有意義的項(xiàng)目設(shè)計(jì)集合，助力新人快速實(shí)戰(zhàn)掌握技能，助力用戶更好利用 CSDN 平臺(tái)，自主完成項(xiàng)目設(shè)計(jì)升級(jí)，提升自
2024年02月14日
瀏覽(22)
ONNXRuntime介紹及如何使用ONNXRuntime進(jìn)行模型推理
ONNXRuntime介紹及如何使用ONNXRuntime進(jìn)行模型推理隨著人工智能的發(fā)展，越來越多的深度學(xué)習(xí)模型被應(yīng)用到實(shí)際場(chǎng)景中。ONNX（Open Neural Network Exchange）是一個(gè)可跨平臺(tái)、可擴(kuò)展的開源模型交換格式，許多常見的深度學(xué)習(xí)框架都支持導(dǎo)出ONNX模型。而ONNXRuntime是由微軟開發(fā)的一個(gè)高性
2024年02月16日
瀏覽(18)
爆肝整理，Postman接口測(cè)試-參數(shù)關(guān)聯(lián)實(shí)戰(zhàn)（詳細(xì)步驟）
接口測(cè)試什么時(shí)候需要進(jìn)行參數(shù)關(guān)聯(lián)？上個(gè)接口返回的數(shù)據(jù)需要作為下個(gè)接口的參數(shù)或請(qǐng)求頭時(shí)就需要進(jìn)行參數(shù)關(guān)聯(lián)，也就是相互有依賴的接口就需要參數(shù)關(guān)聯(lián) 參數(shù)關(guān)聯(lián)的2種方式 1、創(chuàng)建兩個(gè)接口，在前一個(gè)接口的Test里面獲取到返回?cái)?shù)據(jù)并保存為全局變量或環(huán)境變量，然后
2024年02月14日
瀏覽(24)
【PyTorch 實(shí)戰(zhàn)2：UNet 分割模型】10min揭秘 UNet 分割網(wǎng)絡(luò)如何工作以及pytorch代碼實(shí)現(xiàn)（詳細(xì)代碼實(shí)現(xiàn)）
??U-Net，自2015年誕生以來，便以其卓越的性能在生物醫(yī)學(xué)圖像分割領(lǐng)域嶄露頭角。作為FCN的一種變體，U-Net憑借其Encoder-Decoder的精巧結(jié)構(gòu)，不僅在醫(yī)學(xué)圖像分析中大放異彩，更在衛(wèi)星圖像分割、工業(yè)瑕疵檢測(cè)等多個(gè)領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用能力。UNet是一種常用于圖像分割的卷
2024年04月28日
瀏覽(19)
在樹莓派上實(shí)現(xiàn)numpy的LSTM長短期記憶神經(jīng)網(wǎng)絡(luò)做圖像分類，加載pytorch的模型參數(shù)，推理mnist手寫數(shù)字識(shí)別
這幾天又在玩樹莓派，先是搞了個(gè)物聯(lián)網(wǎng)，又在嘗試在樹莓派上搞一些簡單的神經(jīng)網(wǎng)絡(luò)，這次搞得是LSTM識(shí)別mnist手寫數(shù)字識(shí)別訓(xùn)練代碼在電腦上，cpu就能訓(xùn)練，很快的：然后需要自己在dataset里導(dǎo)出一些圖片：我保存在了mnist_pi文件夾下,“_”后面的是標(biāo)簽，主要是在pc端導(dǎo)出
2024年02月07日
瀏覽(26)

<span id="ic5dl"><ul id="ic5dl"></ul></span>

<bdo id="ic5dl"></bdo>