国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<optgroup id="sewb4"></optgroup>

<address id="sewb4"><pre id="sewb4"></pre></address>

深度學(xué)習(xí)-yolo-fastestV2使用自己的數(shù)據(jù)集訓(xùn)練自己的模型

2年前作者：追天一方分類：Toy博客閱讀(25)違法舉報

這篇具有很好參考價值的文章主要介紹了深度學(xué)習(xí)-yolo-fastestV2使用自己的數(shù)據(jù)集訓(xùn)練自己的模型。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前言

雖然說yolo-fastestV2在coco數(shù)據(jù)集上map只達到了24.1，但是應(yīng)付一些類別少的問題還是可以的。主要是這個速度是真的香！簡單來說就是一個快到飛起的模型。

1.關(guān)于yolo-fastestV2

github地址如下：yolo-fastestV2
yolo-fastestV2采用了輕量化網(wǎng)絡(luò)shufflenetV2為backbone，筆者在這里就不詳解yolo-fastestV2了，只講怎么訓(xùn)練自己的yolo-fastestV2模型。

2.修改訓(xùn)練代碼

訓(xùn)練部分的代碼只修改了一小部分，如下：

import os
import math
import time
import argparse
import numpy as np
from tqdm import tqdm
from numpy.testing._private.utils import print_assert_equal

import torch
from torch import optim
from torch.utils.data import dataset
from numpy.core.fromnumeric import shape

from torchsummary import summary

import utils.loss
import utils.utils
import utils.datasets
import model.detector

if __name__ == '__main__':
    # 指定訓(xùn)練配置文件
    parser = argparse.ArgumentParser()
    parser.add_argument('--data', type=str, default='./data/coco.data',
                        help='Specify training profile *.data')
    opt = parser.parse_args()
    cfg = utils.utils.load_datafile(opt.data)

    print("訓(xùn)練配置:")
    print(cfg)

    train_dataset = utils.datasets.TensorDataset(cfg["train"], cfg["width"], cfg["height"], imgaug = True)
    val_dataset = utils.datasets.TensorDataset(cfg["val"], cfg["width"], cfg["height"], imgaug = False)

    batch_size = int(cfg["batch_size"] / cfg["subdivisions"])
    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])
    print(nw)
    train_dataloader = torch.utils.data.DataLoader(train_dataset,
                                                   batch_size=batch_size,
                                                   shuffle=True,
                                                   collate_fn=utils.datasets.collate_fn,
                                                   num_workers=nw,
                                                   pin_memory=True,
                                                   drop_last=True,
                                                   persistent_workers=True
                                                   )
    val_dataloader = torch.utils.data.DataLoader(val_dataset,
                                                 batch_size=batch_size,
                                                 shuffle=False,
                                                 collate_fn=utils.datasets.collate_fn,
                                                 num_workers=nw,
                                                 pin_memory=True,
                                                 drop_last=False,
                                                 persistent_workers=True
                                                 )

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    load_param = False
    premodel_path = cfg["pre_weights"]
    if premodel_path != None and os.path.exists(premodel_path):
        load_param = True

    model = model.detector.Detector(cfg["classes"], cfg["anchor_num"], load_param).to(device)
    summary(model, input_size=(3, cfg["height"], cfg["width"]))

    # 加載預(yù)訓(xùn)練模型參數(shù)
    if load_param == True:
        model_dict = model.state_dict()
        pretrained_dict = torch.load(premodel_path, map_location=device)
        pretrained_dict = {k: v for k, v in pretrained_dict.items() if np.shape(model_dict[k]) == np.shape(v)}
        model_dict.update(pretrained_dict)
        model.load_state_dict(model_dict)
        print("Load finefune model param: %s" % premodel_path)
    else:
        print("Initialize weights: model/backbone/backbone.pth")

    optimizer = optim.SGD(params=model.parameters(),
                          lr=cfg["learning_rate"],
                          momentum=0.949,
                          weight_decay=0.0005,
                          )

    scheduler = optim.lr_scheduler.MultiStepLR(optimizer,
                                               milestones=cfg["steps"],
                                               gamma=0.1)

    print('Starting training for %g epochs...' % cfg["epochs"])

    batch_num = 0
    for epoch in range(cfg["epochs"]):
        model.train()
        pbar = tqdm(train_dataloader)

        for imgs, targets in pbar:
            imgs = imgs.to(device).float() / 255.0
            targets = targets.to(device)
            preds = model(imgs)
            iou_loss, obj_loss, cls_loss, total_loss = utils.loss.compute_loss(preds, targets, cfg, device)

            total_loss.backward()

            for g in optimizer.param_groups:
                warmup_num =  5 * len(train_dataloader)
                if batch_num <= warmup_num:
                    scale = math.pow(batch_num/warmup_num, 4)
                    g['lr'] = cfg["learning_rate"] * scale
                    
                lr = g["lr"]

            if batch_num % cfg["subdivisions"] == 0:
                optimizer.step()
                optimizer.zero_grad()

            info = "Epoch:%d LR:%f CIou:%f Obj:%f Cls:%f Total:%f" % (
                    epoch, lr, iou_loss, obj_loss, cls_loss, total_loss)
            pbar.set_description(info)

            batch_num += 1

        if epoch % 10 == 0 and epoch > 0:
            model.eval()
            print("computer mAP...")
            _, _, AP, _ = utils.utils.evaluation(val_dataloader, cfg, model, device)
            print("computer PR...")
            precision, recall, _, f1 = utils.utils.evaluation(val_dataloader, cfg, model, device, 0.3)
            print("Precision:%f Recall:%f AP:%f F1:%f"%(precision, recall, AP, f1))

            torch.save(model.state_dict(), "weights/%s-%d-epoch-%fap-model.pth" %
                      (cfg["model_name"], epoch, AP))

        scheduler.step()

這里筆者修改了加載預(yù)訓(xùn)練參數(shù)的部分，如果不修改的話，在后面修改訓(xùn)練自己模型的類別會有問題。因為作者的預(yù)訓(xùn)練模型是coco數(shù)據(jù)集80類別，要是不修改簡單來說只能讓類別數(shù)為80，這是肯定不行的。

3.制作自己的目標檢測數(shù)據(jù)集

(1).收集圖片

首先使用opencv收集數(shù)據(jù)集的圖片，代碼如下：

import cv2

cap=cv2.VideoCapture(1)
i=1
while(cap.isOpened()):
    ret,f=cap.read()
    c=cv2.waitKey(1)
    cv2.imshow("f",f)
    if c==27:
        break
    elif c==ord("q"):
        print(i)
        path="./data/"+str(i)+".jpg"
        cv2.imwrite(path,f)
        i+=1
    else:
        pass

cap.release()
cv2.destroyAllWindows()

(2).打標簽

上面的代碼只要修改一下path就能保存到自己指定的路徑了，圖片建議保存成jpg格式，當(dāng)然也可以不，但是建議全部圖片保存為同一種后綴。當(dāng)然圖片的分辨率也得是一致的。
然后安裝標注工具labelimg，一般使用在cmd使用如下命令就能安裝了

pip install labelimg

然后在cmd鍵入labelimg就能進入labelimg了，然后給自己的數(shù)據(jù)集打上標簽。打成的標簽xml文件和圖片放在同一個文件夾里面。

(3).數(shù)據(jù)處理

然后運行如下代碼：

import xml.etree.ElementTree as et
import os

classes=["a","b"]

def find_xml(path):
    '''
    找到一個文件夾下所有的xml文件，返回一個裝這這些文件路徑名的所有文件的列表
    '''
    file_list=os.listdir(path)
    xml_list=[]
    for file in file_list:
        if file.endswith(".xml"):
            xml_list.append(path+"/"+file)

    return xml_list

def xml2txt(path,x=640,y=480):
    xml_list=find_xml(path)
    for xml in xml_list:
        file=xml[:-4]
        txt=file+".txt"
        #xml文件解析器,將xml文件解析成元素樹
        tree=et.parse(xml)
        #拿到樹的根
        root=tree.getroot()
        with open(txt,'w') as f:
            #root.iter創(chuàng)建迭代器，尋找所有object的節(jié)點
            for obj in root.iter('object'):
                #按找標記名尋找匹配的第一個元素，text返回字符串
                cls = obj.find('name').text
                if cls not in classes:
                    continue
                cls_id = classes.index(cls)
                xmlbox = obj.find('bndbox')
                b = (int(xmlbox.find('xmin').text), int(xmlbox.find('ymin').text), int(xmlbox.find('xmax').text),
                     int(xmlbox.find('ymax').text))
                w=float(b[2]-b[0])
                h=float(b[3]-b[1])
                center_x=float(b[0]+w/2)
                center_y=float(b[1]+h/2)
                d=[center_x/x,center_y/y,w/x,h/y]
                f.write(str(cls_id)+" "+" ".join([str(a) for a in d])+"\n")


if __name__ == '__main__':
    xml2txt("./xml")

上面代碼的作用是將每一個xml文件生成一個txt標簽文件，用于后續(xù)訓(xùn)練，其中第二個函數(shù)中的x，y分別為圖片的寬和高。因為作者的代碼是要從txt文件里面獲取歸一化后的框，我們從上面收集的圖片來說分辨率都是一樣的，所以就直接用我們這個固定的寬高分辨率來歸一化，當(dāng)然如果有不同分辨率的圖片的話，可以打標簽前做一個resize操作，也可以在解析xml文件的時候輸出圖片的寬高再用這個寬高歸一化。
下面就是生成用于訓(xùn)練的train.txt和test.txt了，這兩個文件就是儲存了圖片的路徑，方便在訓(xùn)練或者評估的時候找到圖片的路徑。代碼如下：

import os
import random
random.seed(0)

def find_xml(path):
    '''
    path用絕對路徑
    找到一個文件夾下所有的xml文件，返回一個裝這這些文件路徑名的所有文件的列表
    '''
    file_list=os.listdir(path)
    xml_list=[]
    for file in file_list:
        if file.endswith(".xml"):
            xml_list.append(path+"/"+file)
    return xml_list

def wri_txt(path,tu="jpg",train_path="train.txt",test_path="test.txt",train_precent=0.8):
    xml_list=find_xml(path)
    train_len=int(len(xml_list)*train_precent)
    ftrain=open(train_path,'w')
    ftest=open(test_path,'w')
    train_list=random.sample(xml_list,train_len)
    for xml in xml_list:
        if xml in train_list:
            pp = xml[:-4] + "." + tu
            ftrain.write(str(pp) + "\n")
        else:
            pp = xml[:-4] + "." + tu
            ftest.write(str(pp) + "\n")
    print("寫入完成")


if __name__ == '__main__':
    wri_txt(path=r"D:\python1\python\pytorch\object-detection\Yolo-FastestV2-main\xml")

然后注意第二個函數(shù)wri_txt函數(shù)中的路徑必須用絕對路徑。

4.修改超參數(shù)

(1).生成先驗框

生成anchors的代碼在作者的genanchors.py中，我們在main函數(shù)中修改traintxt參數(shù)的defaul也就是默認參數(shù)為我們上面寫入的train.txt文件的路徑即可。然后就會生成一個anchors6.txt文件，打開它如下：

53.74,73.54, 79.35,106.18, 83.11,168.08, 107.49,135.43, 119.73,183.46, 158.47,204.21
0.847014

第一行就是我們的6個先驗框的寬高了。第二行可以不用管。

(2).修改超參數(shù)

打開data文件夾下的coco.data，把anchors后面的數(shù)字改成我們生成的第一行數(shù)據(jù)即可。
coco.data的數(shù)據(jù)如下：

[name]
model_name=fruit   #模型名字

[train-configure]
epochs=300      #批次數(shù)
steps=150,250
batch_size=2
subdivisions=1
learning_rate=0.001

[model-configure]
pre_weights=./modelzoo/coco2017-0.241078ap-model.pth  #預(yù)訓(xùn)練參數(shù)路徑
classes=2   #分類數(shù)
width=352
height=352
anchor_num=3   #每個特征層的anchor數(shù)
anchors=53.74,73.54, 79.35,106.18, 83.11,168.08, 107.49,135.43, 119.73,183.46, 158.47,204.21
[data-configure]
train=D:\\python1\\python\\pytorch\\object-detection\\Yolo-FastestV2-main\train.txt   #訓(xùn)練集路徑
val=D:\\python1\\python\\pytorch\\object-detection\\Yolo-FastestV2-main\\test.txt    #測試集路徑
names=./data/coco.names   #保存對應(yīng)類別名字的文件

然后按照上面的注釋，把這些超參數(shù)改成自己需要的就好了，一些基礎(chǔ)的超參數(shù)筆者就不解釋了。
隨后把coco.names文件改成自己數(shù)據(jù)的類別，一個類別對應(yīng)一行。

5.開始訓(xùn)練

隨后就可以運行train.py文件用自己的數(shù)據(jù)集訓(xùn)練自己的模型了。在這里筆者建議安裝的torch1.9.0，torchvision0.10.0。這是項目作者的環(huán)境，不然可能會因為api不兼容報錯。
然后萬一訓(xùn)練好的模型泛化不到訓(xùn)練場景以外的場景，最簡單的方法就是添加這個場景的數(shù)據(jù)，將預(yù)訓(xùn)練權(quán)重修改成自己之前訓(xùn)練好的權(quán)重繼續(xù)訓(xùn)練。這樣更節(jié)省時間。然后在數(shù)據(jù)集的收集上的話，建議每個類別的數(shù)量在1500個框以上吧。文章來源地址http://www.zghlxwxcb.cn/news/detail-461900.html

到了這里，關(guān)于深度學(xué)習(xí)-yolo-fastestV2使用自己的數(shù)據(jù)集訓(xùn)練自己的模型的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

深度學(xué)習(xí)必備知識——模型數(shù)據(jù)集Yolo與Voc格式文件相互轉(zhuǎn)化
在深度學(xué)習(xí)中，第一步要做的往往就是處理數(shù)據(jù)集 ,尤其是學(xué)習(xí)百度飛槳PaddlePaddle的小伙伴，數(shù)據(jù)集經(jīng)常要用Voc格式的，比如性能突出的ppyolo等模型。所以學(xué)會數(shù)據(jù)集轉(zhuǎn)化的本領(lǐng)是十分必要的。這篇博客就帶你一起進行Yolo與Voc格式的相互轉(zhuǎn)化，附詳細代碼！ Yolo數(shù)據(jù)集主要
2024年01月17日
瀏覽(20)
大數(shù)據(jù)畢設(shè)選題 - 深度學(xué)習(xí)火焰識別檢測系統(tǒng)（python YOLO）
?? Hi，大家好，這里是丹成學(xué)長的畢設(shè)系列文章！ ?? 對畢設(shè)有任何疑問都可以問學(xué)長哦! 這兩年開始，各個學(xué)校對畢設(shè)的要求越來越高，難度也越來越大… 畢業(yè)設(shè)計耗費時間，耗費精力，甚至有些題目即使是專業(yè)的老師或者碩士生也需要很長時間，所以一旦發(fā)現(xiàn)問題，一定
2023年04月11日
瀏覽(30)
深度學(xué)習(xí)目標檢測數(shù)據(jù)VisDrone2019（to yolo / voc / coco）---MMDetection數(shù)據(jù)篇
配備攝像頭的無人機(或通用無人機)已被快速部署到廣泛的應(yīng)用領(lǐng)域，包括農(nóng)業(yè)、航空攝影、快速交付和監(jiān)視。因此，從這些平臺上收集的視覺數(shù)據(jù)的自動理解要求越來越高，這使得計算機視覺與無人機的關(guān)系越來越密切。我們很高興為各種重要的計算機視覺任務(wù)展示一個大
2024年02月04日
瀏覽(96)
深度學(xué)習(xí)——制作自己的VOC圖像分割數(shù)據(jù)集
1、數(shù)據(jù)集介紹 COCO數(shù)據(jù)集有80個類別，VOC數(shù)據(jù)集有20個類別。當(dāng)這些數(shù)據(jù)集類別中沒有自己需要的時候，就需要自己動手做自己的數(shù)據(jù)集了。我自己在做數(shù)據(jù)集的時候主要使用到了labelme和labelImg兩個工具。labelme主要是制作語義分割數(shù)據(jù)集(ImageSets,JPEGImages,SegmentationClass,Segmenta
2024年02月04日
瀏覽(28)
精華整理幾十個Python數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、人工智能方面的核心庫以及詳細使用實戰(zhàn)案例，輕松幾行代碼訓(xùn)練自己的專有人工智能模型
精華整理幾十個Python數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、人工智能方面的核心庫以及詳細使用實戰(zhàn)案例，輕松幾行代碼訓(xùn)練自己的專有人工智能模型。機器學(xué)習(xí) 人工智能的核心，是使計算機具有智能的根本途徑。機器學(xué)習(xí)專注于算法，允許機器學(xué)習(xí)而不需要編程，
2024年01月25日
瀏覽(98)
【三維重建】【深度學(xué)習(xí)】【數(shù)據(jù)集】基于COLMAP制作自己的NeRF(LLFF格式)數(shù)據(jù)集
提示:最近開始在【三維重建】方面進行研究,記錄相關(guān)知識點,分享學(xué)習(xí)中遇到的問題已經(jīng)解決的方法。 LLFF格式是NeRF網(wǎng)絡(luò)模型訓(xùn)練使用的數(shù)據(jù)集格式之一，本文基于COLMAP軟件展示從LLFF格式數(shù)據(jù)集的制作到開始模型訓(xùn)練的完整流程。NeRF(神經(jīng)輻射場)通過輸入同一場景不同視角下
2024年02月10日
瀏覽(30)
深度學(xué)習(xí)（目標檢測）：YOLO網(wǎng)絡(luò)學(xué)習(xí)筆記（YOLO v1，YOLO v2和 YOLO v3）
兩種進行目標檢測任務(wù)的深度學(xué)習(xí)方法：分類：深度學(xué)習(xí)的目標檢測的方法可以分為兩類，分別是一階段方法和二階段方法。一階段方法：YOLO系列模型都是一階段方法，這一類方法可以一步到位地使用卷積神經(jīng)網(wǎng)絡(luò)進行特征提取并輸出標注框。兩階段方法：兩階段階段
2023年04月11日
瀏覽(25)
深度學(xué)習(xí)Docker使用, (Pytorch/TensorRT/DeepStream)，標記上傳制作自己的DockerHub
https://docs.docker.com/engine/install/ubuntu/ Set Up Install Docker Engine 安裝nvidia cuda tookit 加入了之后重啟了才能使用 Docker Root Dir: /data/docker 我的docker數(shù)據(jù)的掛載就是在/data/docker下面的 https://catalog.ngc.nvidia.com/containers 全部鏡像都是在NVIDIA官方找的登陸自己的賬號標記自己的鏡像在這里面
2024年02月13日
瀏覽(57)
深度學(xué)習(xí)（24）——YOLO系列（3）
今天YOLOv4理論版只增強訓(xùn)練成本，但是能顯著提高精度，但是不影響推理速度數(shù)據(jù)增強：調(diào)整亮度，對比度，色調(diào)，隨機縮放… 網(wǎng)絡(luò)正則化的方法：dropout，dropblock 類別不平衡——損失函數(shù)設(shè)計參考cutmix，以前就存在，將增強的四張圖像拼接在一張進行訓(xùn)練（相當(dāng)于間接增
2024年02月11日
瀏覽(19)
深度學(xué)習(xí)（27）——YOLO系列（6）
咱就是說，需要源碼請造訪：Jane的GitHub ：在這里等你哦嗨，好久不見，昨天結(jié)束了yolov7的debug過程，真的在盡力句句理解，我想這應(yīng)該是我更新的yolo系列的最后一篇，但是僅限于yolo，detect的話題還不會結(jié)束，還會繼續(xù)進行，detect結(jié)束以后再說segmentation。和往常以一樣的過程
2024年02月15日
瀏覽(16)

<tfoot id="ayg7o"><div id="ayg7o"></div></tfoot>