国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<ul id="dftl1"><delect id="dftl1"><font id="dftl1"></font></delect></ul>

睿智的目標(biāo)檢測(cè)64——目標(biāo)檢測(cè)中的MixUp數(shù)據(jù)增強(qiáng)方法

2年前作者：Bubbliiiing分類：Toy博客閱讀(20)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了睿智的目標(biāo)檢測(cè)64——目標(biāo)檢測(cè)中的MixUp數(shù)據(jù)增強(qiáng)方法。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

學(xué)習(xí)前言

哈哈哈！我再來一次數(shù)據(jù)增強(qiáng)！
mixup數(shù)據(jù)增強(qiáng),睿智的目標(biāo)檢測(cè),目標(biāo)檢測(cè),計(jì)算機(jī)視覺,深度學(xué)習(xí)

代碼下載

https://github.com/bubbliiiing/object-detection-augmentation

什么是MixUp數(shù)據(jù)增強(qiáng)方法

MixUp數(shù)據(jù)增強(qiáng)方法在最新的幾個(gè)Yolo算法中得到了廣泛的應(yīng)用，特別在YoloX中，s、m、l、x四個(gè)型號(hào)的網(wǎng)絡(luò)都使用了MixUp數(shù)據(jù)增強(qiáng)。nano和tiny由于模型的擬合能力一般沒有使用MixUp，但也說明了MixUp具有強(qiáng)大的數(shù)據(jù)增強(qiáng)能力。

MixUp的思路較為簡(jiǎn)單，主要是將兩張圖像按比例進(jìn)行混合，如圖所示：
mixup數(shù)據(jù)增強(qiáng),睿智的目標(biāo)檢測(cè),目標(biāo)檢測(cè),計(jì)算機(jī)視覺,深度學(xué)習(xí)
圖片混合完成后，原來兩幅圖片的真實(shí)框此時(shí)也位于一幅圖像上。

實(shí)現(xiàn)思路

1、每次讀取兩張的圖片。
mixup數(shù)據(jù)增強(qiáng),睿智的目標(biāo)檢測(cè),目標(biāo)檢測(cè),計(jì)算機(jī)視覺,深度學(xué)習(xí)

2、分別對(duì)兩張圖片進(jìn)行翻轉(zhuǎn)、縮放、色域變化等數(shù)據(jù)增強(qiáng)。

3、將二者的真實(shí)框堆疊到一起。
mixup數(shù)據(jù)增強(qiáng),睿智的目標(biāo)檢測(cè),目標(biāo)檢測(cè),計(jì)算機(jī)視覺,深度學(xué)習(xí)

全部代碼

1、數(shù)據(jù)增強(qiáng)與MixUp

該部分為普通數(shù)據(jù)增強(qiáng)與MixUp的代碼

import cv2
import numpy as np
from PIL import Image, ImageDraw


def rand(a=0, b=1):
    return np.random.rand()*(b-a) + a

def get_random_data(annotation_line, input_shape, jitter=.3, hue=.1, sat=0.7, val=0.4, random=True):
    line    = annotation_line.split()
    #------------------------------#
    #   讀取圖像并轉(zhuǎn)換成RGB圖像
    #------------------------------#
    image   = Image.open(line[0])
    image   = image.convert('RGB')

    #------------------------------#
    #   獲得圖像的高寬與目標(biāo)高寬
    #------------------------------#
    iw, ih  = image.size
    h, w    = input_shape
    #------------------------------#
    #   獲得預(yù)測(cè)框
    #------------------------------#
    box     = np.array([np.array(list(map(int,box.split(',')))) for box in line[1:]])

    if not random:
        scale = min(w/iw, h/ih)
        nw = int(iw*scale)
        nh = int(ih*scale)
        dx = (w-nw)//2
        dy = (h-nh)//2

        #---------------------------------#
        #   將圖像多余的部分加上灰條
        #---------------------------------#
        image       = image.resize((nw,nh), Image.BICUBIC)
        new_image   = Image.new('RGB', (w,h), (128,128,128))
        new_image.paste(image, (dx, dy))
        image_data  = np.array(new_image, np.float32)

        #---------------------------------#
        #   對(duì)真實(shí)框進(jìn)行調(diào)整
        #---------------------------------#
        if len(box)>0:
            np.random.shuffle(box)
            box[:, [0,2]] = box[:, [0,2]]*nw/iw + dx
            box[:, [1,3]] = box[:, [1,3]]*nh/ih + dy
            box[:, 0:2][box[:, 0:2]<0] = 0
            box[:, 2][box[:, 2]>w] = w
            box[:, 3][box[:, 3]>h] = h
            box_w = box[:, 2] - box[:, 0]
            box_h = box[:, 3] - box[:, 1]
            box = box[np.logical_and(box_w>1, box_h>1)] # discard invalid box

        return image_data, box
            
    #------------------------------------------#
    #   對(duì)圖像進(jìn)行縮放并且進(jìn)行長(zhǎng)和寬的扭曲
    #------------------------------------------#
    new_ar = iw/ih * rand(1-jitter,1+jitter) / rand(1-jitter,1+jitter)
    scale = rand(.25, 2)
    if new_ar < 1:
        nh = int(scale*h)
        nw = int(nh*new_ar)
    else:
        nw = int(scale*w)
        nh = int(nw/new_ar)
    image = image.resize((nw,nh), Image.BICUBIC)

    #------------------------------------------#
    #   將圖像多余的部分加上灰條
    #------------------------------------------#
    dx = int(rand(0, w-nw))
    dy = int(rand(0, h-nh))
    new_image = Image.new('RGB', (w,h), (128,128,128))
    new_image.paste(image, (dx, dy))
    image = new_image

    #------------------------------------------#
    #   翻轉(zhuǎn)圖像
    #------------------------------------------#
    flip = rand()<.5
    if flip: image = image.transpose(Image.FLIP_LEFT_RIGHT)

    image_data      = np.array(image, np.uint8)
    #---------------------------------#
    #   對(duì)圖像進(jìn)行色域變換
    #   計(jì)算色域變換的參數(shù)
    #---------------------------------#
    r               = np.random.uniform(-1, 1, 3) * [hue, sat, val] + 1
    #---------------------------------#
    #   將圖像轉(zhuǎn)到HSV上
    #---------------------------------#
    hue, sat, val   = cv2.split(cv2.cvtColor(image_data, cv2.COLOR_RGB2HSV))
    dtype           = image_data.dtype
    #---------------------------------#
    #   應(yīng)用變換
    #---------------------------------#
    x       = np.arange(0, 256, dtype=r.dtype)
    lut_hue = ((x * r[0]) % 180).astype(dtype)
    lut_sat = np.clip(x * r[1], 0, 255).astype(dtype)
    lut_val = np.clip(x * r[2], 0, 255).astype(dtype)

    image_data = cv2.merge((cv2.LUT(hue, lut_hue), cv2.LUT(sat, lut_sat), cv2.LUT(val, lut_val)))
    image_data = cv2.cvtColor(image_data, cv2.COLOR_HSV2RGB)

    #---------------------------------#
    #   對(duì)真實(shí)框進(jìn)行調(diào)整
    #---------------------------------#
    if len(box)>0:
        np.random.shuffle(box)
        box[:, [0,2]] = box[:, [0,2]]*nw/iw + dx
        box[:, [1,3]] = box[:, [1,3]]*nh/ih + dy
        if flip: box[:, [0,2]] = w - box[:, [2,0]]
        box[:, 0:2][box[:, 0:2]<0] = 0
        box[:, 2][box[:, 2]>w] = w
        box[:, 3][box[:, 3]>h] = h
        box_w = box[:, 2] - box[:, 0]
        box_h = box[:, 3] - box[:, 1]
        box = box[np.logical_and(box_w>1, box_h>1)] 
    
    return image_data, box

def get_random_data_with_MixUp(image_1, box_1, image_2, box_2):
    new_image = np.array(image_1, np.float32) * 0.5 + np.array(image_2, np.float32) * 0.5
    new_boxes = np.concatenate([box_1, box_2], axis=0)
    return new_image, new_boxes

2、調(diào)用代碼

該部分為調(diào)用代碼文章來源地址http://www.zghlxwxcb.cn/news/detail-789294.html

import os
from random import sample

import numpy as np
from PIL import Image, ImageDraw

from utils.random_data import get_random_data, get_random_data_with_MixUp
from utils.utils import convert_annotation, get_classes

#-----------------------------------------------------------------------------------#
#   Origin_VOCdevkit_path   原始數(shù)據(jù)集所在的路徑
#-----------------------------------------------------------------------------------#
Origin_VOCdevkit_path   = "VOCdevkit_Origin"
#-----------------------------------------------------------------------------------#
#   input_shape             生成的圖片大小。
#-----------------------------------------------------------------------------------#
input_shape             = [640, 640]

if __name__ == "__main__":
    Origin_JPEGImages_path  = os.path.join(Origin_VOCdevkit_path, "VOC2007/JPEGImages")
    Origin_Annotations_path = os.path.join(Origin_VOCdevkit_path, "VOC2007/Annotations")
    
    #---------------------------#
    #   遍歷標(biāo)簽并賦值
    #---------------------------#
    xml_names = os.listdir(Origin_Annotations_path)

    #------------------------------#
    #   獲取兩個(gè)圖像與標(biāo)簽
    #------------------------------#
    sample_xmls     = sample(xml_names, 2)
    unique_labels   = get_classes(sample_xmls, Origin_Annotations_path)
    jpg_name_1  = os.path.join(Origin_JPEGImages_path, os.path.splitext(sample_xmls[0])[0] + '.jpg')
    jpg_name_2  = os.path.join(Origin_JPEGImages_path, os.path.splitext(sample_xmls[1])[0] + '.jpg')
    xml_name_1  = os.path.join(Origin_Annotations_path, sample_xmls[0])
    xml_name_2  = os.path.join(Origin_Annotations_path, sample_xmls[1])
    
    line_1 = convert_annotation(jpg_name_1, xml_name_1, unique_labels)
    line_2 = convert_annotation(jpg_name_2, xml_name_2, unique_labels)

    #------------------------------#
    #   各自數(shù)據(jù)增強(qiáng)
    #------------------------------#
    image_1, box_1  = get_random_data(line_1, input_shape) 
    image_2, box_2  = get_random_data(line_2, input_shape) 
    
    #------------------------------#
    #   合并mixup
    #------------------------------#
    image_data, box_data = get_random_data_with_MixUp(image_1, box_1, image_2, box_2)
    
    img = Image.fromarray(image_data.astype(np.uint8))
    for j in range(len(box_data)):
        thickness = 3
        left, top, right, bottom  = box_data[j][0:4]
        draw = ImageDraw.Draw(img)
        for i in range(thickness):
            draw.rectangle([left + i, top + i, right - i, bottom - i],outline=(255, 255, 255))
    img.show()

到了這里，關(guān)于睿智的目標(biāo)檢測(cè)64——目標(biāo)檢測(cè)中的MixUp數(shù)據(jù)增強(qiáng)方法的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

睿智的目標(biāo)檢測(cè)——Pytorch搭建YoloV7-3D單目圖像目標(biāo)檢測(cè)平臺(tái)
睿智的目標(biāo)檢測(cè)——Pytorch搭建YoloV7-3D單目圖像目標(biāo)檢測(cè)平臺(tái) 學(xué)習(xí)前言源碼下載 YoloV7-3D改進(jìn)的部分（不完全） YoloV7-3D實(shí)現(xiàn)思路一、整體結(jié)構(gòu)解析二、網(wǎng)絡(luò)結(jié)構(gòu)解析 1、主干網(wǎng)絡(luò)Backbone介紹 2、構(gòu)建FPN特征金字塔進(jìn)行加強(qiáng)特征提取 3、利用Yolo Head獲得預(yù)測(cè)結(jié)果三、預(yù)測(cè)結(jié)果的解
2024年02月16日
瀏覽(29)
睿智的目標(biāo)檢測(cè)——Pytorch搭建YoloV7-OBB旋轉(zhuǎn)目標(biāo)檢測(cè)平臺(tái)
睿智的目標(biāo)檢測(cè)——Pytorch搭建[YoloV7-OBB]旋轉(zhuǎn)目標(biāo)檢測(cè)平臺(tái) 學(xué)習(xí)前言源碼下載 YoloV7-OBB改進(jìn)的部分（不完全） YoloV7-OBB實(shí)現(xiàn)思路一、整體結(jié)構(gòu)解析二、網(wǎng)絡(luò)結(jié)構(gòu)解析 1、主干網(wǎng)絡(luò)Backbone介紹 2、構(gòu)建FPN特征金字塔進(jìn)行加強(qiáng)特征提取 3、利用Yolo Head獲得預(yù)測(cè)結(jié)果三、預(yù)測(cè)結(jié)果的解
2024年02月04日
瀏覽(23)
目標(biāo)檢測(cè): 一文讀懂 Mosaic 數(shù)據(jù)增強(qiáng)
在 Yolo-V4 、 Yolo-V5 中，都有一個(gè)很重要的技巧，就是 Mosaic 數(shù)據(jù)增強(qiáng)，這種數(shù)據(jù)增強(qiáng)方式簡(jiǎn)單來說就是把4張圖片，通過隨機(jī)縮放、隨機(jī)裁減、隨機(jī)排布的方式進(jìn)行拼接。 Mosaic 有如下優(yōu)點(diǎn)：（1）豐富數(shù)據(jù)集：隨機(jī)使用4張圖片，隨機(jī)縮放，再隨機(jī)分布進(jìn)行拼接，大大豐富了檢
2024年02月08日
瀏覽(19)
YOLOv7如何提高目標(biāo)檢測(cè)的速度和精度，基于模型結(jié)構(gòu)、數(shù)據(jù)增強(qiáng)提高目標(biāo)檢測(cè)速度
大家好，我是哪吒。
2024年02月01日
瀏覽(24)
【目標(biāo)檢測(cè)】“復(fù)制-粘貼 copy-paste” 數(shù)據(jù)增強(qiáng)實(shí)現(xiàn)
本文來源論文《Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation》（CVPR2020），對(duì)其數(shù)據(jù)增強(qiáng)方式進(jìn)行實(shí)現(xiàn)。論文地址：https://arxiv.org/abs/2012.07177 解讀：https://mp.weixin.qq.com/s/nKC3bEe3m1eqPDI0LpVTIA 主要思想：本文參考該數(shù)據(jù)增強(qiáng)的語義分割實(shí)現(xiàn)[1]，相應(yīng)修改為對(duì)應(yīng)目
2024年02月12日
瀏覽(19)
目標(biāo)檢測(cè)筆記(七)：Mosaic數(shù)據(jù)增強(qiáng)完整代碼和結(jié)果展示
mosaic數(shù)據(jù)增強(qiáng)則利用了四張圖片，對(duì)四張圖片進(jìn)行拼接，每一張圖片都有其對(duì)應(yīng)的框框，將四張圖片拼接之后就獲得一張新的圖片，同時(shí)也獲得這張圖片對(duì)應(yīng)的框框，然后我們將這樣一張新的圖片傳入到神經(jīng)網(wǎng)絡(luò)當(dāng)中去學(xué)習(xí)，相當(dāng)于一下子傳入四張圖片進(jìn)行學(xué)習(xí)了。論文中說
2024年02月03日
瀏覽(18)
目標(biāo)檢測(cè)任務(wù)數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)中，圖像垂直翻轉(zhuǎn)和xml標(biāo)注文件坐標(biāo)調(diào)整
?使用以上代碼需要修改原圖像和標(biāo)注文件所在文件夾路徑（source_dir）。親測(cè)可用。?
2024年02月11日
瀏覽(29)
目標(biāo)檢測(cè)任務(wù)數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)中，圖像水平翻轉(zhuǎn)和xml標(biāo)注文件坐標(biāo)調(diào)整
2024年02月11日
瀏覽(28)
目標(biāo)檢測(cè)中的知識(shí)蒸餾方法
知識(shí)蒸餾 (Knowledge Distillation KD) 是模型壓縮（輕量化）的一種有效的解決方案，這種方法可以使輕量級(jí)的學(xué)生模型獲得繁瑣的教師模型中的知識(shí)。知識(shí)蒸餾使用一種教師—學(xué)生 (Teacher-Student)訓(xùn)練結(jié)構(gòu)，通常是已訓(xùn)練好的教師模型提供知識(shí)，學(xué)生模型通過蒸餾訓(xùn)練來獲取教師
2024年02月06日
瀏覽(22)
CVPR2022 3D目標(biāo)檢測(cè)（GLENet ）增強(qiáng)型3D目標(biāo)檢測(cè)網(wǎng)絡(luò)
圖 1：(a) 給定一個(gè)不完整 LiDAR 觀測(cè)的對(duì)象，可能存在多個(gè)具有不同大小和形狀的潛在合理的真實(shí)邊界框。 (b) 當(dāng)注釋來自 2D 圖像和部分點(diǎn)時(shí)，標(biāo)簽過程中的模糊和不準(zhǔn)確是不可避免的。在給定的情況下，只有后部的汽車類別的類似點(diǎn)云可以用不同長(zhǎng)度的不同真實(shí)值框進(jìn)行注釋
2023年04月08日
瀏覽(18)

<ul id="vvcax"></ul>

<strike id="vvcax"></strike>