国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<span id="ffrwd"><dfn id="ffrwd"></dfn></span>

YOLOv8改進算法之添加CA注意力機制

2年前作者：山河亦問安分類：Toy博客閱讀(26)違法舉報

這篇具有很好參考價值的文章主要介紹了YOLOv8改進算法之添加CA注意力機制。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

1. CA注意力機制

CA（Coordinate Attention）注意力機制是一種用于加強深度學習模型對輸入數(shù)據(jù)的空間結(jié)構(gòu)理解的注意力機制。CA 注意力機制的核心思想是引入坐標信息，以便模型可以更好地理解不同位置之間的關(guān)系。如下圖：

ca注意力機制,YOLO改進系列,YOLO,算法,人工智能

1. 輸入特征： CA 注意力機制的輸入通常是一個特征圖，它通常是卷積神經(jīng)網(wǎng)絡（CNN）中的某一層的輸出，具有以下形狀：[C, H, W]，其中：

C 是通道數(shù)，表示特征圖中的不同特征通道。
H 是高度，表示特征圖的垂直維度。
W 是寬度，表示特征圖的水平維度。

2. 全局平均池化： CA 注意力機制首先對輸入特征圖進行兩次全局平均池化，一次在寬度方向上，一次在高度方向上。這兩次操作分別得到兩個特征映射：

在寬度方向上的平均池化得到特征映射 [C, H, 1]。
在高度方向上的平均池化得到特征映射 [C, 1, W]。

這兩個特征映射分別捕捉了在寬度和高度方向上的全局特征。

3. 合并寬高特征：將上述兩個特征映射合并，通常通過簡單的堆疊操作，得到一個新的特征層，形狀為 [C, 1, H + W]，其中 H + W 表示在寬度和高度兩個方向上的維度合并在一起。

4. 卷積+標準化+激活函數(shù)：對合并后的特征層進行卷積操作，通常是 1x1 卷積，以捕捉寬度和高度維度之間的關(guān)系。然后，通常會應用標準化（如批量標準化）和激活函數(shù)（如ReLU）來進一步處理特征，得到一個更加豐富的表示。

5. 再次分開：分別從上述特征層中分離出寬度和高度方向的特征：

一個分支得到特征層 [C, 1, H]。
另一個分支得到特征層 [C, 1, W]。

6. 轉(zhuǎn)置：對分開的兩個特征層進行轉(zhuǎn)置操作，以恢復寬度和高度的維度，得到兩個特征層分別為 [C, H, 1] 和 [C, 1, W]。

7. 通道調(diào)整和 Sigmoid：對兩個分開的特征層分別應用 1x1 卷積，以調(diào)整通道數(shù)，使其適應注意力計算。然后，應用 Sigmoid 激活函數(shù)，得到在寬度和高度維度上的注意力分數(shù)。這些分數(shù)用于指示不同位置的重要性。

8. 應用注意力：將原始輸入特征圖與寬度和高度方向上的注意力分數(shù)相乘，得到 CA 注意力機制的輸出。

?文章來源地址http://www.zghlxwxcb.cn/news/detail-712989.html

2. YOLOv8添加CA注意力機制

加入注意力機制，在ultralytics包中的nn包的modules里添加CA注意力模塊，我這里選擇在conv.py文件中添加CA注意力機制。

ca注意力機制,YOLO改進系列,YOLO,算法,人工智能

CA注意力機制代碼如下:

import torch
import torch.nn as nn
import torch.nn.functional as F


class h_sigmoid(nn.Module):
    def __init__(self, inplace=True):
        super(h_sigmoid, self).__init__()
        self.relu = nn.ReLU6(inplace=inplace)

    def forward(self, x):
        return self.relu(x + 3) / 6


class h_swish(nn.Module):
    def __init__(self, inplace=True):
        super(h_swish, self).__init__()
        self.sigmoid = h_sigmoid(inplace=inplace)

    def forward(self, x):
        return x * self.sigmoid(x)


class CoordAtt(nn.Module):
    def __init__(self, inp, reduction=32):
        super(CoordAtt, self).__init__()
        self.pool_h = nn.AdaptiveAvgPool2d((None, 1))
        self.pool_w = nn.AdaptiveAvgPool2d((1, None))

        mip = max(8, inp // reduction)

        self.conv1 = nn.Conv2d(inp, mip, kernel_size=1, stride=1, padding=0)
        self.bn1 = nn.BatchNorm2d(mip)
        self.act = h_swish()

        self.conv_h = nn.Conv2d(mip, inp, kernel_size=1, stride=1, padding=0)
        self.conv_w = nn.Conv2d(mip, inp, kernel_size=1, stride=1, padding=0)

    def forward(self, x):
        identity = x

        n, c, h, w = x.size()
        x_h = self.pool_h(x)
        x_w = self.pool_w(x).permute(0, 1, 3, 2)

        y = torch.cat([x_h, x_w], dim=2)
        y = self.conv1(y)
        y = self.bn1(y)
        y = self.act(y)

        x_h, x_w = torch.split(y, [h, w], dim=2)
        x_w = x_w.permute(0, 1, 3, 2)

        a_h = self.conv_h(x_h).sigmoid()
        a_w = self.conv_w(x_w).sigmoid()

        out = identity * a_w * a_h

        return out

CA注意力機制的注冊和引用如下：

?ultralytics/nn/modules/_init_.py文件中：

ca注意力機制,YOLO改進系列,YOLO,算法,人工智能

??ultralytics/nn/tasks.py文件夾中：

ca注意力機制,YOLO改進系列,YOLO,算法,人工智能

?在tasks.py中的parse_model中添加如下代碼：

        elif m in {CoordAtt}:
            args=[ch[f],*args]

新建相應的yolov8s-CA.yaml文件，代碼如下：

# Ultralytics YOLO ??, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect

# Parameters
nc: 80  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPs
  s: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPs
  m: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPs
  l: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs
  x: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4
  - [-1, 3, C2f, [128, True]]
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8
  - [-1, 6, C2f, [256, True]]
  - [-1,1,CoordAtt,[]]
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16
  - [-1, 6, C2f, [512, True]]
  - [-1,1,CoordAtt,[]]
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32
  - [-1, 3, C2f, [1024, True]]
  - [-1,1,CoordAtt,[]]
  - [-1, 1, SPPF, [1024, 5]]  # 9

# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 8], 1, Concat, [1]]  # cat backbone P4
  - [-1, 3, C2f, [512]]  # 12

  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 5], 1, Concat, [1]]  # cat backbone P3
  - [-1, 3, C2f, [256]]  # 15 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 15], 1, Concat, [1]]  # cat head P4
  - [-1, 3, C2f, [512]]  # 18 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 12], 1, Concat, [1]]  # cat head P5
  - [-1, 3, C2f, [1024]]  # 21 (P5/32-large)

  - [[18, 21, 24], 1, Detect, [nc]]  # Detect(P3, P4, P5)

在main.py文件中進行訓練：

if __name__ == '__main__':

    # 使用yaml配置文件來創(chuàng)建模型,并導入預訓練權(quán)重.
    model = YOLO('ultralytics/cfg/models/v8/yolov8s-CA.yaml')
    # model.load('yolov8n.pt')
    model.train(**{'cfg': 'ultralytics/cfg/default.yaml', 'data': 'dataset/data.yaml'})

?

?

到了這里，關(guān)于YOLOv8改進算法之添加CA注意力機制的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務器費用

改進YOLO系列：改進YOLOv8，教你YOLOv8如何添加20多種注意力機制，并實驗不同位置。
注意力機制（Attention Mechanism）是深度學習中一種重要的技術(shù)，它可以幫助模型更好地關(guān)注輸入數(shù)據(jù)中的關(guān)鍵信息，從而提高模型的性能。注意力機制最早在自然語言處理領(lǐng)域的序列到序列（seq2seq）模型中得到廣泛應用，后來逐漸擴展到了計算機視覺、語音識別等多個領(lǐng)域。
2024年02月16日
瀏覽(32)
YOLOV8改進：在C2f模塊不同位置添加注意力機制
本文以CBAM注意力機制為例，在c2f模塊的不同位置添加注意力機制，沒有用v8自帶的CBAM模塊，而是自己之前用過的代碼。 CBAM簡單介紹： CBAM這是一種用于前饋卷積神經(jīng)網(wǎng)絡的簡單而有效的注意模塊。給定一個中間特征圖，我們的模塊會沿著兩個獨立的維度（通道和空間）依次
2024年02月11日
瀏覽(22)
YOLOv8改進 | 如何在網(wǎng)絡結(jié)構(gòu)中添加注意力機制、C2f、卷積、Neck、檢測頭
本篇文章的內(nèi)容是在大家得到一個改進版本的 C2f一個新的注意力機制、或者一個新的卷積模塊、或者是檢測頭的時候如何替換我們YOLOv8模型中的原有的模塊，從而用你的模塊去進行訓練模型或者檢測。因為最近開了一個專欄里面涉及到挺多改進的地方，不能每篇文章都去講
2024年02月05日
瀏覽(50)
YOLOv8、YOLOv7、YOLOv5改進注意力機制：首發(fā)最全匯總 | S2A, SE,SimAM, SKA,ShA, SOCA, CA, CBAM, CrissCrossA, NAM, GAM等
??統(tǒng)一使用 YOLOv5 代碼框架，結(jié)合不同模塊來構(gòu)建不同的YOLO目標檢測模型。 ??本項目包含大量的改進方式,降低改進難度,改進點包含【Backbone特征主干】、【Neck特征融合】、【Head檢測頭】、【注意力機制】、【IoU損失函數(shù)】、【NMS】、【Loss計算方式】、【自注
2024年02月06日
瀏覽(34)
改進YOLOv8 | 即插即用篇 | 手把手教你 YOLOv8 添加注意力機制 | 適用于【檢測任務】【分類任務】【分割任務】【關(guān)鍵點任務】| 20+ 種全打通！
??更新日志 2023/5/23 更改 DoubleAttention 寫法。 2023/10/12 更改博文，適配最新版添加方式。視頻教程地址-嗶哩嗶哩
2024年02月07日
瀏覽(33)
[YOLOv7/YOLOv5系列算法改進NO.4]添加ECA通道注意力機制
?前? ? ? 言作為當前先進的深度學習目標檢測算法YOLOv5，已經(jīng)集合了大量的trick，但是在處理一些復雜背景問題的時候，還是容易出現(xiàn)錯漏檢的問題。此后的系列文章，將重點對YOLOv5的如何改進進行詳細的介紹，目的是為了給那些搞科研的同學需要創(chuàng)新點或者搞工程項目的
2024年02月05日
瀏覽(28)
改進YOLOv8/YOLOv5系列：助力漲點，魔改注意力，動態(tài)通道注意力模塊DyCAConv，帶改進描述
在深度學習領(lǐng)域，尤其是計算機視覺任務中，神經(jīng)網(wǎng)絡需要捕捉圖像中的多尺度特征以實現(xiàn)有效的特征表征。為了實現(xiàn)這一目標，研究人員不斷開發(fā)新的模塊和結(jié)構(gòu)來改進神經(jīng)網(wǎng)絡的性能。通道注意力模塊是一種有效的方法，旨在為每個通道分配權(quán)重，使網(wǎng)絡關(guān)注更重要的通
2023年04月25日
瀏覽(31)
YOLOv8算法改進【NO.92】使用大核分離卷積注意力模塊Large Separable Kernel Attention（LSKA）改進SPPF模塊
?前? ?言 ? ? ? ?YOLO算法改進系列出到這，很多朋友問改進如何選擇是最佳的，下面我就根據(jù)個人多年的寫作發(fā)文章以及指導發(fā)文章的經(jīng)驗來看，按照優(yōu)先順序進行排序講解YOLO算法改進方法的順序選擇。具體有需求的同學可以私信我溝通：第一，創(chuàng)新主干特征提取網(wǎng)絡，
2024年03月23日
瀏覽(20)
YOLOv5、YOLOv8改進：S2注意力機制
目錄 1.簡介 2.YOLOv5改進 2.1增加以下S2-MLPv2.yaml文件 2.2common.py配置 2.3yolo.py配置 ?S2-MLPv2注意力機制 ? 最近，出現(xiàn)了基于 MLP 的視覺主干。與 CNN 和視覺Transformer相比，基于 MLP 的視覺架構(gòu)具有較少的歸納偏差，在圖像識別方面實現(xiàn)了有競爭力的性能。其中，spatial-shift MLP (S2-MLP)，
2024年02月12日
瀏覽(22)
YOLOv8改進 | 注意力篇 | ACmix自注意力與卷積混合模型（提高FPS+檢測效率）
本文給大家?guī)淼母倪M機制是 ACmix自注意力機制的改進版本，它的核心思想是，傳統(tǒng)卷積操作和自注意力模塊的大部分計算都可以通過1x1的卷積來實現(xiàn)。ACmix首先使用1x1卷積對輸入特征圖進行投影，生成一組中間特征，然后根據(jù)不同的范式，即自注意力和卷積方式，分別重用
2024年02月03日
瀏覽(25)

<noscript id="pbrbp"><pre id="pbrbp"></pre></noscript>