国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

2年前作者：daige123分類(lèi)：Toy博客閱讀(17)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

在目標(biāo)檢測(cè)網(wǎng)絡(luò)里加注意力機(jī)制已經(jīng)是很常見(jiàn)的了，顧名思義，注意力機(jī)制是指在全局圖像中獲得重點(diǎn)關(guān)注的目標(biāo)，常用的注意力機(jī)制有SE、CA、ECA、CBAM、GAM、NAM等。

1、SE模塊

論文：https://arxiv.org/pdf/1709.01507.pdf

參考：CV領(lǐng)域常用的注意力機(jī)制模塊（SE、CBAM）_學(xué)學(xué)沒(méi)完的博客-CSDN博客_se注意力機(jī)制

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

?SE模塊主要包括Squeeze和Excitation兩個(gè)部分

Squeeze是Global pooling，對(duì)特征進(jìn)行壓縮；

Excitation是通過(guò)兩層全連接結(jié)構(gòu)得到feature map中每個(gè)通道的權(quán)值，并將加權(quán)后的feature map作為下一層網(wǎng)絡(luò)的輸入。

在ECA的論文中表示，SE結(jié)構(gòu)的降維操作對(duì)通道注意有副作用。

class SELayer(nn.Module):
    def __init__(self, channel, reduction=16):
        super(SELayer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(inplace=True),
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )

    def forward(self, x):
        b, c, _, _ = x.size()
        y = self.avg_pool(x).view(b, c)
        y = self.fc(y).view(b, c, 1, 1)
        return x * y.expand_as(x)

2、CA模塊（Coordinate attention）

論文：https://arxiv.org/abs/2103.02907

參考：CA(Coordinate attention) 注意力機(jī)制 - 知乎 (zhihu.com)

CVPR 2021 | 即插即用！ CA：新注意力機(jī)制，助力分類(lèi)/檢測(cè)/分割漲點(diǎn)！_Amusi（CVer）的博客-CSDN博客

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

CVPR 2021 | 即插即用！ CA：新注意力機(jī)制，助力分類(lèi)/檢測(cè)/分割漲點(diǎn)！_Amusi（CVer）的博客-CSDN博客CA對(duì)寬度和高度兩個(gè)方向分別全局平均池化，分別獲得在寬度和高度兩個(gè)方向的特征圖，然后將兩個(gè)方向的特征圖concat，然后送入共享卷積將維度降為C/r，再通過(guò)批量歸一化處理和激活函數(shù)后得到特征圖。

import torch
from torch import nn
 
 
class CA_Block(nn.Module):
    def __init__(self, channel, h, w, reduction=16):
        super(CA_Block, self).__init__()
 
        self.h = h
        self.w = w
 
        self.avg_pool_x = nn.AdaptiveAvgPool2d((h, 1))
        self.avg_pool_y = nn.AdaptiveAvgPool2d((1, w))
 
        self.conv_1x1 = nn.Conv2d(in_channels=channel, out_channels=channel//reduction, kernel_size=1, stride=1, bias=False)
 
        self.relu = nn.ReLU()
        self.bn = nn.BatchNorm2d(channel//reduction)
 
        self.F_h = nn.Conv2d(in_channels=channel//reduction, out_channels=channel, kernel_size=1, stride=1, bias=False)
        self.F_w = nn.Conv2d(in_channels=channel//reduction, out_channels=channel, kernel_size=1, stride=1, bias=False)
 
        self.sigmoid_h = nn.Sigmoid()
        self.sigmoid_w = nn.Sigmoid()
 
    def forward(self, x):
 
        x_h = self.avg_pool_x(x).permute(0, 1, 3, 2)
        x_w = self.avg_pool_y(x)
 
        x_cat_conv_relu = self.relu(self.conv_1x1(torch.cat((x_h, x_w), 3)))
 
        x_cat_conv_split_h, x_cat_conv_split_w = x_cat_conv_relu.split([self.h, self.w], 3)
 
        s_h = self.sigmoid_h(self.F_h(x_cat_conv_split_h.permute(0, 1, 3, 2)))
        s_w = self.sigmoid_w(self.F_w(x_cat_conv_split_w))
 
        out = x * s_h.expand_as(x) * s_w.expand_as(x)
 
        return out
 
 
if __name__ == '__main__':
    x = torch.randn(1, 16, 128, 64)    # b, c, h, w
    ca_model = CA_Block(channel=16, h=128, w=64)
    y = ca_model(x)
    print(y.shape)

?3、ECA模塊

論文：(PDF) ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks (researchgate.net)

參考：注意力機(jī)制（SE、Coordinate Attention、CBAM、ECA，SimAM）、即插即用的模塊整理_吳大炮的博客-CSDN博客_se注意力機(jī)制

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

ECA首先通過(guò)全局平均池化，然后利用卷積進(jìn)行特征提取，實(shí)現(xiàn)跨通道的交互。

4、CBAM模塊

論文：?[1807.06521] CBAM：卷積塊注意模塊 (arxiv.org)

參考：注意力機(jī)制之《CBAM: Convolutional Block Attention Module》論文閱讀_落櫻彌城的博客-CSDN博客

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用） ?

CBAM模塊分為channel-wise attention和spatial attention，通道注意力和SE結(jié)構(gòu)相同，只是加了一個(gè)maxpooling，中間共享一個(gè)MLP，最后將兩部分的輸出相加經(jīng)過(guò)sigmoid。

空間注意力使用平均池化和最大池化對(duì)輸入特征層進(jìn)行通道壓縮，在使用卷積操作。

class ChannelAttention(nn.Module):
    def __init__(self, in_planes, ratio=16):
        super(ChannelAttention, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.max_pool = nn.AdaptiveMaxPool2d(1)

        self.fc1   = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)
        self.relu1 = nn.ReLU()
        self.fc2   = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)

        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = self.fc2(self.relu1(self.fc1(self.avg_pool(x))))
        max_out = self.fc2(self.relu1(self.fc1(self.max_pool(x))))
        out = avg_out + max_out
        return self.sigmoid(out)

class SpatialAttention(nn.Module):
    def __init__(self, kernel_size=7):
        super(SpatialAttention, self).__init__()

        assert kernel_size in (3, 7), 'kernel size must be 3 or 7'
        padding = 3 if kernel_size == 7 else 1

        self.conv1 = nn.Conv2d(2, 1, kernel_size, padding=padding, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = torch.mean(x, dim=1, keepdim=True)
        max_out, _ = torch.max(x, dim=1, keepdim=True)
        x = torch.cat([avg_out, max_out], dim=1)
        x = self.conv1(x)
        return self.sigmoid(x)

5、GAM模塊

論文：https://paperswithcode.com/paper/global-attention-mechanism-retain-information

GAM注意力機(jī)制分為兩個(gè)模塊：CAM和SAM，通道注意是學(xué)習(xí)不同通道的權(quán)值，并用權(quán)值對(duì)不同通道進(jìn)行多重劃分，空間注意關(guān)注目標(biāo)在圖像上的位置信息，并通過(guò)空間特征的加權(quán)選擇性的聚焦每個(gè)空間的特征。

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

?通道注意力模塊首先重新排列圖像三維信息，然后通過(guò)MLP來(lái)放大跨維通道空間，如圖6所示。在空間注意子模塊中，使用兩個(gè)卷積層進(jìn)行空間信息融合，如圖7所示，這樣使通道更能關(guān)注空間信息。

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

import torch.nn as nn
import torch
 
 
class GAM_Attention(nn.Module):
    def __init__(self, in_channels, out_channels, rate=4):
        super(GAM_Attention, self).__init__()
 
        self.channel_attention = nn.Sequential(
            nn.Linear(in_channels, int(in_channels / rate)),
            nn.ReLU(inplace=True),
            nn.Linear(int(in_channels / rate), in_channels)
        )
 
        self.spatial_attention = nn.Sequential(
            nn.Conv2d(in_channels, int(in_channels / rate), kernel_size=7, padding=3),
            nn.BatchNorm2d(int(in_channels / rate)),
            nn.ReLU(inplace=True),
            nn.Conv2d(int(in_channels / rate), out_channels, kernel_size=7, padding=3),
            nn.BatchNorm2d(out_channels)
        )
 
    def forward(self, x):
        b, c, h, w = x.shape
        x_permute = x.permute(0, 2, 3, 1).view(b, -1, c)
        x_att_permute = self.channel_attention(x_permute).view(b, h, w, c)
        x_channel_att = x_att_permute.permute(0, 3, 1, 2)
 
        x = x * x_channel_att
 
        x_spatial_att = self.spatial_attention(x).sigmoid()
        out = x * x_spatial_att
 
        return out
 
 
if __name__ == '__main__':
    x = torch.randn(1, 64, 32, 48)
    b, c, h, w = x.shape
    net = GAM_Attention(in_channels=c, out_channels=c)
    y = net(x)

?6、NAM模塊

論文：https://arxiv.org/abs/2111.12419

參考：https://cloud.tencent.com/developer/article/1909196

NAM采用CBAM的模塊整合，重新設(shè)計(jì)了通道和空間注意子模塊。在通道注意模塊中使用批歸一化中的比例因子。并且將其也運(yùn)用到空間維度，來(lái)衡量像素的重要性。

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）

學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-456725.html

import torch.nn as nn
import torch
from torch.nn import functional as F


# 具體流程可以參考圖1，通道注意力機(jī)制
class Channel_Att(nn.Module):
    def __init__(self, channels, t=16):
        super(Channel_Att, self).__init__()
        self.channels = channels
        self.bn2 = nn.BatchNorm2d(self.channels, affine=True)


    def forward(self, x):
        residual = x
        x = self.bn2(x)
        # 式2的計(jì)算，即Mc的計(jì)算
        weight_bn = self.bn2.weight.data.abs() / torch.sum(self.bn2.weight.data.abs())
        x = x.permute(0, 2, 3, 1).contiguous()
        x = torch.mul(weight_bn, x)
        x = x.permute(0, 3, 1, 2).contiguous()
        x = torch.sigmoid(x) * residual #
        
        return x


class Att(nn.Module):Yichao Liu, 2 months ago: ? Add files via upload
    def __init__(self, channels,shape, out_channels=None, no_spatial=True):
        super(Att, self).__init__()
        self.Channel_Att = Channel_Att(channels)
  
    def forward(self, x):
        x_out1=self.Channel_Att(x)
 
        return x_out1

到了這里，關(guān)于學(xué)習(xí)筆記1——常用的注意力機(jī)制（即插即用）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀(guān)點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

CVPR2023 即插即用系列 | 一種高效輕量的自注意力機(jī)制助力圖像恢復(fù)網(wǎng)絡(luò)問(wèn)鼎SOTA！
Title: Efficient and Explicit Modelling of Image Hierarchies for Image Restoration PDF: https://arxiv.org/pdf/2303.00748 Code: https://github.com/ofsoundof/GRL-Image-Restoration.git 全局，區(qū)域和局部范圍的特征可以很好地被神經(jīng)網(wǎng)絡(luò)用于圖像恢復(fù)任務(wù)，本文提出了一種基于錨點(diǎn) Anchored 的條紋自注意力機(jī)制用于實(shí)現(xiàn)全
2024年02月04日
瀏覽(26)
YOLOv7改進(jìn)注意力機(jī)制系列：最新結(jié)合即插即用CA(Coordinate attention) 注意力機(jī)制(適用于YOLOv5)，CVPR 2021 頂會(huì)助力分類(lèi)檢測(cè)漲點(diǎn)！
??統(tǒng)一使用 YOLOv5、YOLOv7 代碼框架，結(jié)合不同模塊來(lái)構(gòu)建不同的YOLO目標(biāo)檢測(cè)模型。論文所提的 Coordinate注意力很簡(jiǎn)單，可以靈活地插入到經(jīng)典的移動(dòng)網(wǎng)絡(luò)中，而且?guī)缀鯖](méi)有計(jì)算開(kāi)銷(xiāo)。大量實(shí)驗(yàn)表明，Coordinate注意力不僅有益于ImageNet分類(lèi)，而且更有趣的是，它在下游任務(wù)（如
2024年02月05日
瀏覽(28)
即插即用的漲點(diǎn)模塊之注意力機(jī)制（CBAMAttention）詳解及代碼，可應(yīng)用于檢測(cè)、分割、分類(lèi)等各種算法領(lǐng)域
目錄前言一、CBAM結(jié)構(gòu) 二、CBAM計(jì)算流程三、CBAM參數(shù) 四、代碼詳解 ????????CE模塊通常只注意了通道特征，但在視覺(jué)任務(wù)中，空間任務(wù)通常更為重要，是不可忽略的，因此CBAM將通道注意力機(jī)制與空間注意力機(jī)制進(jìn)行串聯(lián)，充分關(guān)注特征信息。 ????????什么是空間特征
2024年04月28日
瀏覽(21)
改進(jìn)YOLOv8 | 即插即用篇 | C2F模塊增加注意力機(jī)制 | 附詳細(xì)結(jié)構(gòu)圖計(jì)算機(jī)視覺(jué)
摘要：本文針對(duì)目標(biāo)檢測(cè)算法YOLOv8進(jìn)行改進(jìn)，通過(guò)在C2F模塊中引入注意力機(jī)制，提高目標(biāo)的定位和分類(lèi)性能。文章首先介紹了YOLOv8的基本原理和結(jié)構(gòu)，然后詳細(xì)闡述了注意力機(jī)制的原理和作用，并對(duì)修改后的C2F模塊結(jié)構(gòu)進(jìn)行了說(shuō)明。最后，給出了實(shí)驗(yàn)結(jié)果和源代碼。引言目
2024年02月04日
瀏覽(677)
改進(jìn)YOLOv8 | C2F模塊中引入注意力機(jī)制的即插即用方法 | 詳細(xì)結(jié)構(gòu)圖與計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)
概述：在計(jì)算機(jī)視覺(jué)領(lǐng)域，YOLOv8是一種常用的目標(biāo)檢測(cè)算法，而C2F模塊是YOLOv8的核心組成部分之一。為了進(jìn)一步提升YOLOv8的檢測(cè)性能，本文將介紹如何通過(guò)添加注意力機(jī)制來(lái)改進(jìn)C2F模塊。我們將詳細(xì)討論這一改進(jìn)方法，并提供相應(yīng)的源代碼，以便讀者可以直接使用。引言：
2024年04月15日
瀏覽(757)
CBAM——即插即用的注意力模塊（附代碼）
論文：CBAM: Convolutional Block Attention Module 代碼：?code 目錄前言 1.什么是CBAM？（1）Channel attention module（CAM）（2）Spatial attention module（SAM）（3）CAM和SAM組合形式 2.消融實(shí)驗(yàn) （1）Channel attention （2）Spatial attention （3）Channel attention+spatial attention 3.圖像分類(lèi) 4.目標(biāo)檢測(cè) 5.CBAM可視
2024年02月02日
瀏覽(22)
即插即用篇 | YOLOv8 引入 S2 注意力機(jī)制 | 《S^2-MLPV2: IMPROVED SPATIAL-SHIFT MLP ARCHITECTURE FOR VISION》
論文名稱(chēng)：《S^2-MLPV2: IMPROVED SPATIAL-SHIFT MLP ARCHITECTURE FOR VISION》論文地址：https://arxiv.org/pdf/2108.01072.pdf
2024年04月16日
瀏覽(33)
改進(jìn)YOLOv8 | 即插即用篇 | 手把手教你 YOLOv8 添加注意力機(jī)制 | 適用于【檢測(cè)任務(wù)】【分類(lèi)任務(wù)】【分割任務(wù)】【關(guān)鍵點(diǎn)任務(wù)】| 20+ 種全打通！
??更新日志 2023/5/23 更改 DoubleAttention 寫(xiě)法。 2023/10/12 更改博文，適配最新版添加方式。視頻教程地址-嗶哩嗶哩
2024年02月07日
瀏覽(33)
【YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改進(jìn)NO.64】即插即用新的注意力機(jī)制RFAConv
?前言作為當(dāng)前先進(jìn)的深度學(xué)習(xí)目標(biāo)檢測(cè)算法YOLOv8，已經(jīng)集合了大量的trick，但是還是有提高和改進(jìn)的空間，針對(duì)具體應(yīng)用場(chǎng)景下的檢測(cè)難點(diǎn)，可以不同的改進(jìn)方法。此后的系列文章，將重點(diǎn)對(duì)YOLOv8的如何改進(jìn)進(jìn)行詳細(xì)的介紹，目的是為了給那些搞科研的同學(xué)需要?jiǎng)?chuàng)新點(diǎn)或者
2024年02月02日
瀏覽(61)
CVPR‘2023 即插即用系列! | BiFormer: 通過(guò)雙向路由注意力構(gòu)建高效金字塔網(wǎng)絡(luò)架構(gòu)
Title: BiFormer: Vision Transformer with Bi-Level Routing Attention Paper: https://arxiv.org/pdf/2303.08810.pdf Code: https://github.com/rayleizhu/BiFormer 眾所周知， Transformer 相比于 CNNs 的一大核心優(yōu)勢(shì)便是借助自注意力機(jī)制的優(yōu)勢(shì)捕捉長(zhǎng)距離上下文依賴(lài) 。正所謂物極必反，在原始的 Transformer 架構(gòu)設(shè)計(jì)中，這
2023年04月09日
瀏覽(18)

<address id="9dosd"><pre id="9dosd"></pre></address>

<th id="9dosd"><input id="9dosd"></input></th>