国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法

這篇具有很好參考價值的文章主要介紹了昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

Img2col 卷積加速算法


一、Img2col是什么?

Img2col 通過矩陣乘法實現(xiàn)卷積的加速運算的方法,該方法被廣泛應(yīng)用在CPU、GPU等通用計算芯片上。同時在一些特定域結(jié)構(gòu)(Domain Specific Architecture , DSA)上,比如華為的昇騰AI處理機中,使用了Img2col為需要進行卷積運算的矩陣進行了預(yù)處理。

二、CNN中的卷積運算

CNN(Convolutional Neural Network)網(wǎng)絡(luò)中,相對于FCNN(Fully Connected Neural Network)網(wǎng)絡(luò)引入了權(quán)重共享的概念。大大降低了神經(jīng)網(wǎng)絡(luò)運算過程中的參數(shù)量級。

以單通道輸入的第一層卷積層為例,卷積核大小為33。第一層卷積運算需要對輸入層的數(shù)據(jù)使用第一層卷積核(濾波器)進行卷積運算。輸入層的矩陣可以很大,每一次卷積運算都只會針對輸入層中一個33的區(qū)域(感受野)進行卷積運算。運算結(jié)束后通過移動卷積核位置(滑動步長)對下一個感受野進行卷積運算。每一次卷積運算會輸出一個數(shù)據(jù)。當卷積核掃描完整個矩陣,則輸出一個和輸入相同長寬的矩陣(數(shù)據(jù)矩陣需要對邊沿進行補零)。
昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法

昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法
可以發(fā)現(xiàn),這個過程中,每一次矩陣運算只能對一個感受野中的輸入數(shù)據(jù)進行運算,要運算完整個輸入矩陣,需要多次卷積運算(多線程)。根據(jù)體系結(jié)構(gòu)分析,整個輸入矩陣在內(nèi)存中保持的位置是連續(xù)的,如果緩存塊(Cache line)不夠大的話,一個感受野中的9個數(shù)據(jù)會被保持在不同的Cache line中,導(dǎo)致數(shù)據(jù)不連續(xù),會頻繁造成緩存缺失,導(dǎo)致產(chǎn)生較大的訪存開銷。這會嚴重拖慢處理器的運算速度。

三、Img2col對卷積運算加速

對于這個問題,已經(jīng)有一些解決方法,比如使用FFT對卷積運算進行加速,或者更簡單一點的方法是使用Img2col對輸入數(shù)據(jù)進行預(yù)處理。
昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法
昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法
將輸入矩陣的每一個感受野展開為一個9元素向量。如圖中的X1、X2感受野。將所有感受野拉成的向量拼接組合成一個新的矩陣XI2C。

同理將卷積核也拉成9元素向量。圖中該卷積核只有兩個矩陣,所以只有兩個9元素向量。將兩向量拼接得到矩陣WI2C。

將偏置b也拉成同樣的矩陣??赏ㄟ^如下圖的方式,實現(xiàn)用矩陣乘法實現(xiàn)卷積運算。對比同樣使用同樣的處理機進行運算。以每一行和列的運算為一個線程劃分。

(1)如果直接進行卷積運算,每一個線程需要讀取一個感受野中的數(shù)據(jù)、兩個卷積矩陣的數(shù)據(jù)和1個偏置數(shù)據(jù)b。這個過程中,感受野數(shù)據(jù)由于在內(nèi)存中不連續(xù),每一個線程都會造成緩存缺失,導(dǎo)致線程堵塞,性能變差。

(2)如果對Img2col對輸入矩陣進行預(yù)處理,則將卷積運算變?yōu)榱诵辛谐思拥木仃嚦?。以矩陣XI2C的每一行與矩陣W12C的每一列之間的向量內(nèi)積運算為一個線程。每個線程需要從內(nèi)存中取出XI2C的一行數(shù)據(jù)、矩陣WI2C的一列數(shù)據(jù)和矩陣bI2C的一列數(shù)據(jù)。這里的所有數(shù)據(jù)在內(nèi)存空間都是連續(xù)的。所以不會造成緩存缺失。所以運算速度加快。
昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法
還能進一步改進,偏置b矩陣和矩陣XI2C合并,省略了一次矩陣的加法運算。進一步提升運算速度。
昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法

圖片引用1:https://blog.csdn.net/weixin_42863507/article/details/106320968?spm=1001.2101.3001.6650.11&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-11.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-11.pc_relevant_aa&utm_relevant_index=15
圖片引用2:昇騰AI處理器 架構(gòu)與編程 第1章 基礎(chǔ)理論文章來源地址http://www.zghlxwxcb.cn/news/detail-446815.html

到了這里,關(guān)于昇騰AI處理機_學(xué)習(xí)筆記一:Img2col 卷積加速算法的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 操作系統(tǒng)實驗——處理機調(diào)度算法(C語言)

    操作系統(tǒng)實驗——處理機調(diào)度算法(C語言)

    目錄 實驗要求 代碼實現(xiàn) 運行結(jié)果 代碼解析 ? 1、設(shè)定系統(tǒng)中進程數(shù),每一個進程用一個進程控制塊表示。 2、輸入每個進程的“優(yōu)先數(shù)”和“要求運行時間”。 3、為了調(diào)度方便,將進程按給定的優(yōu)先數(shù)從大到小連成就緒隊列。用一單元指出隊列首進程 4、處理機調(diào)度總是選

    2023年04月27日
    瀏覽(19)
  • 【第三章 | 處理機調(diào)度與死鎖】《操作系統(tǒng) 慕課版》課后答案 + 復(fù)習(xí)

    【第三章 | 處理機調(diào)度與死鎖】《操作系統(tǒng) 慕課版》課后答案 + 復(fù)習(xí)

    目錄 【第三章】處理機調(diào)度與死鎖 | 本章概念 1.處理機調(diào)度概述 2.調(diào)度算法相關(guān)概念 3.實時調(diào)度相關(guān)概念 4.死鎖 5.資源分配圖 | 本章算法 1.周轉(zhuǎn)時間與帶權(quán)周轉(zhuǎn)時間的計算公式 2.調(diào)度算法 FCFS? SJF? PR? RR 3.實時調(diào)度算法 EDF 4.避免死鎖 —— 銀行家算法 | 課后簡答題 1.處理機調(diào)

    2024年02月01日
    瀏覽(25)
  • 編寫C程序模擬實現(xiàn)單處理機系統(tǒng)中進程調(diào)度,實現(xiàn)對多個進程的調(diào)度模擬,要求采用多級反饋隊列調(diào)度算法進行模擬調(diào)度。(江西師范大學(xué))

    編寫C程序模擬實現(xiàn)單處理機系統(tǒng)中進程調(diào)度,實現(xiàn)對多個進程的調(diào)度模擬,要求采用多級反饋隊列調(diào)度算法進行模擬調(diào)度。(江西師范大學(xué))

    編寫C程序模擬實現(xiàn)單處理機系統(tǒng)中進程調(diào)度,實現(xiàn)對多個進程的調(diào)度模擬,要求采用多級反饋隊列調(diào)度算法進行模擬調(diào)度。 數(shù)據(jù)結(jié)構(gòu)設(shè)計:PCB:結(jié)構(gòu)體;就緒隊列:每個節(jié)點為進程PCB;進程狀態(tài) 具體調(diào)度算法:FCFS、SJF、PR;涉及多種操作:排序、鏈表操作 程序輸出設(shè)計:調(diào)

    2024年02月04日
    瀏覽(30)
  • 學(xué)習(xí)筆記:在華為昇騰NPU上進行深度學(xué)習(xí)項目【未完待續(xù)】

    昇騰社區(qū)鏈接: 昇騰社區(qū)-官網(wǎng)丨昇騰萬里 讓智能無所不及 第一種:在cpu或gpu上訓(xùn)練的模型,但要在NPU上執(zhí)行模型推理; 第二種:在NPU上同步訓(xùn)練、推理。 中括號里的為查詢結(jié)果示例。 – 查看系統(tǒng)架構(gòu): uname -a [aarch64,也稱arm64] – 查看操作系統(tǒng)版本: lsb_release -a [Ubuntu

    2024年01月18日
    瀏覽(19)
  • 【大廠AI課學(xué)習(xí)筆記】【2.2機器學(xué)習(xí)開發(fā)任務(wù)實例】(3)數(shù)據(jù)準備和數(shù)據(jù)預(yù)處理

    【大廠AI課學(xué)習(xí)筆記】【2.2機器學(xué)習(xí)開發(fā)任務(wù)實例】(3)數(shù)據(jù)準備和數(shù)據(jù)預(yù)處理

    項目開始,首先要進行數(shù)據(jù)準備和數(shù)據(jù)預(yù)處理。 數(shù)據(jù)準備的核心是找到這些數(shù)據(jù),觀察數(shù)據(jù)的問題。 數(shù)據(jù)預(yù)處理就是去掉臟數(shù)據(jù)。 缺失值的處理,格式轉(zhuǎn)換等。 延伸學(xué)習(xí): 在人工智能(AI)的眾多工作流程中,數(shù)據(jù)準備與預(yù)處理占據(jù)著舉足輕重的地位。這兩個步驟不僅影響

    2024年02月19日
    瀏覽(29)
  • 昇騰實戰(zhàn)丨DVPP媒體數(shù)據(jù)處理圖片解碼問題案例

    摘要: 本期就分享幾個關(guān)于DVPP圖片解碼問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區(qū)《DVPP媒體數(shù)據(jù)處理圖片解碼問題案例》,作者:昇騰CANN 。 DVPP(Digital Vision Pre-Processing)是昇騰AI處理器內(nèi)置的圖像處理單元,通過AscendCL媒體數(shù)據(jù)處理接口提供強

    2024年02月08日
    瀏覽(18)
  • 信創(chuàng)AI背景下,走進遙遙領(lǐng)先的華為昇騰算力

    信創(chuàng)AI背景下,走進遙遙領(lǐng)先的華為昇騰算力

    目錄: 0.主要結(jié)論 1.研究背景 2.研究目的 3.研究結(jié)果 4.結(jié)論or疑問 敢立潮頭的勇氣和擔當值得敬佩。信創(chuàng)AI背景下,華為AI算力逐漸成長為國內(nèi)市場頂端,也是國內(nèi)敢于和英偉達掰手腕的產(chǎn)商。【昇騰的計算性能配置可持平A100】 產(chǎn)品力仍是消費者用腳投票的主要驅(qū)動力。雖有

    2024年01月23日
    瀏覽(21)
  • 昇騰CANN DVPP硬件加速訓(xùn)練數(shù)據(jù)預(yù)處理,友好解決Host CPU預(yù)處理瓶

    本文分享自華為云社區(qū)《昇騰CANN 7.0 黑科技:DVPP硬件加速訓(xùn)練數(shù)據(jù)預(yù)處理,友好解決Host CPU預(yù)處理瓶頸》,作者: 昇騰CANN 。 隨著人工智能的快速發(fā)展,越來越多的應(yīng)用場景需要使用機器學(xué)習(xí)和深度學(xué)習(xí)模型。AI網(wǎng)絡(luò)模型的訓(xùn)練一般分成兩個關(guān)鍵部分,一個是訓(xùn)練數(shù)據(jù)預(yù)處理

    2024年02月05日
    瀏覽(30)
  • AI重塑千行百業(yè),華為云發(fā)布盤古大模型3.0和昇騰AI云服務(wù)

    【中國,東莞,2023年7月7日】華為開發(fā)者大會2023(Cloud)7月7日在中國東莞正式揭開帷幕,并同時在全球10余個國家、中國30多個城市設(shè)有分會場,邀請全球開發(fā)者共聚一堂,就AI浪潮之下的產(chǎn)業(yè)新機會和技術(shù)新實踐開展交流分享。 在7日下午舉行的大會主題演講中,華為常務(wù)董

    2024年02月12日
    瀏覽(21)
  • 昇騰芯片解析:華為自主研發(fā)的人工智能處理器全面分析

    昇騰芯片解析:華為自主研發(fā)的人工智能處理器全面分析

    在當今科技發(fā)展的浪潮中,昇騰芯片作為一種新興的處理器,正引起廣泛的關(guān)注和討論。升騰芯片究竟是由哪家公司生產(chǎn)的?這個問題一直困擾著許多人。下面小編將全面介紹、分析升騰芯片的生產(chǎn)商及各類參數(shù)、應(yīng)用,以便讀者對其有更全面的了解 昇騰 芯片的生產(chǎn)商 升騰

    2024年04月11日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包