国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

計(jì)算攝影——圖像超分

這篇具有很好參考價(jià)值的文章主要介紹了計(jì)算攝影——圖像超分。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

? ? ? ? 這一節(jié)主要介紹一下基于單張圖的圖像超分算法。圖像超分,就是要從低分辨率的圖像恢復(fù)為高分辨率的圖像,它在日常的圖像和視頻存儲(chǔ)與瀏覽中都有廣泛的應(yīng)用。

基于深度學(xué)習(xí)的圖像超分算法

不同的采樣結(jié)構(gòu)

????????圖像超分需要將低分辨率圖片恢復(fù)為高分辨率圖像,因此上采樣結(jié)構(gòu)在網(wǎng)絡(luò)中是必不可少的,因此下面按照上采樣結(jié)構(gòu)在不同CNN模型中的位置來(lái)區(qū)分不同的算法,說(shuō)明一下其原理和優(yōu)缺點(diǎn)。

前上采樣

????????前上采樣即在網(wǎng)絡(luò)的開(kāi)始完成上采樣過(guò)程,經(jīng)典模型為SRCNN模型,其結(jié)構(gòu)如下:

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

SRCNN模型步驟:

  1. 首先使用雙線性插值等上采樣方法進(jìn)行初始化,得到目標(biāo)分辨率大小的圖像。
  2. 使用卷積層對(duì)輸入的局部圖像塊進(jìn)行特征提取,得到一系列特征圖,即f1
  3. 接著使用1x1卷積進(jìn)行維度變換,即擴(kuò)增特征通道數(shù)
  4. 最后將高分辨率的圖像塊重新拼接為完成的圖像,即f3

該模型學(xué)習(xí)過(guò)程比較簡(jiǎn)單,但是由于整個(gè)網(wǎng)絡(luò)在高分辨率空間進(jìn)行計(jì)算,因此計(jì)算量大,而且噪聲容易被放大。

后上采樣

后上采樣即在網(wǎng)絡(luò)的后部分才進(jìn)行上采樣。比較經(jīng)典的模型結(jié)構(gòu)為FSRCNN和ESPCN。

FSRCNN網(wǎng)絡(luò)結(jié)構(gòu)如下:

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

想比SRCNN,主要改進(jìn)在三個(gè)地方:

  1. FSRCNN采用原始低分辨率圖像作為輸入,無(wú)需進(jìn)行雙三次插值,在網(wǎng)絡(luò)末端引入反卷積層來(lái)完成上采樣,極大的減小了網(wǎng)絡(luò)參數(shù)。
  2. 網(wǎng)將SRCNN中的非線性映射層替換為FSRCNN中的三個(gè)層,即收縮、映射和擴(kuò)展,減少特征參數(shù)維度。
  3. 將“寬”的非線性映射層用“**窄”的“深”**的網(wǎng)絡(luò)來(lái)替代。

ESPCN網(wǎng)絡(luò)結(jié)構(gòu)如下:

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

????????該網(wǎng)絡(luò)的關(guān)鍵亮點(diǎn)在于亞像素卷積層,首先介紹一下亞像素的概念:

????????面陣攝像機(jī)的成像面以像素為最小單位。在相機(jī)成像的過(guò)程中,獲得的圖像數(shù)據(jù)是將圖像進(jìn)行了離散化處理。例如兩個(gè)感官元件上的像素之間有4.5um的間距,宏觀上它們是連在一起的,微觀上它們之間還有無(wú)數(shù)更小的東西存在,這個(gè)更小的東西就稱(chēng)之為“亞像素”。實(shí)際上,亞像素應(yīng)該是存在的,只是缺少更細(xì)微的傳感器把它檢測(cè)出來(lái),只能通過(guò)軟件將起近似計(jì)算出來(lái)。

????????如下圖所示,每四個(gè)紅色點(diǎn)圍成的矩形區(qū)域?yàn)閷?shí)際原件上的像素點(diǎn),黑色點(diǎn)為亞像素點(diǎn):

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

????????根據(jù)相鄰兩像素之間插值情況的不同,可以調(diào)整亞像素的精度,例如四分之一,就是將每個(gè)像素從橫向和縱向上當(dāng)做四個(gè)像素點(diǎn)。也就是上面圖里的紅色點(diǎn)之間有三個(gè)黑色點(diǎn)。這樣通過(guò)亞像素插值的方法可以實(shí)現(xiàn)從小矩形到大矩形的映射,從而提高分辨率。

????????在原文中,作者將網(wǎng)絡(luò)模型定義為3層,前兩層為普通卷積,最后的亞像素卷積層則包括兩個(gè)部分,卷積+像素排列。即通過(guò)三個(gè)卷積層,得到與輸入圖像尺寸一致、通道數(shù)為r2的特征圖像,再將特征圖像的每個(gè)像素的r2個(gè)通道重新排列成一個(gè)r * r的區(qū)域,對(duì)應(yīng)高分辨圖像中一個(gè)r * r的區(qū)域,從而大小為H*W*r2的特征圖像重新排列為rH*rW*1的高分辨率圖像。

?逐步式上采樣

為了解決后采樣模型無(wú)法對(duì)高倍率因子進(jìn)行很好的超分的問(wèn)題,逐步式上采樣被提出,比較典型的為L(zhǎng)apSRN,其網(wǎng)絡(luò)結(jié)構(gòu)為:

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

????????其主要包含兩個(gè)分支:特征提取分支(即上圖中上半部分)和圖像重建分支(即圖像中下半部分),其中特征提取分支包含多個(gè)不同分辨率層級(jí),每一個(gè)層級(jí)使用多個(gè)卷積層來(lái)獲取非線性特征映射,最后加上反卷積層來(lái)提升圖像的分辨率;圖像重建分支則將輸入圖進(jìn)行上采樣后和相同分辨率大小的特征提取分支相加來(lái)得到下一級(jí)分辨率的輸出圖,直到得到最終的高分辨率結(jié)果圖。?

優(yōu)化目標(biāo)

????????早期的基于CNN模型的超分框架如SRCNN,ESPCN都使用圖像像素空間的歐式距離(即L2 loss,或者M(jìn)SE損失)作為優(yōu)化目標(biāo),結(jié)果能取得較高的PSNR和SSIM指標(biāo),但是存在結(jié)果過(guò)于平滑的問(wèn)題。

????????人眼對(duì)重建結(jié)果質(zhì)量的感知并不完全與這些指標(biāo)相符,比如MSE指標(biāo)較小并不能保證局部細(xì)節(jié)的清晰度,而較大的MSE指標(biāo)也并不等價(jià)于較差的結(jié)果,比如原圖偏移一個(gè)像素后與原圖的MSE值可能較大,但是視覺(jué)感知效果很接近。

????????CNN網(wǎng)絡(luò)的高層特征空間相比于原始的像素空間,具有較高的抽象層級(jí),它使得原始圖像的特征與目標(biāo)圖像的特征差異可以反應(yīng)在語(yǔ)義級(jí)別,這非常符合人眼的主觀評(píng)估感受,研究者基于此提出了感知損失?;谔卣骺臻g計(jì)算的歐式距離被稱(chēng)為感知損失(perceptual loss),令φ來(lái)表示網(wǎng)絡(luò),j表示網(wǎng)絡(luò)的第j層,表示第j層的特征圖的大小,感知損失的定義如下;

圖像超分,計(jì)算攝影,計(jì)算機(jī)視覺(jué),人工智能

參考資料:

?【計(jì)算攝影】圖像超分辨,深度學(xué)習(xí)核心技術(shù)與展望 - 知乎

圖像超分算法小合集二:FSRCNN、DRCN、RDN、EDSR_暖風(fēng)?的博客-CSDN博客_圖像超分算法

ESPCN神經(jīng)網(wǎng)絡(luò)_uodgnez的博客-CSDN博客_espcn文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-640119.html

到了這里,關(guān)于計(jì)算攝影——圖像超分的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【計(jì)算機(jī)視覺(jué) | 圖像分割】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于圖像分割的學(xué)術(shù)速遞(8 月 30 日論文合集)

    Novis:端到端近在線視頻實(shí)例分割實(shí)例 直到最近,視頻實(shí)例分割(VIS)社區(qū)在以下共同信念下操作:離線方法通常優(yōu)于逐幀在線處理。然而,最近在線方法的成功質(zhì)疑這種信念,特別是對(duì)于具有挑戰(zhàn)性和長(zhǎng)視頻序列。我們將這項(xiàng)工作理解為對(duì)最近觀察結(jié)果的反駁,并呼吁社區(qū)

    2024年02月09日
    瀏覽(93)
  • 【計(jì)算機(jī)視覺(jué) | 圖像分割】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于圖像分割的學(xué)術(shù)速遞(7 月 6 日論文合集)

    【計(jì)算機(jī)視覺(jué) | 圖像分割】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于圖像分割的學(xué)術(shù)速遞(7 月 6 日論文合集)

    面向跨域語(yǔ)義分割的提示擴(kuò)散表示法 雖然最初設(shè)計(jì)用于圖像生成,擴(kuò)散模型最近已證明提供了優(yōu)秀的預(yù)訓(xùn)練的特征表示語(yǔ)義分割。這一結(jié)果引起了興趣,我們開(kāi)始探索擴(kuò)散預(yù)訓(xùn)練表示如何推廣到新的領(lǐng)域,這是任何表示的關(guān)鍵能力。我們發(fā)現(xiàn),擴(kuò)散預(yù)訓(xùn)練實(shí)現(xiàn)了非凡的領(lǐng)域泛

    2024年02月12日
    瀏覽(27)
  • 人工智能在計(jì)算機(jī)視覺(jué)中的應(yīng)用與挑戰(zhàn)

    引言 計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的一個(gè)重要分支,旨在讓計(jì)算機(jī)能夠像人一樣理解和解釋視覺(jué)信息,實(shí)現(xiàn)圖像和視頻的自動(dòng)識(shí)別、理解和分析。計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)在許多領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響,如人臉識(shí)別、自動(dòng)駕駛、醫(yī)學(xué)影像分析等。本篇博客將深入探討人工智能在計(jì)算

    2024年02月14日
    瀏覽(27)
  • 計(jì)算機(jī)視覺(jué)——圖像視覺(jué)顯著性檢測(cè)

    計(jì)算機(jī)視覺(jué)——圖像視覺(jué)顯著性檢測(cè)

    目錄 系列文章目錄 零、問(wèn)題描述 一、圖像顯著性檢測(cè) 1.定義 2.難點(diǎn) 二、常用評(píng)價(jià)標(biāo)準(zhǔn)和計(jì)算方法 1.綜述 2.ROS曲線詳述 2.1 混淆矩陣 2.2 ROC曲線簡(jiǎn)介 2.3 ROC曲線繪制及其判別標(biāo)準(zhǔn) 2.4 ROC曲線補(bǔ)充 三、Fast and Efficient Saliency (FES) 1.算法簡(jiǎn)介 2.項(xiàng)目導(dǎo)入與解析 3.FES注意預(yù)測(cè)實(shí)踐 4.評(píng)價(jià)

    2024年02月03日
    瀏覽(32)
  • 計(jì)算機(jī)視覺(jué)----圖像拼接

    計(jì)算機(jī)視覺(jué)----圖像拼接

    ?一.簡(jiǎn)介 圖像拼接(Image Stitching)是一種利用實(shí)景圖像組成全景空間的技術(shù),它將多幅圖像拼接成一幅大尺度圖像或360度全景圖,接可以看做是場(chǎng)景重建的一種特殊情況,其中圖像僅通過(guò)平面單應(yīng)性進(jìn)行關(guān)聯(lián)。圖像拼接在運(yùn)動(dòng)檢測(cè)和跟蹤,增強(qiáng)現(xiàn)實(shí),分辨率增強(qiáng),視頻壓縮和圖

    2024年02月09日
    瀏覽(22)
  • 計(jì)算機(jī)視覺(jué)--圖像拼接

    計(jì)算機(jī)視覺(jué)--圖像拼接

    單應(yīng)性變換是指一個(gè)平面上的點(diǎn)通過(guò)一個(gè)矩陣變換映射到另一個(gè)平面上的點(diǎn),這個(gè)變換矩陣是一個(gè) 3 × 3 3 times 3 3 × 3 的矩陣,稱(chēng)為單應(yīng)性矩陣。單應(yīng)性變換可以分為仿射變換和投影變換兩種類(lèi)型。 在單應(yīng)性變換中,仿射變換是其中一種特殊的變換。仿射變換是指在變換前后

    2024年02月04日
    瀏覽(28)
  • 計(jì)算機(jī)視覺(jué) -- 圖像分割

    計(jì)算機(jī)視覺(jué) -- 圖像分割

    引入問(wèn)題: 在自動(dòng)駕駛系統(tǒng)中,如果用之前的檢測(cè)網(wǎng)絡(luò)(例如Faster-Rcnn),試想,倘若前方有一處急轉(zhuǎn)彎,系統(tǒng)只在道路上給出一個(gè)矩形標(biāo)識(shí),這樣一來(lái)車(chē)輛很有可能判斷不出是該避讓還是徑直上前,車(chē)禍一觸即發(fā)。因此,對(duì)新技術(shù)的訴求應(yīng)運(yùn)而生,該技術(shù)須能識(shí)別具體路況

    2024年02月11日
    瀏覽(102)
  • 計(jì)算機(jī)視覺(jué)的圖像標(biāo)注與視覺(jué)任務(wù)

    計(jì)算機(jī)視覺(jué)的圖像標(biāo)注與視覺(jué)任務(wù)

    ? ? ? ?計(jì)算機(jī)視覺(jué)是一種利用計(jì)算機(jī)和數(shù)學(xué)算法來(lái)模擬人類(lèi)視覺(jué)的技術(shù),可以應(yīng)用于許多領(lǐng)域。以下是計(jì)算機(jī)視覺(jué)的八大應(yīng)用:? 圖像識(shí)別:利用計(jì)算機(jī)視覺(jué)技術(shù),可以對(duì)圖像進(jìn)行分類(lèi)、識(shí)別和分割,從而實(shí)現(xiàn)自動(dòng)化的圖像處理。 視頻監(jiān)控:利用計(jì)算機(jī)視覺(jué)技術(shù),可以對(duì)視

    2024年02月16日
    瀏覽(31)
  • 計(jì)算機(jī)視覺(jué)(三)圖像拼接

    計(jì)算機(jī)視覺(jué)(三)圖像拼接

    1.1 流程 要拼接多張圖像,就一定要找到他們之間的映射關(guān)系,流程如下: 得到映射關(guān)系,就能進(jìn)行拼接: 簡(jiǎn)而言之,拼接兩張圖像,就是找到他們的特征點(diǎn),根據(jù)這些特征點(diǎn): 1.2 映射與處理 找到兩張圖像的像素點(diǎn)對(duì)應(yīng)關(guān)系,然后把第二張圖像映射到在第一張圖像的坐標(biāo)系

    2024年02月05日
    瀏覽(19)
  • 讀十堂極簡(jiǎn)人工智能課筆記04_計(jì)算機(jī)視覺(jué)

    讀十堂極簡(jiǎn)人工智能課筆記04_計(jì)算機(jī)視覺(jué)

    3.2.3.1.?應(yīng)該發(fā)現(xiàn)真正的邊緣,而盡量避免錯(cuò)報(bào) 3.2.4.1.?應(yīng)該正確地找出邊緣的確切位置 3.2.5.1.?每條實(shí)際的邊緣應(yīng)該檢測(cè)為一條邊緣,而不是多條邊緣 4.7.5.1.?有數(shù)以百萬(wàn)計(jì)的幾乎任何種類(lèi)的圖像例子 4.7.7.1.?神經(jīng)網(wǎng)絡(luò)自己就能完成這一切

    2024年02月19日
    瀏覽(25)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包