數(shù)字圖像處理--六、圖像壓縮

這篇具有很好參考價(jià)值的文章主要介紹了數(shù)字圖像處理--六、圖像壓縮。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.基本概念

1.1 圖像壓縮概念及其分類

1.2 數(shù)據(jù)冗余

1.3 圖像信息的度量

1.4 圖像保真度準(zhǔn)則 (Fidelity Criteria)

1.5 圖像壓縮模型

2.圖像壓縮方法

2.1Huffman編碼消除編碼冗余

2.2算術(shù)編碼?(Arithmetic Coding) 消除編碼冗余

2.3LZW編碼?(Lempel-Ziv-Welch coding)

2.4位平面編碼

2.5預(yù)測(cè)編碼

預(yù)測(cè)器

量化器? ？？？？？？？

2.6變換編碼

3.圖像壓縮標(biāo)準(zhǔn)

3.1 二值圖像壓縮標(biāo)準(zhǔn)

3.2 靜止圖像壓縮標(biāo)準(zhǔn)

3.3 視頻壓縮標(biāo)準(zhǔn)

1.基本概念

1.1 圖像壓縮概念及其分類

數(shù)據(jù)壓縮

以盡可能少的數(shù)據(jù)表示信源所發(fā)出的信號(hào)，減少數(shù)據(jù)所占用的存儲(chǔ)空間

信息論中稱信源編碼

無(wú)失真編碼

有失真編碼（或稱限失真編碼）

圖像壓縮

數(shù)據(jù)壓縮技術(shù)在圖像中的應(yīng)用。

無(wú)損壓縮(Lossless compression)：原始數(shù)據(jù)可完全從壓縮數(shù)據(jù)中恢復(fù)出來，即在壓縮和解壓縮過程中沒有信息損失。壓縮比2:1左右

有損壓縮(Lossy compression) ：原始數(shù)據(jù)不能完全從壓縮數(shù)據(jù)中恢復(fù)出來，即恢復(fù)數(shù)據(jù)只是在某種失真度下的近似。壓縮比2:1-1000:1；

1.2 數(shù)據(jù)冗余

信源數(shù)據(jù) = 有用數(shù)據(jù) + 冗余數(shù)據(jù)

如果能減少或消除冗余數(shù)據(jù)，就能取得壓縮的效果。

壓縮比（Compression Ratio，CR）

n1（壓縮前）、（?n2壓縮后）? 代表兩個(gè)表示相同信息的數(shù)據(jù)集，壓縮比定義為：?前/后

?????????

壓縮比越大越好，若為1，則沒有壓縮

三種基本的圖像冗余

1. 編碼冗余(Coding Redundancy)

編碼冗余：如果一個(gè)圖像的灰度級(jí)編碼，使用了多于實(shí)際需要的編碼符號(hào)，就稱該圖像包含了編碼冗余。

????????

解決方法：可變長(zhǎng)編碼（Variable-length coding，VLC）、haffman編碼

2. 像素間冗余 (Interpixel Redundancy)

像素間冗余：反映圖像像素之間的相關(guān)性

行程編碼：具有相同灰度值的像素組成的序列，稱一個(gè)行程。不懂……

3. 心理視覺冗余 (Psychovisual Redundancy)

心理視覺冗余：在正常視覺處理過程中，各種信息的相對(duì)重要程度不同，不重要的信息稱心理視覺冗余。

消除心理視覺冗余：量化（一般是圖像處理第一步）

消除心理視覺冗余數(shù)據(jù)會(huì)導(dǎo)致一定量信息的丟失。

量化是不可逆的，導(dǎo)致數(shù)據(jù)有損壓縮。

1.3 圖像信息的度量

自信息量I(x)

一個(gè)隨機(jī)事件發(fā)生某一結(jié)果后所帶來的信息量稱為自信息量，簡(jiǎn)稱自信息，定義為其發(fā)生概率對(duì)數(shù)的負(fù)值。若隨機(jī)事件xi發(fā)生的概率為p(xi)，它的自信息I(xi)為：

???????????

自信息量的單位取決于對(duì)數(shù)所取的底

若以2為底，單位為比特（bit, binary unit）

若以e為底，單位為奈特（nat, nature unit)

若以10為底，單位為哈特（hart，以紀(jì)念Hartley; 1928年 Hartley提出信息量的關(guān)系)

條件自信息量I(x|y)

條件概率對(duì)數(shù)的負(fù)值。設(shè)在yj條件下發(fā)生xi的條件概率為p(xi|yj)，那么它的條件自信息量為：

信源熵H(X)

信源的平均信息量，信源各個(gè)離散消息的自信息量的數(shù)學(xué)期望，簡(jiǎn)稱熵，標(biāo)記為H(X)。

條件熵H(X|Y)

已知隨機(jī)變量Y的條件下，隨機(jī)變量X的條件熵H(X|Y)。

信源編碼

無(wú)失真信源編碼定理:

????????對(duì)于離散信源X，實(shí)現(xiàn)無(wú)失真編碼的條件是其平均碼字長(zhǎng)度不能小于其信息熵，即 ?? ??? ??? ??? ?????????H(X) ≤ L< H(X) + ε

????????其中L為碼字平均長(zhǎng)度，ε表示任意小正數(shù).

? ? ? ? 所以無(wú)失真編碼后平均碼長(zhǎng)的存在一個(gè)理論下限——圖像信息熵。

????????理論上，最佳無(wú)失真編碼的平均碼長(zhǎng)可以無(wú)限接近、但總是大于或等于圖像熵H。存在任意接近該下限的編碼方法。

變字長(zhǎng)編碼定理：

????????對(duì)出現(xiàn)概率大的信符賦予短碼字，而對(duì)小的賦予長(zhǎng)碼字，則編碼的平均碼長(zhǎng)不會(huì)大于任何其它排列方式。

1.4 圖像保真度準(zhǔn)則 (Fidelity Criteria)

保真度準(zhǔn)則

評(píng)價(jià)信息損失的測(cè)度。描述解碼圖像相對(duì)于原始圖像的偏離程度。

常用保真度準(zhǔn)則分為兩大類：

客觀保真度準(zhǔn)則??損失的信息量用原始圖像與解碼圖像的函數(shù)表示

主觀保真度準(zhǔn)則??觀察者觀察圖像并給該圖像評(píng)分

1.5 圖像壓縮模型

?信源編碼器和信源解碼器模型

2.圖像壓縮方法

2.1Huffman編碼消除編碼冗余

根據(jù)信源數(shù)據(jù)符號(hào)發(fā)生的概率進(jìn)行編碼。

（比較簡(jiǎn)單不解釋看個(gè)例題）

???????? 數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

??????????? 數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

2.2算術(shù)編碼?(Arithmetic Coding) 消除編碼冗余

算術(shù)編碼基本原理：是將被編碼的信息流（稱為消息）表示成實(shí)數(shù)0和1之間的一個(gè)區(qū)間

消息越長(zhǎng)，編碼表示它的區(qū)間就越小，表示這一小區(qū)間所需的二進(jìn)制位數(shù)就越多。

算術(shù)編碼與Huffman都屬于可變長(zhǎng)編碼，但算術(shù)編碼更接近于最優(yōu)熵編碼，優(yōu)于Huffman編碼。

算術(shù)編碼用到兩個(gè)基本參數(shù)：符號(hào)的概率和它的編碼區(qū)間。

例子：

???????? 數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

????????? 數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

2.3LZW編碼?(Lempel-Ziv-Welch coding)

又稱字符串表編碼

LZW編碼思想：

編碼過程中將所遇到的字符串建立一個(gè)字符串表，字符串表中的每個(gè)字符串都對(duì)應(yīng)一個(gè)索引，編碼時(shí)用字串表中的索引替代原始的字符串，達(dá)到壓縮的目的

方法：

每當(dāng)字符串表中沒有的字符串第一次出現(xiàn)時(shí)，它就被原樣保存，同時(shí)給這個(gè)字符串分配一個(gè)索引。

當(dāng)這個(gè)串再次出現(xiàn)時(shí)，只保存它的索引。

【說明】字符串表是在編碼過程中動(dòng)態(tài)生成的，字符串表不必保存在壓縮文件里。因?yàn)榻獯a時(shí)，字符串表可由壓縮文件的信息動(dòng)態(tài)重構(gòu)。

參考文章：LZW壓縮算法原理解析 - 個(gè)人文章 - SegmentFault 思否

例題：(有空再重新翻譯吧)

數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

2.4位平面編碼

先進(jìn)行位平面分解，然后編碼。

位平面分解：將一幅圖像分解為一系列二值圖像

對(duì)于 8 位 256 灰度級(jí)圖像來說，如果它的每個(gè)灰度值用二進(jìn)制表示，選擇將這 8 個(gè)數(shù)字用 8 個(gè)字節(jié)來表示，如 32 的二進(jìn)制表示是 00100000，將其儲(chǔ)存為[0 ，0， 1， 0， 0， 0， 0， 0]，則其二維圖像可以理解為一個(gè) 8 層的三維圖像，每一層代表一個(gè)比特平面。

高階平面儲(chǔ)存的信息比低階平面的多

參考：5.5 Python圖像處理之圖像編碼-位平面編碼_集電極的博客-CSDN博客_python 圖像編碼

位平面編碼：

自然碼Natural Code? ?m個(gè)比特：?

????????????????

????????

????????重構(gòu)是使用第 n 個(gè)平面的像素值乘以常數(shù) 2^(n-1)

?

格雷碼Gray Code 異或操作?

????????

????????

2.5預(yù)測(cè)編碼

相鄰的像素是高度相關(guān)的。根據(jù)前面的像素值預(yù)測(cè)像素值，然后編碼預(yù)測(cè)值與實(shí)際值之間的差值。

相鄰像素之間的差異很小。只需要少量的比特來表示差異。這些差異可以被量化，以進(jìn)一步減少編碼數(shù)據(jù)。

預(yù)測(cè)編碼：預(yù)測(cè)器的輸出取整，計(jì)算預(yù)測(cè)誤差en 。

????????

解碼器根據(jù)接解碼：收到的誤差重建

????????

預(yù)測(cè)器

預(yù)測(cè)器：輸入圖像的像素fn逐個(gè)進(jìn)入預(yù)測(cè)器，預(yù)測(cè)器根據(jù)過去的輸入產(chǎn)生當(dāng)前輸入像素的估計(jì)值。

線性預(yù)測(cè)器：預(yù)測(cè)值為m個(gè)先前像素，即fn-m, fn-m+1,….,fn-1的線性組合。

????????

最優(yōu)預(yù)測(cè)器：最優(yōu)準(zhǔn)則是最小化平方預(yù)測(cè)誤差MSE

????????

最優(yōu)線性預(yù)測(cè)器：計(jì)算線性預(yù)測(cè)系數(shù)ai，以最小化E{}

?一堆公式不知道講啥跳過了

量化器? ？？？？？？？

量化器：將預(yù)測(cè)誤差?量化為 ? ??

預(yù)測(cè)器的輸入為已編碼像素的重構(gòu)值，而非已編碼像素原始值

2.6變換編碼

預(yù)測(cè)編碼：利用鄰近像素在灰度上的相關(guān)性，對(duì)某一像素的預(yù)測(cè)誤差進(jìn)行編碼。

變換編碼：利用整塊子圖像所有像素在灰度上的相關(guān)性，對(duì)變換系數(shù)進(jìn)行編碼。

通常是指將某種正交變換作為映射變換，用變換系數(shù)來表示原始圖像，對(duì)變換系數(shù)進(jìn)行量化和編碼。

正交變換作用：正交變換將空域高度相關(guān)的像素灰度值變?yōu)槿跸嚓P(guān)或不相關(guān)的系數(shù)。

正交變換之后，變換域中總能量不變，但能量將會(huì)重新分布。

圖像通過正交變換后實(shí)現(xiàn)了能量的集中，使大多數(shù)系數(shù)為零或是很小的數(shù)值

正交變換后，沒有丟失圖像所包含的信息。

WHT? Walsh-Hadamard Transform

DCT? Discrete Cosine Transform 二維離散余弦變換

DWT Discrete Wavelet Transformation??離散小波變換

3.圖像壓縮標(biāo)準(zhǔn)

3.1 二值圖像壓縮標(biāo)準(zhǔn)

G3和G4

G3?非自適應(yīng)、1維行程編碼技術(shù) 非自適應(yīng)

G4是G3的1種簡(jiǎn)化版本，其中只使用2維編碼

JBIG（Joint Bi-level Image experts Group），JBIG2

可以支持很高的圖像分辨率

累進(jìn)操作方式

無(wú)損壓縮

壓縮率比G3和G4高

3.2 靜止圖像壓縮標(biāo)準(zhǔn)

JPEG (Joint Picture Expert Group)

該標(biāo)準(zhǔn)定義了兩種方式的編碼:

基于DCT變換的非可逆編碼方式，該方式又分基本系統(tǒng)和擴(kuò)展系統(tǒng)。

基于DPCM的可逆編碼方式。 ?? ?

綜合上面的兩種方式，JPEG共有四種工作模式：

順序編碼模式;

漸進(jìn)編碼模式;

無(wú)失真編碼模式;

分層編碼工作模式。

JPEG2000

編碼變換采用DWT變換為主的多分辨編碼方式，是具有更高壓縮率和提供很多新功能的新型靜態(tài)圖像壓縮標(biāo)準(zhǔn)。

JPEG基本系統(tǒng)編碼器

數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

?量化：(頻域)?

數(shù)字圖像壓縮比,數(shù)字圖像處理,圖像處理,人工智能

3.3 視頻壓縮標(biāo)準(zhǔn)

MPEG標(biāo)準(zhǔn)

MPEG標(biāo)準(zhǔn)包括3個(gè)子標(biāo)準(zhǔn)，即MPEG系統(tǒng)標(biāo)準(zhǔn)、MPEG視頻標(biāo)準(zhǔn)和MPEG音頻標(biāo)準(zhǔn)。

MPEG系統(tǒng)是用來解決視頻流和音頻流的多路復(fù)用和同步等問題

MPEG視頻和音頻主要研究視頻信號(hào)和音頻信號(hào)的壓縮和解壓縮技術(shù)

MPEG標(biāo)準(zhǔn) 應(yīng)用范圍主要編碼技術(shù) 幀序列

MPEG-1

運(yùn)動(dòng)圖像及其伴音的編碼，VCD，MP3音樂

1、DCT變換

2、前向、雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)

3、Zig-zag排序

4、Huffman編碼、算術(shù)編碼

5、每15幀至少要有一個(gè)I幀
I B P構(gòu)成

MPEG-2

高清晰度電視(HDTV) 的視頻及伴音信號(hào)，DVD

MPEG-4 各種音頻視頻

MPEG-7 多媒體內(nèi)容描述接口

MPEG-21 多媒體框架標(biāo)準(zhǔn)

電視會(huì)議標(biāo)準(zhǔn)：H.261、H.263

H.261 序列灰度圖像壓縮標(biāo)準(zhǔn)

H.263 稱為低碼率圖像編碼國(guó)際標(biāo)準(zhǔn)

電視會(huì)議標(biāo)準(zhǔn) H.261標(biāo)準(zhǔn) H.263標(biāo)準(zhǔn)

應(yīng)用范圍電視會(huì)議可視電話

主要編碼技術(shù)
DCT變換

向前運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)

Zig-zag排序

霍夫曼編碼

DCT變換

雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)

Zig-zag排序

霍夫曼編碼

幀序列 I P構(gòu)成 I B P構(gòu)成

MPEG幀的分類：

連續(xù)幀圖像壓縮的基本思想

幀內(nèi)編碼技術(shù)：根據(jù)同幀附近像素來加以預(yù)測(cè)

幀間編碼技術(shù)：根據(jù)附近幀中的像素來加以預(yù)測(cè)

I幀（Intra-picture） 不需要參考其它畫面而獨(dú)立進(jìn)行壓縮編碼的畫面

P幀（Predicted-picture） 參考前面已編碼的I或P畫面進(jìn)行預(yù)測(cè)編碼的畫面

B幀（Bidirectional-picture） 既參考前面的I或P畫面、又參考后面的I或P畫面進(jìn)行雙向預(yù)測(cè)編碼的畫面

畫面的編碼順序與解碼順序可能不同，所以一個(gè)GOP（group of pictures）中的畫面在編碼前和解碼后都必須重新排序文章來源地址http://www.zghlxwxcb.cn/news/detail-523410.html

到了這里，關(guān)于數(shù)字圖像處理--六、圖像壓縮的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Toy模板網(wǎng)

數(shù)字圖像處理--六、圖像壓縮