目錄
1.基本概念
1.1 圖像壓縮概念及其分類
1.2 數(shù)據(jù)冗余
1.3 圖像信息的度量
1.4 圖像保真度準(zhǔn)則 (Fidelity Criteria)
1.5 圖像壓縮模型
2.圖像壓縮方法
2.1Huffman編碼 消除編碼冗余
2.2算術(shù)編碼?(Arithmetic Coding) 消除編碼冗余
2.3LZW編碼?(Lempel-Ziv-Welch coding)
2.4位平面編碼
2.5預(yù)測(cè)編碼
預(yù)測(cè)器
量化器? ???????
2.6變換編碼
3.圖像壓縮標(biāo)準(zhǔn)
3.1 二值圖像壓縮標(biāo)準(zhǔn)
3.2 靜止圖像壓縮標(biāo)準(zhǔn)
3.3 視頻壓縮標(biāo)準(zhǔn)
1.基本概念
1.1 圖像壓縮概念及其分類
數(shù)據(jù)壓縮
以盡可能少的數(shù)據(jù)表示信源所發(fā)出的信號(hào),減少數(shù)據(jù)所占用的存儲(chǔ)空間
信息論中稱信源編碼
- 無(wú)失真編碼
- 有失真編碼(或稱限失真編碼)
圖像壓縮
數(shù)據(jù)壓縮技術(shù)在圖像中的應(yīng)用。
- 無(wú)損壓縮(Lossless compression):原始數(shù)據(jù)可完全從壓縮數(shù)據(jù)中恢復(fù)出來,即在壓縮和解壓縮過程中沒有信息損失。 壓縮比2:1左右
- 有損壓縮(Lossy compression) :原始數(shù)據(jù)不能完全從壓縮數(shù)據(jù)中恢復(fù)出來,即恢復(fù)數(shù)據(jù)只是在某種失真度下的近似。 壓縮比2:1-1000:1;
1.2 數(shù)據(jù)冗余
信源數(shù)據(jù) = 有用數(shù)據(jù) + 冗余數(shù)據(jù)
如果能減少或消除冗余數(shù)據(jù),就能取得壓縮的效果。
壓縮比(Compression Ratio,CR)
n1(壓縮前)、(?n2壓縮后)? 代表兩個(gè)表示相同信息的數(shù)據(jù)集,壓縮比定義為:?前/后
????????
?
壓縮比越大越好,若為1,則沒有壓縮
三種基本的圖像冗余
1. 編碼冗余(Coding Redundancy)
編碼冗余:如果一個(gè)圖像的灰度級(jí)編碼,使用了多于實(shí)際需要的編碼符號(hào),就稱該圖像包含了編碼冗余。
????????
解決方法:可變長(zhǎng)編碼(Variable-length coding,VLC)、haffman編碼
2. 像素間冗余 (Interpixel Redundancy)
像素間冗余:反映圖像像素之間的相關(guān)性
行程編碼:具有相同灰度值的像素組成的序列,稱一個(gè)行程。不懂……
3. 心理視覺冗余 (Psychovisual Redundancy)
心理視覺冗余:在正常視覺處理過程中,各種信息的相對(duì)重要程度不同,不重要的信息稱心理視覺冗余。
消除心理視覺冗余:量化(一般是圖像處理第一步)
- 消除心理視覺冗余數(shù)據(jù)會(huì)導(dǎo)致一定量信息的丟失。
- 量化是不可逆的,導(dǎo)致數(shù)據(jù)有損壓縮。
1.3 圖像信息的度量
自信息量I(x)
一個(gè)隨機(jī)事件發(fā)生某一結(jié)果后所帶來的信息量稱為自信息量,簡(jiǎn)稱自信息,定義為其發(fā)生概率對(duì)數(shù)的負(fù)值。若隨機(jī)事件xi發(fā)生的概率為p(xi),它的自信息I(xi)為:
????????
???
自信息量的單位取決于對(duì)數(shù)所取的底
- 若以2為底,單位為比特(bit, binary unit)
- 若以e為底,單位為奈特(nat, nature unit)
- 若以10為底,單位為哈特(hart,以紀(jì)念Hartley; 1928年 Hartley提出信息量的關(guān)系)
條件自信息量I(x|y)
條件概率對(duì)數(shù)的負(fù)值。設(shè)在yj條件下發(fā)生xi的條件概率為p(xi|yj),那么它的條件自信息量為:
信源熵H(X)
信源的平均信息量,信源各個(gè)離散消息的自信息量的數(shù)學(xué)期望,簡(jiǎn)稱熵,標(biāo)記為H(X)。
條件熵H(X|Y)
已知隨機(jī)變量Y的條件下,隨機(jī)變量X的條件熵H(X|Y)。
信源編碼
無(wú)失真信源編碼定理:
????????對(duì)于離散信源X,實(shí)現(xiàn)無(wú)失真編碼的條件是其平均碼字長(zhǎng)度不能小于其信息熵,即 ?? ??? ??? ??? ?????????H(X) ≤ L< H(X) + ε
????????其中L為碼字平均長(zhǎng)度,ε表示任意小正數(shù).
? ? ? ? 所以無(wú)失真編碼后平均碼長(zhǎng)的存在一個(gè)理論下限——圖像信息熵。
????????理論上,最佳無(wú)失真編碼的平均碼長(zhǎng)可以無(wú)限接近、但總是大于或等于圖像熵H。存在任意接近該下限的編碼方法。
變字長(zhǎng)編碼定理:
????????對(duì)出現(xiàn)概率大的信符賦予短碼字,而對(duì)小的賦予長(zhǎng)碼字,則編碼的平均碼長(zhǎng)不會(huì)大于任何其它排列方式。
1.4 圖像保真度準(zhǔn)則 (Fidelity Criteria)
保真度準(zhǔn)則
評(píng)價(jià)信息損失的測(cè)度。描述解碼圖像相對(duì)于原始圖像的偏離程度。
常用保真度準(zhǔn)則分為兩大類:
- 客觀保真度準(zhǔn)則??損失的信息量用原始圖像與解碼圖像的函數(shù)表示
- 主觀保真度準(zhǔn)則??觀察者觀察圖像并給該圖像評(píng)分
1.5 圖像壓縮模型
?信源編碼器和信源解碼器模型
2.圖像壓縮方法
2.1Huffman編碼 消除編碼冗余
根據(jù)信源數(shù)據(jù)符號(hào)發(fā)生的概率進(jìn)行編碼。
(比較簡(jiǎn)單不解釋 看個(gè)例題)
????????
???????????
?
2.2算術(shù)編碼?(Arithmetic Coding) 消除編碼冗余
算術(shù)編碼基本原理:是將被編碼的信息流(稱為消息)表示成實(shí)數(shù)0和1之間的一個(gè)區(qū)間
消息越長(zhǎng),編碼表示它的區(qū)間就越小,表示這一小區(qū)間所需的二進(jìn)制位數(shù)就越多。
算術(shù)編碼與Huffman都屬于可變長(zhǎng)編碼,但算術(shù)編碼更接近于最優(yōu)熵編碼,優(yōu)于Huffman編碼。
算術(shù)編碼用到兩個(gè)基本參數(shù):符號(hào)的概率和它的編碼區(qū)間。
例子:
????????
?????????
2.3LZW編碼?(Lempel-Ziv-Welch coding)
又稱字符串表編碼
LZW編碼思想:
編碼過程中將所遇到的字符串建立一個(gè)字符串表,字符串表中的每個(gè)字符串都對(duì)應(yīng)一個(gè)索引,編碼時(shí)用字串表中的索引替代原始的字符串,達(dá)到壓縮的目的
方法:
每當(dāng)字符串表中沒有的字符串第一次出現(xiàn)時(shí),它就被原樣保存,同時(shí)給這個(gè)字符串分配一個(gè)索引。
當(dāng)這個(gè)串再次出現(xiàn)時(shí),只保存它的索引。
【說明】字符串表是在編碼過程中動(dòng)態(tài)生成的,字符串表不必保存在壓縮文件里。因?yàn)榻獯a時(shí),字符串表可由壓縮文件的信息動(dòng)態(tài)重構(gòu)。
參考文章:LZW壓縮算法原理解析 - 個(gè)人文章 - SegmentFault 思否
例題:(有空再重新翻譯吧)
?
2.4位平面編碼
先進(jìn)行位平面分解,然后編碼。
位平面分解:將一幅圖像分解為一系列二值圖像
- 對(duì)于 8 位 256 灰度級(jí)圖像來說,如果它的每個(gè)灰度值用二進(jìn)制表示,選擇將這 8 個(gè)數(shù)字用 8 個(gè)字節(jié)來表示,如 32 的二進(jìn)制表示是 00100000,將其儲(chǔ)存為[0 ,0, 1, 0, 0, 0, 0, 0],則其二維圖像可以理解為一個(gè) 8 層的三維圖像,每一層代表一個(gè)比特平面。
- 高階平面儲(chǔ)存的信息比低階平面的多
- 參考:5.5 Python圖像處理之圖像編碼-位平面編碼_集電極的博客-CSDN博客_python 圖像編碼
位平面編碼:
自然碼Natural Code? ?m個(gè)比特:?
????????
????????
????????
????????重構(gòu)是使用第 n 個(gè)平面的像素值乘以常數(shù) 2^(n-1)
?
格雷碼Gray Code 異或操作?
????????
????????
2.5預(yù)測(cè)編碼
相鄰的像素是高度相關(guān)的。根據(jù)前面的像素值預(yù)測(cè)像素值,然后編碼預(yù)測(cè)值與實(shí)際值之間的差值。
相鄰像素之間的差異很小。只需要少量的比特來表示差異。 這些差異可以被量化,以進(jìn)一步減少編碼數(shù)據(jù)。
預(yù)測(cè)編碼:預(yù)測(cè)器的輸出取整,計(jì)算預(yù)測(cè)誤差en 。
????????
解碼器根據(jù)接解碼:收到的誤差重建
????????
????????
預(yù)測(cè)器
預(yù)測(cè)器:輸入圖像的像素fn逐個(gè)進(jìn)入預(yù)測(cè)器,預(yù)測(cè)器根據(jù)過去的輸入產(chǎn)生當(dāng)前輸入像素的估計(jì)值。
線性預(yù)測(cè)器:預(yù)測(cè)值為m個(gè)先前像素,即fn-m, fn-m+1,….,fn-1的線性組合。
????????
最優(yōu)預(yù)測(cè)器:最優(yōu)準(zhǔn)則是最小化平方預(yù)測(cè)誤差MSE
????????
最優(yōu)線性預(yù)測(cè)器:計(jì)算線性預(yù)測(cè)系數(shù)ai,以最小化E{}
?一堆公式不知道講啥 跳過了
量化器? ???????
量化器:將預(yù)測(cè)誤差?量化為 ? ??
預(yù)測(cè)器的輸入為已編碼像素的重構(gòu)值,而非已編碼像素原始值
2.6變換編碼
預(yù)測(cè)編碼:利用鄰近像素在灰度上的相關(guān)性,對(duì)某一像素的預(yù)測(cè)誤差進(jìn)行編碼。
變換編碼:利用整塊子圖像所有像素在灰度上的相關(guān)性,對(duì)變換系數(shù)進(jìn)行編碼。
通常是指將某種正交變換作為映射變換,用變換系數(shù)來表示原始圖像,對(duì)變換系數(shù)進(jìn)行量化和編碼。
正交變換作用: 正交變換將空域高度相關(guān)的像素灰度值變?yōu)槿跸嚓P(guān)或不相關(guān)的系數(shù)。
正交變換之后,變換域中總能量不變,但能量將會(huì)重新分布。
圖像通過正交變換后實(shí)現(xiàn)了能量的集中,使大多數(shù)系數(shù)為零或是很小的數(shù)值
正交變換后,沒有丟失圖像所包含的信息。
WHT? Walsh-Hadamard Transform
DCT? Discrete Cosine Transform 二維離散余弦變換
DWT Discrete Wavelet Transformation??離散小波變換
3.圖像壓縮標(biāo)準(zhǔn)
3.1 二值圖像壓縮標(biāo)準(zhǔn)
G3和G4
G3?非自適應(yīng)、1維行程編碼技術(shù) 非自適應(yīng)
G4是G3的1種簡(jiǎn)化版本,其中只使用2維編碼
JBIG(Joint Bi-level Image experts Group),JBIG2
可以支持很高的圖像分辨率
累進(jìn)操作方式
無(wú)損壓縮
壓縮率比G3和G4高
3.2 靜止圖像壓縮標(biāo)準(zhǔn)
JPEG (Joint Picture Expert Group)
該標(biāo)準(zhǔn)定義了兩種方式的編碼:
- 基于DCT變換的非可逆編碼方式,該方式又分基本系統(tǒng)和擴(kuò)展系統(tǒng)。
- 基于DPCM的可逆編碼方式。 ?? ?
綜合上面的兩種方式,JPEG共有四種工作模式:
- 順序編碼模式;
- 漸進(jìn)編碼模式;
- 無(wú)失真編碼模式;
- 分層編碼工作模式。
JPEG2000
編碼變換采用DWT變換為主的多分辨編碼方式,是具有更高壓縮率和提供很多新功能的新型靜態(tài)圖像壓縮標(biāo)準(zhǔn)。
JPEG基本系統(tǒng)編碼器
?量化:(頻域)?
3.3 視頻壓縮標(biāo)準(zhǔn)
MPEG標(biāo)準(zhǔn)
MPEG標(biāo)準(zhǔn)包括3個(gè)子標(biāo)準(zhǔn),即MPEG系統(tǒng)標(biāo)準(zhǔn)、MPEG視頻標(biāo)準(zhǔn)和MPEG音頻標(biāo)準(zhǔn)。
- MPEG系統(tǒng)是用來解決視頻流和音頻流的多路復(fù)用和同步等問題
- MPEG視頻和音頻主要研究視頻信號(hào)和音頻信號(hào)的壓縮和解壓縮技術(shù)
MPEG標(biāo)準(zhǔn) 應(yīng)用范圍 主要編碼技術(shù) 幀序列 MPEG-1
運(yùn)動(dòng)圖像及其伴音的編碼,VCD,MP3音樂
1、DCT變換
2、前向、雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)
3、Zig-zag排序
4、Huffman編碼、算術(shù)編碼
5、每15幀至少要有一個(gè)I幀
I B P構(gòu)成 MPEG-2
高清晰度電視(HDTV) 的視頻及伴音信號(hào),DVD
MPEG-4 各種音頻視頻 MPEG-7 多媒體內(nèi)容描述接口 MPEG-21 多媒體框架標(biāo)準(zhǔn)
電視會(huì)議標(biāo)準(zhǔn):H.261、H.263
H.261 序列灰度圖像壓縮標(biāo)準(zhǔn)
H.263 稱為低碼率圖像編碼國(guó)際標(biāo)準(zhǔn)
電視會(huì)議標(biāo)準(zhǔn) H.261標(biāo)準(zhǔn) H.263標(biāo)準(zhǔn) 應(yīng)用范圍 電視會(huì)議 可視電話 主要編碼技術(shù) DCT變換
向前運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)
Zig-zag排序
霍夫曼編碼
DCT變換
雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)
Zig-zag排序
霍夫曼編碼
幀序列 I P構(gòu)成 I B P構(gòu)成
MPEG幀的分類:
連續(xù)幀圖像壓縮的基本思想文章來源:http://www.zghlxwxcb.cn/news/detail-523410.html
- 幀內(nèi)編碼技術(shù):根據(jù)同幀附近像素來加以預(yù)測(cè)
- 幀間編碼技術(shù):根據(jù)附近幀中的像素來加以預(yù)測(cè)
- I幀(Intra-picture) 不需要參考其它畫面而獨(dú)立進(jìn)行壓縮編碼的畫面
- P幀(Predicted-picture) 參考前面已編碼的I或P畫面進(jìn)行預(yù)測(cè)編碼的畫面
- B幀(Bidirectional-picture) 既參考前面的I或P畫面、又參考后面的I或P畫面進(jìn)行雙向預(yù)測(cè)編碼的畫面
畫面的編碼順序與解碼順序可能不同,所以一個(gè)GOP(group of pictures)中的畫面在編碼前和解碼后都必須重新排序文章來源地址http://www.zghlxwxcb.cn/news/detail-523410.html
到了這里,關(guān)于數(shù)字圖像處理--六、圖像壓縮的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!