目錄
一、數(shù)字圖像基礎(chǔ)
1.1 數(shù)字圖像和圖像單位
1.2 區(qū)分圖片分辨率與屏幕分辨率
1.3 圖像的灰度與灰度級
1.4 圖像的深度
1.5 二值圖像、灰度圖像與彩色圖像
1.6 通道數(shù)
二、數(shù)字圖像處理
2.1 圖像噪聲及其消除
2.2 數(shù)字圖像處理技術(shù)
2.2.1 圖像變換
2.2.2?圖像增強(qiáng)
2.2.3?圖像分割
2.2.4 圖像重建
2.2.5 圖像分類
一、數(shù)字圖像基礎(chǔ)
1.1 數(shù)字圖像和圖像單位
數(shù)字圖像通常是由照相機(jī)、攝像機(jī)、掃描儀、坐標(biāo)測量機(jī)等輸入設(shè)備捕捉現(xiàn)實(shí)世界中的畫面產(chǎn)生的,它以像素為基本元素,可以用數(shù)字計算機(jī)或數(shù)字電路存儲和處理的圖像。
數(shù)字圖像由許多密集的細(xì)小點(diǎn)所組成,這些細(xì)點(diǎn)構(gòu)成一幅圖像的基本單元,稱為像素。像素越多,畫面就越清晰。像素(或稱像素點(diǎn)、像元,Pixel)是數(shù)字圖像的基本元素。每幅圖片都是由色點(diǎn)組成的,每個色點(diǎn)稱為一個像素。
如果一幅圖片由30萬個色點(diǎn)組成,這幅圖片的像素就是30萬。我們常說相機(jī)是多少像素的,其實(shí)是說這個照相機(jī)的感光器件有多少個,有10萬個感光器件的相機(jī)就是10萬像素的相機(jī),有400萬個感光器件的相機(jī)就是400萬像素。
像素是在模擬圖像數(shù)字化時對連續(xù)空間進(jìn)行離散化得到的。每個像素具有整數(shù)行(高)和列(寬)位置坐標(biāo),同時每個像素都具有整數(shù)灰度值或顏色值。像素點(diǎn)是最小的圖像單元,一幅圖片由若干個像素點(diǎn)組成。如果一張圖片在電腦的文件屬性窗口是看到的尺寸是500×338,就是說這張圖片是由500×338的像素點(diǎn)矩陣構(gòu)成的,這幅圖片的寬度是500個像素點(diǎn)、高度是338個像素點(diǎn),共有169000(500×338)個像素點(diǎn)。
1.2 區(qū)分圖片分辨率與屏幕分辨率
圖像分辨率是指每英寸圖像內(nèi)的像素點(diǎn)數(shù),單位是像素每英寸。分辨率越高,像素的點(diǎn)密度越高,圖像越逼真,越接近現(xiàn)實(shí)世界的畫面。
屏幕分辨率是屏幕每行的像素點(diǎn)數(shù)乘以每列的像素點(diǎn)數(shù)。每個屏幕都有自己的分辨率,屏幕分辨率越高,所呈現(xiàn)的色彩越多,清晰度越高。比如,一個屏幕分辨率是1024×768,也就是說這個屏幕的水平方向上有1024個像素點(diǎn),垂直方向上有768個像素點(diǎn)。像素的大小是沒有固定長度的,但是不同設(shè)備上一個單位像素色塊的大小是不一樣的。例如,尺寸面積大小相同的兩塊屏幕,分辨率大小可以是不一樣的,分辨率高的屏幕上像素點(diǎn)(色塊)就多,所以屏幕內(nèi)可以展示的畫面就更細(xì)致,單個色塊面積更小。分辨率低的屏幕上像素點(diǎn)(色塊)更少,單個像素面積更大,可以顯示的畫面就沒那么細(xì)致。
1.3 圖像的灰度與灰度級
灰度級有時會和灰度混淆。灰度(值)表示灰度圖像單個像素點(diǎn)的亮度值,值越大,像素點(diǎn)越亮,反之越暗。灰度級表明圖像中不同灰度值的最大數(shù)量。灰度級越大,圖像的亮度范圍越大。
在學(xué)術(shù)界,把白色與黑色之間按對數(shù)關(guān)系分為若干等級,稱為灰度?;叶确譃?56階,0為黑色?;叶染褪菦]有色彩,RGB色彩分量全部相等,如RGB(100,100,100)就代表灰度為100,RGB(50,50,50)代表灰度為50?;叶燃壉硎净叶葓D像的亮度層次,比如第一級、第二級、……、第255級等。
1.4 圖像的深度
圖像深度是指存儲每個像素所用的位數(shù),也用于量度圖像的色彩分辨率。圖像深度確定彩色圖像的每個像素可能有的顏色數(shù),或者確定灰度圖像的每個像素可能有的灰度級數(shù)。它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù),或灰度圖像中的最大灰度等級。比如,一幅單色圖像,若每個像素有8位,則最大灰度數(shù)目為2的8次方,即256。一幅彩色圖像RGB三個分量的像素位數(shù)分別為4、4、2,則最大顏色數(shù)目為2的(4+4+2)次方,即1024,也就是說像素的深度為10位,每個像素可以是1024種顏色中的一種。例如,一幅畫的尺寸是1024×768,深度為16,則它的數(shù)據(jù)量為1.5MB,計算如下:
1.5 二值圖像、灰度圖像與彩色圖像
二值圖像(Binary Image)上的每一個像素只有兩種可能的取值或灰度等級狀態(tài)。二值圖像只有兩個值,即0和1,0代表黑、1代表白。其保存也相對簡單一些,每個像素只需要1bit就可以完整存儲信息。如果把每個像素看成隨機(jī)變量,一共有N個像素,那么二值圖像有2的N次方種變化,而8位灰度圖有255的N次方種變化,8位三通道RGB圖像有255×255×255的N次方種變化。也就是說同樣尺寸的圖像,二值圖像保存的信息更少。
灰度圖像(Gray Scale Image)是指用灰度表示的圖像。除了常見的衛(wèi)星圖像、航空照片外,許多地球物理觀測數(shù)據(jù)也以灰度表示。我們平時看到的灰度圖像是由0到255個像素組成的?;叶葓D像是二值圖像的進(jìn)化版本,是彩色圖像的退化版,也就是灰度圖保存的信息沒有彩色圖像多,但比二值圖像多?;叶葓D像只包含一個通道的信息,而彩色圖像通常包含三個通道的信息,單一通道可以理解為單一波長的電磁波,所以紅外遙感、X斷層成像等單一通道電磁波產(chǎn)生的圖像都為灰度圖。灰度圖像是每個像素只有一個采樣顏色的圖像,通常顯示為從最暗黑色到最亮白色的灰度,盡管理論上這個采樣可以是任何顏色的不同深淺,甚至可以是不同亮度上的不同顏色。灰度圖像與黑白圖像不同,在計算機(jī)圖像領(lǐng)域中黑白圖像只有黑色與白色兩種顏色,但是灰度圖像在黑色與白色之間還有許多級的顏色深度?;叶葓D像經(jīng)常是在單個電磁波頻譜(如可見光)內(nèi)測量每個像素的亮度得到的,用于顯示的灰度圖像通常用每個采樣像素8位的非線性尺度來保存,這樣可以有256級灰度(如果用16位,則有65536級)。
彩色圖像也就是RGB圖像,每個像素由3個通道進(jìn)行表示。彩色圖像的每個像素通常是由紅(R)、綠(G)、藍(lán)(B)三個分量來表示的,分量介于(0,255)。?
1.6 通道數(shù)
通道表示把圖像分解成一個或多個顏色成分,通??梢苑譃閱瓮ǖ?、三通道和四通道。單通道表示一個像素點(diǎn)只需要一個數(shù)值表示。單通道只能表示灰度,0為黑色。單通道圖像就是圖像中每個像素點(diǎn)只需一個數(shù)值表示。三通道表示把圖像分為紅、綠、藍(lán)三個通道。三通道可以表示彩色,其中全0表示黑色。四通道表示在RGB基礎(chǔ)上加上alpha通道。alpha通道表示透明度,為0時表示全透明。在計算機(jī)中用M×N的矩陣表示一幅尺寸大小為M×N的數(shù)字圖像,矩陣元素的值就是該圖像對應(yīng)位置上的像素值。三通道圖像數(shù)據(jù)在內(nèi)存中的存儲是連續(xù)的,每個通道元素按照矩陣行列順序進(jìn)行排列,通常計算機(jī)按照RGB方式存儲三通道圖像格式,而圖像采集設(shè)備輸出圖像格式一般是BGR方式。
二、數(shù)字圖像處理
2.1 圖像噪聲及其消除
數(shù)字圖像的噪聲主要來源于圖像獲取的數(shù)字化過程。圖像傳感器的工作狀態(tài)受各種因素的影響,如環(huán)境條件、傳感器元件質(zhì)量等。在圖像傳輸過程中,所用的傳輸信道受到干擾,也會產(chǎn)生噪聲污染。例如,通過無線網(wǎng)絡(luò)傳輸?shù)膱D像可能會因?yàn)楣饣蚱渌髿庖蛩氐母蓴_而受到噪聲污染。圖像噪聲的種類有多種,主要有高斯噪聲、瑞利噪聲、伽馬以及脈沖噪聲等。其中,脈沖噪聲(又稱為椒鹽噪聲或雙極性噪聲)在圖像噪聲中最為常見。在圖像生成和傳輸過程中,經(jīng)常會產(chǎn)生脈沖噪聲,主要表現(xiàn)在成像的短暫停留中,對圖像質(zhì)量有較大的影響,需要采用圖像濾波方法給予消除。
通過圖像平滑可以有效地減少和消除圖像中的噪聲,以改善圖像質(zhì)量,有利于抽取對象特征進(jìn)行分析。經(jīng)典的平滑技術(shù)對噪聲圖像使用局部算子,當(dāng)對某一個像素進(jìn)行平滑處理時,僅對它的局部小鄰域內(nèi)的一些像素進(jìn)行處理,其優(yōu)點(diǎn)是計算效率高,而且可以對多個像素并行處理。近年來出現(xiàn)了一些新的圖像平滑處理技術(shù),結(jié)合人眼的視覺特性,運(yùn)用模糊數(shù)學(xué)理論、小波分析、數(shù)學(xué)形態(tài)學(xué)、粗糙集理論等新技術(shù)進(jìn)行圖像平滑,取得了較好的效果?;叶葓D像常用的濾波方法主要分為線性和非線性兩大類。線性濾波方法一般通過取模板做離散卷積來實(shí)現(xiàn),這種方法在平滑脈沖噪聲點(diǎn)的同時會導(dǎo)致圖像模糊,損失了圖像細(xì)節(jié)信息。非線性濾波方法中應(yīng)用最多的是中值濾波。中值濾波可以有效地濾除脈沖噪聲,具有相對好的邊緣保持特性,并易于實(shí)現(xiàn),因此被公認(rèn)是一種有效的方法。中值濾波同時也會改變未受噪聲污染的像素的灰度值,使圖像變得模糊。隨著濾波窗口的長度增加和噪聲污染的加重,中值濾波效果明顯變壞。
2.2 數(shù)字圖像處理技術(shù)
數(shù)字圖像處理技術(shù)通俗地講就是應(yīng)用計算機(jī)以及數(shù)字設(shè)備對圖像進(jìn)行加工處理的技術(shù),有時候圖像本身存在噪聲,我們需要進(jìn)行處理,但數(shù)字圖像處理最主要的目的是尋找圖像中我們感興趣的信息,這些信息人眼可能不能直接感知,需要進(jìn)行進(jìn)一步處理。具體的圖像處理常用的方法有圖像變換、圖像編碼壓縮、圖像增強(qiáng)和復(fù)原、圖像分割、圖像描述、圖像分類(識別)和圖像重建等。
2.2.1 圖像變換
由于圖像陣列很大,直接在空間域中進(jìn)行處理,涉及計算量很大,因此往往采用各種圖像變換的方法(如傅里葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù)),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,還可獲得更有效的處理(如傅里葉變換可在頻域中進(jìn)行數(shù)字濾波處理)。目前新興研究的小波變換,在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有廣泛而有效的應(yīng)用。
2.2.2?圖像增強(qiáng)
圖像增強(qiáng)的目的是為了提高圖像的質(zhì)量,比如去除噪聲、提高圖像的清晰度等。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,突出圖像中感興趣的部分。例如,強(qiáng)化圖像高頻分量,使圖像中物體輪廓清晰,細(xì)節(jié)明顯;強(qiáng)化低頻分量,減少圖像中噪聲的影響。圖像復(fù)原要求對圖像降質(zhì)的原因有一定的了解,一般應(yīng)根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復(fù)或重建原來的圖像。對于一個數(shù)字圖像處理系統(tǒng)來說,一般可以將處理流程分為3個階段:首先是圖像預(yù)處理階段,其次是特征抽取階段,最后才是識別分析階段。預(yù)處理階段尤為重要,處理不好會直接導(dǎo)致后面的工作無法展開。圖像增強(qiáng)是圖像預(yù)處理階段的重要步驟。
由于場景條件的影響,很多圖像拍攝的視覺效果都不太好,需要用圖像增強(qiáng)技術(shù)來改善人的視覺效果。比如突出圖像中目標(biāo)物體的某些特點(diǎn)、從數(shù)字圖像中提取目標(biāo)物的特征參數(shù)等,這些都有利于對圖像中目標(biāo)的識別、跟蹤和理解。圖像增強(qiáng)處理的主要內(nèi)容是突出圖像中感興趣的部分,減弱或去除不需要的信息。這樣使有用信息得到加強(qiáng),從而得到一種更加實(shí)用的圖像,或者轉(zhuǎn)換成一種更適合人或機(jī)器進(jìn)行分析處理的圖像。另外,圖像傳遞系統(tǒng)包括圖像采集、圖像壓縮、圖像編碼、圖像存儲、圖像通信、圖像顯示六個部分。在實(shí)際應(yīng)用中每個部分都有可能導(dǎo)致圖像品質(zhì)變差,使圖像傳遞的信息無法被正常讀取和識別。例如,在采集圖像過程中,由于光照環(huán)境或物體表面反光等原因造成圖像整體光照不均,或是圖像采集系統(tǒng)由于機(jī)械設(shè)備的緣故無法避免加入采集噪聲,或是圖像顯示設(shè)備的局限性造成圖像顯示層次感降低或顏色減少等。因此,研究快速且有效的圖像增強(qiáng)算法,成為推動圖像分析和圖像理解領(lǐng)域發(fā)展的關(guān)鍵內(nèi)容之一。圖像增強(qiáng)處理是數(shù)字圖像處理的一個重要分支,也是圖像預(yù)處理的一個關(guān)鍵步驟。
對圖像進(jìn)行特征提取、圖像識別的前期處理通常由圖像預(yù)處理來現(xiàn),它是圖像識別過程一個不可缺少的環(huán)節(jié)。在采集圖像時,由于光照的穩(wěn)定性與均勻性等噪聲的影響、灰塵對CCD攝像機(jī)鏡頭的影響,以及圖像傳輸過程中由于硬件設(shè)備而獲得的噪聲等使得獲取的圖像不夠理想,往往存在噪聲、對比度不夠、目標(biāo)不清晰、有其他物體的干擾等缺點(diǎn)。從圖像質(zhì)量的角度來說,預(yù)處理的主要目的就是提高圖像能向人或機(jī)器提供信息的能力。因此,預(yù)處理的實(shí)質(zhì)就是按實(shí)際情況對圖像進(jìn)行適當(dāng)?shù)淖儞Q,從而突出某些有用的信息,去除或削弱無用的信息,目的是為了更好地提取圖像的特征來分類識別。圖像增強(qiáng)是重要的預(yù)處理手段。圖像增強(qiáng)就是增強(qiáng)圖像中用戶感興趣的信息,主要目的有兩個:一是改善圖像的視覺效果,提高圖像成分的清晰度;二是使圖像變得更有利于計算機(jī)處理。
圖像增強(qiáng)指的是利用各種數(shù)學(xué)方法和變換手段,提高圖像中的感興趣區(qū)域與背景的對比度與圖像清晰度,從而更明顯地突出感興趣的區(qū)域。例如,強(qiáng)化圖像高頻分量,使圖像中目標(biāo)輪廓清晰、細(xì)節(jié)明顯等。圖像增強(qiáng)把圖像轉(zhuǎn)換成另一種形式,使之適合于人眼的觀察判斷和機(jī)器的分析處理。另外,圖像增強(qiáng)不是以圖像保真原則為基點(diǎn)來處理圖像的,而是根據(jù)圖像質(zhì)量變壞的一般情況提出一些改善方法。例如,在圖像處理中,可以采用圖像均衡的方法來縮小圖像灰度差別;采用平滑濾波的方法去除圖像存在噪聲;采用邊緣增強(qiáng)的方法去改善圖像輪廓的不明顯。圖像增強(qiáng)主要應(yīng)用在圖像特別暗時,或者因?yàn)槠毓馓炼鵁o法讓目標(biāo)突出,這時就需要把目標(biāo)的亮度提高一點(diǎn),然后把不必要的障礙(噪聲)調(diào)暗,以把目標(biāo)清晰度最大化。
圖像增強(qiáng)的方法是通過一定手段對原始圖像附加一些信息或變換數(shù)據(jù),有選擇地突出圖像中感興趣的特征,或者抑制(掩蓋)圖像中某些不需要的特征,使圖像與視覺響應(yīng)特性相匹配。在圖像增強(qiáng)過程中,不分析圖像降質(zhì)的原因,處理后的圖像不一定逼近原始圖像。根據(jù)增強(qiáng)的信息不同,圖像增強(qiáng)可以分為邊緣增強(qiáng)、灰度增強(qiáng)、色彩飽和度增強(qiáng)等。其中,灰度增強(qiáng)又可以根據(jù)增強(qiáng)處理過程所在的空間不同分為空間域增強(qiáng)和頻率域增強(qiáng)兩大類,簡稱空域法和頻域法兩大類??臻g域增強(qiáng)是通過空間上的函數(shù)變換實(shí)現(xiàn)圖像的處理。實(shí)現(xiàn)空域變換的方式有兩種:一是基于像素點(diǎn)的,即每次對圖像處理針對每個像素進(jìn)行,與其他像素?zé)o關(guān),稱之為圖像的點(diǎn)運(yùn)算;二是基于模板的,也就是對圖像的每次處理針對圖像的每個子圖進(jìn)行,每個子圖都是以某個像素點(diǎn)為中心的幾何形鄰域,稱之為鄰域運(yùn)算、模板運(yùn)算或者鄰域去噪算法。頻率域增強(qiáng)是將圖像經(jīng)傅里葉變換后的頻譜成分進(jìn)行處理,然后逆傅里葉變換獲得所需的圖像,基于頻域的算法是在圖像的某種變換域內(nèi)對圖像的變換系數(shù)值進(jìn)行某種修正,是一種間接增強(qiáng)的算法。
(1)空域法空域法主要是直接在空間域內(nèi)對圖像進(jìn)行運(yùn)算處理,分為點(diǎn)運(yùn)算算法和鄰域去噪算法。點(diǎn)運(yùn)算通常包括灰度變換和直方圖修正等,目的是使圖像成像均勻,或擴(kuò)大圖像動態(tài)范圍,擴(kuò)展對比度。鄰域增強(qiáng)算法分為圖像平滑和銳化兩種。平滑一般用于消除圖像噪聲,但是也容易引起邊緣的模糊,常用算法有均值濾波、中值濾波。銳化的目的在于突出物體的邊緣輪廓,便于目標(biāo)識別,常用算法有梯度法、算子、高通濾波、掩膜匹配法、統(tǒng)計差值法等。
(2)頻域法頻域法是利用圖像變換方法將原來的圖像空間中的圖像以某種形式轉(zhuǎn)換到其他空間中,然后利用該空間的特有性質(zhì)進(jìn)行圖像處理,最后轉(zhuǎn)換回原來的圖像空間中,從而得到處理后的圖像。頻域法增強(qiáng)技術(shù)的基礎(chǔ)是卷積理論。其中,頻域變換可以是傅里葉變換、小波變換、DCT變換、Walsh變換等。
2.2.3?圖像分割
圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,包括圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但是還沒有一種普遍適用于各種圖像的有效方法。
2.2.4 圖像重建
對一些三維物體,應(yīng)用X射線、超聲波等物理方法,取得物體內(nèi)部結(jié)構(gòu)數(shù)據(jù),再將這些數(shù)據(jù)進(jìn)行運(yùn)算處理而構(gòu)成物體內(nèi)部某些部位的圖像。目前圖像重建最成功的例子是CT技術(shù)(計算機(jī)斷層掃描成像技術(shù))、彩色超聲波等。文章來源:http://www.zghlxwxcb.cn/news/detail-681215.html
2.2.5 圖像分類
圖像分類(識別)屬于模式識別的范疇,主要內(nèi)容是圖像經(jīng)過某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式分類和句法(結(jié)構(gòu))模式分類。近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識別中也越來越受重視。文章來源地址http://www.zghlxwxcb.cn/news/detail-681215.html
到了這里,關(guān)于open cv快速入門系列---數(shù)字圖像基礎(chǔ)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!