北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析

上傳人:2127513****773577... 文檔編號:59586607 上傳時(shí)間:2022-03-03 格式:DOC 頁數(shù):21 大?。?.18MB
收藏 版權(quán)申訴 舉報(bào) 下載
北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析_第1頁
第1頁 / 共21頁
北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析_第2頁
第2頁 / 共21頁
北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析_第3頁
第3頁 / 共21頁

下載文檔到電腦,查找使用更方便

20 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析》由會(huì)員分享,可在線閱讀,更多相關(guān)《北理工賈云德《計(jì)算機(jī)視覺》chapter03二值圖像分析(21頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。

1、精選優(yōu)質(zhì)文檔-----傾情為你奉上 第三章 二值圖像分析 一幅數(shù)字圖像是一個(gè)二維陣列,陣列元素值稱為灰度值或強(qiáng)度值.實(shí)際上,圖像在量化成數(shù)字圖像前是一個(gè)連續(xù)強(qiáng)度函數(shù)的集合,場景信息就包含在這些強(qiáng)度值中.圖像強(qiáng)度通常被量化成256個(gè)不同灰度級,對某些應(yīng)用來說,也常有32、64、128或512個(gè)灰度級的情況,在醫(yī)療領(lǐng)域里甚至使用高達(dá)4096(12bits)個(gè)灰度級.很明顯,灰度級越高,圖像質(zhì)量越好,但所需的內(nèi)存也越大.   在機(jī)器視覺研究的早期,由于內(nèi)存和計(jì)算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主要集中在研究輸入圖像僅包含兩個(gè)灰度值的二值視覺系統(tǒng)上.人們注意到,人類視

2、覺在理解僅由兩個(gè)灰度級組成的線條、輪廓影像或其它圖像時(shí)沒有任何困難,而且應(yīng)用場合很多,這一點(diǎn)對研究二值視覺系統(tǒng)的研究人員是一個(gè)極大的鼓舞. 隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng)和計(jì)算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng).盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下:⑴ 計(jì)算二值圖像特性的算法非常簡單,容易理解和實(shí)現(xiàn),并且計(jì)算速度很快.⑵ 二值視覺所需的內(nèi)存小,對計(jì)算設(shè)備要求低.工作在256個(gè)灰度級的視覺系統(tǒng)所需內(nèi)存是工作在相同大小二值圖像視覺系統(tǒng)所需內(nèi)存的八倍.如若利用游程長度編碼等技術(shù)(見3.4節(jié))還可使所需內(nèi)存進(jìn)一步減少.由于二值圖像中的許多運(yùn)

3、算是邏輯運(yùn)算而不是算術(shù)運(yùn)算,所以所需的處理時(shí)間很短.(3)許多二值視覺系統(tǒng)技術(shù)也可以用于灰度圖像視覺系統(tǒng)上.在灰度或彩色圖像中,表示一個(gè)目標(biāo)或物體的一種簡易方法就是使用物體模板(mask),物體模板就是一幅二值圖像,其中1表示目標(biāo)上的點(diǎn),0表示其它點(diǎn).在物體從背景中分離出來后,為了進(jìn)行決策,還需要求取物體的幾何和拓?fù)涮匦裕@些特性可以從它的二值圖像計(jì)算出來.因此,盡管我們是在二值圖像上討論這些方法,但它們的應(yīng)用并不限于二值圖像. 一般來說,當(dāng)物體輪廓足以用來識(shí)別物體且周圍環(huán)境可以適當(dāng)?shù)乜刂茣r(shí),二值視覺系統(tǒng)是非常有用的.當(dāng)使用特殊的照明技術(shù)和背景并且場景中只有少數(shù)物體時(shí),物體可以很容易

4、地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)場合都屬于這種情況.二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性.二值圖像可用來計(jì)算特定任務(wù)中物體的幾何和拓?fù)涮匦?,在許多應(yīng)用中,這種特性對識(shí)別物體來說是足夠的.二值視覺系統(tǒng)已經(jīng)在光學(xué)字符識(shí)別、染色體分析和工業(yè)零件的識(shí)別中得到了廣泛應(yīng)用. 在下面的討論中,假定二值圖像大小為,其中物體像素值為1,背景像素值為0. 3.1 閾值 視覺系統(tǒng)中的一個(gè)重要問題是從圖像中識(shí)別代表物體的區(qū)域(或子圖像),這種對人來說是件非常容易的事,對計(jì)算機(jī)來說

5、卻是令人吃驚的困難.為了將物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進(jìn)行分割.把圖像劃分成區(qū)域的過程稱為分割,即把圖像劃分成區(qū)域,使得每一個(gè)區(qū)域?qū)?yīng)一個(gè)候選的物體.下面給出分割的嚴(yán)格定義.  定義 分割是把像素聚合成區(qū)域的過程,使得: l 整幅圖像 (是一個(gè)完備分割 ). l ,(是一個(gè)完備分割). l 每個(gè)區(qū)域滿足一個(gè)謂詞,即區(qū)域內(nèi)的所有點(diǎn)有某種共同的性質(zhì). l 不同區(qū)域的圖像,不滿足這一謂詞. 正如上面所表明的,分割滿足一個(gè)謂詞,這一謂詞可能是簡單的,如分割灰度圖像時(shí)用的均勻灰度分布、相同紋理等謂詞,但在大多數(shù)應(yīng)用場合,謂詞十分復(fù)雜.在圖像理解過程中,分割是一個(gè)

6、非常重要的步驟. 二值圖像可以通過適當(dāng)?shù)胤指罨叶葓D像得到.如果物體的灰度值落在某一區(qū)間內(nèi),并且背景的灰度值在這一區(qū)間之外,則可以通過閾值運(yùn)算得到物體的二值圖像,即把區(qū)間內(nèi)的點(diǎn)置成1,區(qū)間外的點(diǎn)置成0.對于二值視覺,分割和閾值化是同義的.閾值化可以通過軟件來實(shí)現(xiàn),也可以通過硬件直接完成. 通過閾值運(yùn)算是否可以有效地進(jìn)行圖像分割,取決于物體和背景之間是否有足夠的對比度.設(shè)一幅灰度圖像中物體的灰度分布在區(qū)間內(nèi),經(jīng)過閾值運(yùn)算后的圖像為二值圖像,即: (3.1)   如果物體灰度值分布在幾個(gè)不相鄰區(qū)間內(nèi)時(shí)

7、,閾值化方案可表示為: (3.2) 其中Z是組成物體各部分灰度值的集合.圖3.1是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結(jié)果.   閾值算法與應(yīng)用領(lǐng)域密切相關(guān).事實(shí)上,某一閾值運(yùn)算常常是為某一應(yīng)用專門設(shè)計(jì)的,在其它應(yīng)用領(lǐng)域可能無法工作.閾值選擇常常是基于在某一應(yīng)用領(lǐng)域獲取的先驗(yàn)知識(shí),因此在某些場合下,前幾輪運(yùn)算通常采用交互式方式來分析圖像,以便確定合適的閾值.但是,在機(jī)器視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能(autonomy)要求,必須進(jìn)行自動(dòng)閾值選擇.現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關(guān)的物體知識(shí)

8、來自動(dòng)選擇適當(dāng)閾值的技術(shù).其中的一些方法將在3.2節(jié)介紹. 圖3.1 一幅灰度圖像和使用不同閾值得到的二值圖像結(jié)果.上左:原始灰度圖像,上右:閾值T=100;左下:T=128.右下:T1=100|T2=128. 3.2 幾何特性 通過閾值化方法從圖像中檢測出物體后,下一步就要對物體進(jìn)行識(shí)別和定位.在大多數(shù)工業(yè)應(yīng)用中,攝像機(jī)的位置和環(huán)境是已知的,因此通過簡單的幾何知識(shí)就可以從物體的二維圖像確定出物體的三維位置.在大多數(shù)應(yīng)用中,物體的數(shù)量不是很多,如果物體的尺寸和形狀完全不同,則可以利用尺度和形狀特征來識(shí)別這些物體.實(shí)際上在許多工業(yè)應(yīng)用中,經(jīng)常使用區(qū)域的一些簡單特征,如大小、位置和方向,

9、來確定物體的位置并識(shí)別它們. 3.2.1 尺寸和位置   一幅二值圖像區(qū)域的面積(或零階矩)由下式給出: (3.3) 在許多應(yīng)用中,物體的位置起著十分重要的作用.工業(yè)應(yīng)用中,物體通常出現(xiàn)在已知表面(如工作臺(tái)面)上,而且攝像機(jī)相對臺(tái)面的位置也是已知的.在這種情況下,圖像中的物體位置決定了它的空間位置.確定物體位置的方法有許多,比如用物體的外接矩形、物體矩心(區(qū)域中心)等來表示物體的位置.區(qū)域中心是通過對圖像進(jìn)行“全局”運(yùn)算得到的一個(gè)點(diǎn),因此它對圖像中的噪聲相對來說是不敏感的.對于二值圖像,物體的中心

10、位置與物體的質(zhì)心相同,因此可以使用下式求物體的中心位置:           (3.4) 其中和是區(qū)域相對于左上角圖像的中心坐標(biāo).物體的位置為: (3.5) 這些是一階矩.注意,由于約定y軸向上,因此方程3.4和3.5的第二個(gè)式子的等號右邊加了負(fù)號. 3.2.2 方向 計(jì)算物體的方向比計(jì)算它的位置稍微復(fù)雜一點(diǎn).某些形狀(如圓)的方向不是唯一的,為了定義唯一的方向,一般假定物體是長形的,其長軸方向被定義為物體的方向.通常,二維平面上與最小慣量軸

11、同方向的最小二階矩軸被定為長軸. 圖像中物體的二階矩軸是這樣一條線,物體上的全部點(diǎn)到該線的距離平方和最?。o出一幅二值圖像,計(jì)算物體點(diǎn)到直線的最小二乘方擬合,使所有物體點(diǎn)到直線的距離平方和最?。? (3.6) 其中是物體點(diǎn)到直線的距離.為了避免直線處于近似垂直時(shí)所出現(xiàn)的數(shù)值病態(tài)問題,人們一般把直線表示成極坐標(biāo)形式: (3.7) 如圖3.2所示,是直線的法線與x軸的夾角,是直線到原點(diǎn)的距離.把點(diǎn)坐標(biāo)代入直線的極坐

12、標(biāo)方程得出距離: (3.8) 圖3.2 直線的極坐標(biāo)表示 將方程3.8代入方程3.6并求極小化問題,可以確定參數(shù)和: (3.9) 令對的導(dǎo)數(shù)等于零求解得: (3.10) 它說明回歸直線通過物體中心.用這一值代入上面的,則極小化問題變?yōu)椋? (3.11) 其中的參數(shù):

13、 (3.12) 是二階矩.表達(dá)式可重寫為: (3.13) 對微分,并置微分結(jié)果為零,求解q 值: (3.14) 因此,慣性軸的方向由下式給出: (3.15) 所以由的最小值可以確定方向軸.注意,如果,那么物體就不會(huì)只有唯一的方向軸.物體的伸長率是的最大值與最小值之比:

14、 (3.16) 3.2.3 密集度和體態(tài)比 區(qū)域的密集度(compact)可用下面的式子來度量:    (3.17) 其中,和A分別為圖形的周長和面積.根據(jù)這一衡量標(biāo)準(zhǔn),圓是最密集的圖形,其密集密度為最大值,其它一些圖形的比值要小一些.讓我們來看一下圓,當(dāng)圓后仰時(shí),形狀成了一橢圓,面積減小了而周長卻不象面積減小的那么快,因此密集度降低了.在后仰到極限角時(shí),橢圓被壓縮成了一條無限長直線,橢圓的周長為無窮大,故密集度變成了零.對

15、于數(shù)字圖像, 是指物體尺寸(像素點(diǎn)數(shù)量)除以邊界長度的平方.這是一種很好的散布性或密集性度量方法.這一比值在許多應(yīng)用中被用作為區(qū)域的一個(gè)特征. 密集度的另一層意義是:在給定周長的條件下,密集度越高,圍成的面積就越大.注意在等周長的情況下,正方形密集度大于長方形密集度. 體態(tài)比定義為區(qū)域的最小外接矩形的長與寬之比,正方形和圓的體態(tài)比等于1,細(xì)長形物體的體態(tài)比大于1.圖3.3所示的是幾種形狀的外接矩形. 圖3.3 幾種外接矩形示意圖 3.3 投影   給定一條直線,用垂直該直線的一簇等間距直線將一幅二值圖像分割成若干條,每一條內(nèi)像素值為1的像素個(gè)數(shù)為該條二值圖像在給定直

16、線上的投影(projection).當(dāng)給定直線為水平或垂直直線時(shí),計(jì)算二值圖像每一列或每一行上像素值為1的像素?cái)?shù)量,就得到了二值圖像的水平和垂直投影,如圖3.4所示.由于投影包含了圖像的許多信息,所以投影是二值圖像的一種簡潔表示方式.顯然,投影不是唯一的,同樣的投影可能對應(yīng)不同的圖像. 圖3.4 一幅二值圖像及其水平投影圖   在某些應(yīng)用中,投影可以作為物體識(shí)別的一個(gè)特征.投影既是一種簡潔的圖像表示,又可以實(shí)現(xiàn)快速算法.下面介紹對角線投影的求解方法.對角線投影的關(guān)鍵是計(jì)算當(dāng)前行和列對應(yīng)的投影分布圖位置標(biāo)號.設(shè)行和列的標(biāo)號分別用和表示.若圖像矩陣為行列,則和的范圍分別為0到和0到.

17、假設(shè)對角線的標(biāo)號用行和列的仿射變換(線性組合加上常數(shù))計(jì)算,即: (3.18) 對角線投影共對應(yīng)個(gè)條,其中仿射變換把右上角像素映射成對角線投影的第一個(gè)位置,把左下角像素映射成最后一個(gè)位置,如圖3.5所示,則當(dāng)前行列對應(yīng)的標(biāo)號d的公式為: (3.19) 圖3.5 二值圖像及其對角線上的投影圖 3.4 游程長度編碼 游程長度編碼(run-length encoding)

18、是另一種二值圖像的簡潔表示方法,它是用圖像像素值連續(xù)為1的個(gè)數(shù)(像素1的長度)來描述圖像.這種編碼已被用于圖像傳輸.另外,圖像的某些性質(zhì),如物體區(qū)域面積,也可以從游程長度編碼直接計(jì)算出來. 在游程長度編碼中經(jīng)常運(yùn)用兩種方法,一種是使用1的起始位置和1的游程長度,另一種是僅僅使用游程長度,但須從1的游程長度開始描述,如圖3.6所示. 0 1 1 0 0 1 1 1 0 0 0 0 1 1 1 1 1 1 0 1 0 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1

19、 1 1 1 0 0 0 0 0 1 0 0 0 0 0 1 1 1 1 1的游程(2,2) (6,3) (13,6) (20,1) (4,6) (11,10) (1,5 ) (11,1) (17,4) 1和0的游程長度:0,2,2,3,4,6,1,1 0,3,6,1,10 5,5,1,5,4 圖3.6 一幅簡單二值圖像的游程長度編碼. 如果用第二種方法來表示圖像每行的游程長度,并

20、用代表圖像第行的第個(gè)游程長度,則全部1的游程長度之和就是所求物體的面積. (3.20) 其中是第行游程個(gè)數(shù),取整,表示1的游程個(gè)數(shù). 由游程長度編碼能很容易地計(jì)算水平投影而無需變成原來的圖像.使用更巧妙的方法也能從游程長度編碼計(jì)算出垂直和對角線投影. 3.5 二值圖像算法 從背景中分離出物體是一個(gè)困難的問題,在此將不討論這個(gè)問題.這里假設(shè)物體可以從背景中分離,并且使用某一謂詞,可以對圖像中屬于物體的點(diǎn)進(jìn)行標(biāo)記.因此,問題就變?yōu)槿绾螌⒁环鶊D像中所有被標(biāo)記的點(diǎn)組合成物體圖像.這里還假設(shè)物體點(diǎn)在空

21、間上是非常接近的.利用空間接近概念可以嚴(yán)格定義,利用此定義研究的算法可以把空間上非常接近的點(diǎn)聚合在一起,構(gòu)成圖像的一個(gè)成分(component).下面首先引進(jìn)一些定義,然后討論有關(guān)算法. 3.5.1 定義   (1) 近鄰 在數(shù)字圖像中,一個(gè)像素在空間上可能非常接近其它一些像素.在用方格表示的數(shù)字圖像中,一個(gè)像素與其它四個(gè)像素有公共邊界,并與另外四個(gè)像素共享頂角.如果兩個(gè)像素有公共邊界,則把它們稱為4-近鄰(4-neighbors).同樣,如果兩個(gè)像素至少共享一個(gè)頂角,則稱它們?yōu)?-近鄰.例如,位于的像素有四個(gè)4-近鄰:,,,.它的8-近鄰包括這四個(gè)4-近鄰,再加上,,,.一個(gè)像素被認(rèn)

22、為與它的4-近鄰是4-連通(4-connected)關(guān)系,與它的8-近鄰是8-連通關(guān)系(如圖3.7). 圖3.7 矩形像素網(wǎng)格的4-近鄰和8-近鄰示意圖.像素位于圖的中心. (2) 路徑 從像素到像素的路徑(path)是指一個(gè)像素序列,,..., ,其中像素是像素的近鄰像素,.如果近鄰關(guān)系是4-連通的,則路徑是4-路徑;如果是8-連通的,則稱為8-路徑.圖3.8即為路徑的兩個(gè)簡單例子. 圖3.8 4-路徑和8—路徑示意圖 (3) 前景 圖像中值為1的全部像素的集合稱為前景(foreground),用S表示. (4) 連

23、通性 已知像素,如果存在一條從p到q的路徑,且路徑上的全部像素都包含在S中,則稱p與q是連通的. 注意,連通性(connectivity)是等價(jià)關(guān)系.對屬于S的任意三個(gè)像素p、q和r,有下列性質(zhì): 1. 像素p與p本身連通(自反性). 2. 如果p與q連通,則q與p連通(互換性). 3. 如果p與q連通且q與r連通,則p與r連通(傳遞性). (5) 連通成份 一個(gè)像素集合,如果集合內(nèi)的每一個(gè)像素與集合內(nèi)其它像素連通,則稱該集合為一個(gè)連通成份(connected component). (6) 背景 `S(S的補(bǔ)集)中包含圖

24、像邊界點(diǎn)的所有連通成份的集合稱為背景(background).`S中所有其它元稱為洞.考慮下面的兩個(gè)圖像. 首先看左圖中有幾個(gè)洞和幾個(gè)物體.如果從前景和背景來考慮4-連通,有四個(gè)大小為-個(gè)像素的物體和一個(gè)洞.如果考慮8-連通,那么有一個(gè)物體而沒有洞.直觀地,在這兩種情況下出現(xiàn)了不確定性情況.右圖為另一個(gè)類似的不確定問題.其中如果1是連通的,那么0就應(yīng)該是不連通的. 為了避免這種難以處理的情況,對物體和背景應(yīng)使用不同的連通.如果我們對S使用8-連通,那么對`S就應(yīng)使用4-連通. (7) 邊界 S的邊界(boundary)是S中與`S中有4-連通關(guān)系的像素集

25、合.邊界通常記為. (8) 內(nèi)部 內(nèi)部(interior)是中不屬于它的邊界的像素集合.的內(nèi)部等于-. (9) 包圍 如果從S中任意一點(diǎn)到圖像邊界的4-路徑必須與區(qū)域T相交,則區(qū)域T包圍(surrounds)區(qū)域S(或S在T內(nèi)).圖3.9即為一幅簡單二值圖像和它的邊界、內(nèi)部、包圍示意圖. 圖3.9 一幅二值圖像與它的邊界 , 內(nèi)部 和包圍 3.5.2連通成份標(biāo)記 在一幅圖像中找出連通成份是機(jī)器視覺中最常見的運(yùn)算之一.連通區(qū)域內(nèi)的點(diǎn)構(gòu)成表示物體的候選區(qū)域.機(jī)器視覺中的大多數(shù)物體都有表面,顯然,物體表面點(diǎn)投影到圖像平面上

26、會(huì)形成空間上密集的點(diǎn)集.這里應(yīng)該指出,連通成份算法常常會(huì)在二值視覺系統(tǒng)中形成瓶頸效應(yīng),原因是連通成份運(yùn)算是一個(gè)全局性的運(yùn)算,這種算法在本質(zhì)上是序貫的.如果圖像中僅有一個(gè)物體,那么找連通成份就沒有必要;如果圖像中有許多物體,且需要求出物體的特性與位置,則必須確定連通成份. 連通標(biāo)記算法可以找到圖像中的所有連通成份,并對同一連通成份中的所有點(diǎn)分配同一標(biāo)記.圖3.10表示的是一幅圖像和已標(biāo)記的連通成份.在很多應(yīng)用中,要求在標(biāo)記連通成份的同時(shí)算出連通成份的特征,如尺寸、位置、方向和外接矩形.下面介紹兩種連通成份標(biāo)記算法:遞歸算法和序貫算法[Jain 1995]. 圖3.10 一副圖像及其連通成

27、分圖像  ?。ǎ保┻f歸算法 遞歸算法在串行處理器上的計(jì)算效率是很低的,因此,這一算法主要用于并行機(jī)上. 算法3.1 連通成份遞歸算法 1. 掃描圖像,找到?jīng)]有標(biāo)記的1點(diǎn),給它分配一個(gè)新的標(biāo)記L. 3. 遞歸分配標(biāo)記L給1點(diǎn)的鄰點(diǎn). 3. 如果不存在沒標(biāo)記的點(diǎn),則停止. 4. 返回第一步.  ?。ǎ玻┬蜇炈惴? 序貫算法通常要求對圖像進(jìn)行二次處理.由于這一算法一次僅運(yùn)算圖像的兩行,因此當(dāng)圖像以文件形式存貯且空間不允許把整幅圖像載入內(nèi)存時(shí)也能使用這一算法.這一算法(見算法3.2)可以查看某一點(diǎn)的鄰點(diǎn),并且可以給像素值

28、為1的鄰點(diǎn)分配一個(gè)已經(jīng)使用過的標(biāo)記.如果圖像的鄰點(diǎn)有兩種不同的標(biāo)記,則用一個(gè)等價(jià)表(equivalent table)來記錄所有的等價(jià)標(biāo)記.在第二次處理過程中,使用這一等價(jià)表來給某一連通成份中所有像素點(diǎn)分配唯一的標(biāo)記. 本算法在從左到右、從上到下掃描圖像時(shí),算法僅能查詢到某一像素點(diǎn)的4-近鄰中的兩個(gè)近鄰點(diǎn),即上點(diǎn)與左點(diǎn).設(shè)算法已經(jīng)查到了該像素的這兩個(gè)近鄰點(diǎn),此時(shí)出現(xiàn)三種情況:(1) 如果這兩個(gè)近鄰點(diǎn)中沒有一點(diǎn)為1,則該像素點(diǎn)需要一個(gè)新的標(biāo)記.(2) 如果這兩個(gè)近鄰點(diǎn)中只有一點(diǎn)為1,且分配了標(biāo)記L,那么該像素點(diǎn)的標(biāo)記也為L.(3) 如果這兩個(gè)鄰點(diǎn)都為1,且已分配了標(biāo)記L,則該像素點(diǎn)的標(biāo)

29、記還是L;但是當(dāng)近鄰點(diǎn)被分配了不同標(biāo)記M與N,則這兩個(gè)標(biāo)記被用于了同一組元,應(yīng)該把它們合并.在這種情況下,應(yīng)把其中的一個(gè)標(biāo)記(一般選用最小的那個(gè)標(biāo)記)分配給該像素點(diǎn),并在等價(jià)表中登記為等價(jià)標(biāo)記. 等價(jià)表包含了給每一連通成份分配唯一標(biāo)記的信息.在第一次掃描中,所有屬于同一連通成份的標(biāo)記被視為是等價(jià)的.在第二次掃描中,從一個(gè)等價(jià)集(equivalent set)中選擇一個(gè)標(biāo)記并分配給連通成份中所有像素點(diǎn).通常將最小的標(biāo)記分配給一個(gè)連通成份.第二次掃描將給每一連通成份分配唯一的標(biāo)記. 在找到所有的連通成份后,應(yīng)該統(tǒng)計(jì)等價(jià)表,以便刪除其中的空格;然后將等價(jià)表作為查找表對圖像重新進(jìn)行

30、掃描,以便重新統(tǒng)計(jì)圖像中的標(biāo)記. 計(jì)算每一連通成份的面積、一階矩、二階矩是序貫連通成份算法的一個(gè)部分.當(dāng)然,必須使用分離變量來累加每一區(qū)域的矩信息.當(dāng)區(qū)域合并后,每一區(qū)域的矩累計(jì)值也應(yīng)加到一起. 算法3.2 4-連通序貫連通成份算法 1. 從左至右、從上到下掃描圖像. 2. 如果像素點(diǎn)為1,則: (a) 如果上面點(diǎn)和左面點(diǎn)有一個(gè)標(biāo)記,則復(fù)制這一標(biāo)記. (b) 如果兩點(diǎn)有相同的標(biāo)記,復(fù)制這一標(biāo)記. (c) 如果兩點(diǎn)有不同的標(biāo)記,則復(fù)制上點(diǎn)的標(biāo)記且將兩個(gè)標(biāo)記輸入等價(jià)表中作為等價(jià)標(biāo)記. (d) 否則給這一個(gè)像素點(diǎn)分配一新的標(biāo)記并將這一標(biāo)記輸入等價(jià)表.

31、 3. 如果需考慮更多的點(diǎn),則回到第二步. 4. 在等價(jià)表的每一等價(jià)集中找到最低的標(biāo)記. 5. 掃描圖像,用等價(jià)表中的最低標(biāo)記取代每一標(biāo)記. 3.5.3 歐拉數(shù) 在許多應(yīng)用中,虧格數(shù)(genus)或歐拉數(shù)可作為識(shí)別物體的特征.虧格數(shù)定義為連通成份數(shù)減去空洞數(shù), (3.21) 其中,,和分別是歐拉數(shù)、連通成份數(shù)與空洞數(shù).這個(gè)式子給出了一個(gè)簡單的拓樸特征,這種拓?fù)涮卣骶哂衅椒€(wěn)、旋轉(zhuǎn)和比例不變特性.圖3.11給出了一些例子及其對應(yīng)的歐拉數(shù).

32、 圖3.11 字母“A”、“B”、“”及它們的歐拉數(shù).注意前景 用了8-連通,而背景用了4-連通. 3.5.4 區(qū)域邊界 連通成份S的邊界是那些屬于S且與`S鄰接的點(diǎn)集.使用簡單的局部運(yùn)算就可找到邊界點(diǎn).在大多數(shù)應(yīng)用中,我們都想用一特定的順序跟蹤邊界點(diǎn).一般的算法是按順時(shí)針方向跟蹤區(qū)域的所有點(diǎn).此處討論一個(gè)簡單的邊界跟蹤算法. 假定物體邊界不在圖像的邊界上(即物體完全在圖像內(nèi)部),邊界跟蹤算法先選擇 一起始點(diǎn),然后跟蹤邊界直到回到起始點(diǎn).這種算法概括在算法3.3中.這種算法對尺寸大于1個(gè)象素的所有區(qū)域都是有效的.用這種算法求區(qū)域8-鄰點(diǎn)的邊界如圖

33、3.12(a)所示.為了得到平滑的圖像邊界,可以在檢測和跟蹤圖像邊界后,利用邊界點(diǎn)的方向信息來平滑邊界。顯然,圖像邊界噪聲越大,圖像邊界點(diǎn)變化越劇烈,圖像邊界相鄰點(diǎn)的方向變化數(shù)(與差分鏈碼有一點(diǎn)區(qū)別,鏈碼見第七章)也越大.根據(jù)這一特點(diǎn),設(shè)置一個(gè)邊界點(diǎn)方向變化數(shù)閾值,把方向變化數(shù)大于這一閾值的圖像邊界點(diǎn)濾除,由此可得到平滑的圖像邊界。圖3.12(b)所示的是一個(gè)經(jīng)過平滑過的區(qū)域邊界示意圖,其中的方向變化數(shù)閾值為1。注意,由于采用8-鄰點(diǎn)邊界跟蹤,因此方向變化數(shù)的最大值為4。如果閾值設(shè)成4,則對原始邊界沒有平滑。邊界跟蹤和平滑常常結(jié)合在一起使用,見計(jì)算機(jī)作業(yè)3.5。 圖3.12 邊界

34、跟蹤算法結(jié)果,(a) 圖像邊界跟蹤結(jié)果;(b)邊界跟蹤與平滑結(jié)果. 算法3.3 邊界跟蹤算法 ① 從左到右、從上到下掃描圖像,求區(qū)域S的起始點(diǎn). ② 用c表示當(dāng)前邊界上被跟蹤的像素點(diǎn).置,記c左4-鄰點(diǎn)為b,. ③ 按逆時(shí)針方向從b開始將c的8個(gè)8-鄰點(diǎn)分別記為,, ④ 從b開始,沿逆時(shí)針方向找到第一個(gè), ⑤ 置,, ⑥ 重復(fù)步驟③、④、⑤,直到。 3.5.5 距離測量 在許多應(yīng)用中,找到一幅圖像中兩個(gè)像素點(diǎn)或兩個(gè)連通成份之間的距離是很有必要的.目前還沒有定義數(shù)字圖像距離的唯一方法,但對所

35、有的像素點(diǎn)p、q和 r,任何距離度量都必須滿足下列性質(zhì): 1. ,當(dāng)且僅當(dāng)時(shí), 2. 3. 下面是一些常用的距離函數(shù) 歐幾里德距離: ( 3.22) 街區(qū)距離: (3.23) 棋盤距離: (3.24) 3.5.6 中軸 如果對中像素的所有鄰點(diǎn)有下式成立:

36、 (3.25) 則中像素到的距離是局部最大值.中所有到的距離是局部最大值的像素點(diǎn)集合稱為對稱軸或中軸,通常記為.使用4-近鄰的中軸變換的一些例子見圖3.13.圖3.13b表明少量噪聲會(huì)使中軸變換結(jié)果產(chǎn)生顯著的差異. 由和中每一點(diǎn)到的距離能重構(gòu)原始像素集.是的簡潔表示.可用來表示一個(gè)區(qū)域的形狀.通過去除中與距離較小的像素點(diǎn),可以生成一個(gè)簡化的集. 中軸可作為物體的一種簡潔表示.但是,二值圖像中的區(qū)域也可用其邊界來表示.邊界跟蹤算法可用來獲得表示邊界的序列點(diǎn).在第七章還將討論用鏈碼來簡潔地表示邊界的方法.對任意物體,邊界將是區(qū)域的簡潔表示.但要明確給定像素點(diǎn)是否在

37、某一區(qū)域內(nèi),中軸則是更好的表示,因?yàn)槭褂弥休S上的像素點(diǎn)和每一個(gè)給定像素點(diǎn)的最大距離圓盤(中軸距離變換),可以很容易地檢測出給定像素是否在中軸定義的區(qū)域中. 圖 3.13 中軸變換舉例 3.5.7 細(xì)化 細(xì)化(thinning)是一種圖像處理運(yùn)算,可以把二值圖像區(qū)域縮成線條,以逼近區(qū)域的中心線,也稱之為骨架或核線.細(xì)化的目的是減少圖像成份,直到只留下區(qū)域的最基本信息,以便進(jìn)一步分析和識(shí)別.雖然細(xì)化可以用在包含任何區(qū)域形狀的二值圖像,但它主要對細(xì)長形(而不是凸圓形或水滴狀)區(qū)域有效.細(xì)化一般用于文本分析預(yù)處理階段,以便將文本圖像中線條圖畫或字符筆畫表示成單像素線條.細(xì)化要求

38、如下: (1) 連通圖像區(qū)域必須細(xì)化成連通線結(jié)構(gòu). (2) 細(xì)化結(jié)果最少應(yīng)該是8-連通(下面將要解釋). (3) 保留近似終止線的位置. (4) 細(xì)化結(jié)果應(yīng)該近似于中軸線. (5) 由細(xì)化引起的附加突刺(短分支)應(yīng)該是最小的. 細(xì)化結(jié)果應(yīng)該保證第一條要求中所定義的連通性,這一點(diǎn)是最基本的要求,它保證了連通線結(jié)構(gòu)的數(shù)量等于原始圖像中連通區(qū)域的數(shù)量.第二條要求保證所得到的線條總是含有8-連通圖像的最小數(shù)量.第三條要求說明終止線位置應(yīng)該保持不變.細(xì)化可以通過迭代方式不斷去除邊界點(diǎn)來實(shí)現(xiàn),重要的是在迭代過程中不要去除端點(diǎn)像素,因?yàn)檫@樣不僅會(huì)縮短細(xì)化線,丟掉結(jié)構(gòu)信息,而且不能保持其位置不變.

39、第四條要求說明所得線段應(yīng)能最好地逼近原始區(qū)域的中線,如兩個(gè)像素點(diǎn)寬的豎線或水平線的真正中線應(yīng)該位于這兩個(gè)像素之間半個(gè)像素間距的位置.在數(shù)字圖像中表示半個(gè)像素間距是不可能的,因此得到的結(jié)果是一條位于原直線一側(cè)的直線.第五條要求沒有明確指出噪聲的影響控制到最低程度,因?yàn)榕袛嘣肼暠旧硎且患茈y的事.一般不希望原始區(qū)域含有會(huì)引起突刺的隆起,但當(dāng)某些較大隆起是區(qū)域特征時(shí),卻必須識(shí)別它們.應(yīng)該指出,某些細(xì)化算法有去除突刺的參數(shù),不過最好將細(xì)化和去除噪聲分開進(jìn)行,這是由于某些情況下不需要的突刺,可能是另一些情況下所需要的短線.因此,最好的辦法是先進(jìn)行細(xì)化,然后單獨(dú)去除長度低于某一特定最小值的任何突刺. 一

40、種常用的細(xì)化手段是在至少鄰域內(nèi)檢查圖像的每一點(diǎn),剝?nèi)^(qū)域邊界.一次剝?nèi)ヒ粚訄D像,直至區(qū)域被細(xì)化成一條線.這一過程是用迭代法實(shí)現(xiàn)的,如算法3.4.在每次迭代時(shí),每一個(gè)像素點(diǎn)用窗函數(shù)檢查,為了保持連通性或線末端位置,將單像素厚的邊界擦除.在圖3.14中將會(huì)看到,在每次迭代中,值為1的外層區(qū)域就是用這種方式削掉的.當(dāng)?shù)Y(jié)果沒有變化時(shí),迭代過程結(jié)束,圖像得到細(xì)化 算法3.4?。矗徏?xì)化迭代算法 i 對于每一個(gè)像素,如果 (1) 沒有上近鄰(下近鄰\左近鄰\右近鄰) (2) 不是孤立點(diǎn)或終止線 (3) 去除該像素點(diǎn)不會(huì)斷開區(qū)域 則去除該像素點(diǎn). i 重復(fù)這一

41、步驟直到?jīng)]有像素點(diǎn)可以去除. 圖3.14 細(xì)化手寫體“華”的迭代過程.(a) 原圖像,(b)—(f)為 五次迭代過程,每次迭代削去一層邊界. 3.5.8 擴(kuò)展與收縮 圖像中的一個(gè)連通成份可以進(jìn)行全方位的擴(kuò)展(expanding)或收縮(shrinking).如果某一連通成份可以變化,使得一些背景像素點(diǎn)變成1,這一運(yùn)算就稱為擴(kuò)展.如果物體像素點(diǎn)全方位地消減或變?yōu)?時(shí),則稱為收縮.一種簡單的擴(kuò)展與收縮實(shí)現(xiàn)方法如下: 擴(kuò)展:如果近鄰點(diǎn)是1,則將該點(diǎn)從0變?yōu)?. 收縮:如果近鄰點(diǎn)是0,則將該點(diǎn)從1變?yōu)?. 這樣,收縮可以看作是擴(kuò)展背景.這類運(yùn)算的例子見圖3

42、.15. 需要指出,擴(kuò)展與收縮這樣簡單的運(yùn)算可以完成非常有用而又貌似很復(fù)雜的運(yùn)算.下面引進(jìn)符號 : S擴(kuò)展倍. :S收縮倍. 其中下列性質(zhì)必須滿足: 先擴(kuò)展后收縮算法能補(bǔ)上不希望存在的洞,如圖3.15(b)(d)所示;先收縮后擴(kuò)展算法則能去除孤立的噪聲點(diǎn),見圖3.15(c)(e).請注意,擴(kuò)展與收縮可用來確定孤立組元或簇.注意,擴(kuò)展后收縮有效地填滿了空洞卻沒有去除噪聲;相反,收縮后擴(kuò)展能去除噪聲卻沒有填滿空洞.在地形圖像處理和膨脹與腐蝕運(yùn)算中,擴(kuò)

43、展與收縮算法的一般形式被廣泛地用于許多任務(wù)中. 圖3.15 對字母“h”收縮與擴(kuò)展算法實(shí)驗(yàn)結(jié)果.(a)原始噪聲圖像;(b) 擴(kuò)展運(yùn)算;(c)收縮運(yùn)算;(d)擴(kuò)展后收縮運(yùn)算;(e)收縮后擴(kuò)展運(yùn)算. 3.6 形態(tài)算子 數(shù)學(xué)形態(tài)(morphology)這一名稱是從形狀研究得來的.這種方法也說明了一個(gè)事實(shí),即在許多機(jī)器視覺算法設(shè)計(jì)中,根據(jù)形狀來思考問題是最自然,也是最容易的.形態(tài)方法有助于進(jìn)行基于形狀或圖形思考.形態(tài)方法中圖像信息的基本單元是二值像素. 任意兩個(gè)二值圖像和的交是一個(gè)二值圖像,記為,即與中皆為1的圖像點(diǎn)p的集合:

44、 (3.26) 和B的并,記為,是一個(gè)二值圖像,是或B或兩者中為1的所有圖像點(diǎn)p的集合,用符號表示為: (3.27) 設(shè)W是全值二值圖像(所有的像素值皆為1),是二值圖像.的補(bǔ)集是中1與0互相交換后的二值圖像,即: ` (3.28) 標(biāo)號為與的兩像素點(diǎn)和,其向量和是標(biāo)號為的像素點(diǎn).向量差是標(biāo)號為的像素點(diǎn). 若是二值圖像

45、,是二值圖像中的一個(gè)像素點(diǎn),則被平移后的二值圖像由下式表示: (3.29) 即二值圖像被一個(gè)像素點(diǎn)平移是指將的原點(diǎn)移到   (1) 膨脹 已知二值圖像,如果是由二值圖像中像素值為1的點(diǎn)平移得到的,則由平移的并稱為被膨脹,即; (3.30) 膨脹具有結(jié)合性、交換性.這樣,在進(jìn)行膨脹的步驟序列中,完成運(yùn)算的順序就不重要了.這就允許我們將一個(gè)復(fù)雜的形狀拆成幾個(gè)簡單的形狀,然后重新

46、組合成為膨脹序列. (2) 腐蝕 腐蝕是膨脹的相反過程.二值圖像經(jīng)二值圖像腐蝕后在點(diǎn)仍為1的充分必要條件是:平移到后,中的1像素也是A中的1像素.被腐蝕可用下式表示: (3.31) 二值圖像常常是規(guī)則圖像,是作用于圖像中的一種探針,也稱為結(jié)構(gòu)元.腐蝕在許多應(yīng)用中起著十分重要的作用.結(jié)構(gòu)元對一幅圖像進(jìn)行腐蝕會(huì)生成一幅包含結(jié)構(gòu)元所有位置的圖像. 圖3.16到3.17是一個(gè)倒T形結(jié)構(gòu)元對一個(gè)簡單物體進(jìn)行膨脹與腐蝕運(yùn)算的示意圖.用結(jié)構(gòu)元進(jìn)行膨脹或腐蝕運(yùn)算也可以描述為:

47、結(jié)構(gòu)元的原點(diǎn)像素經(jīng)過待膨脹的二值圖像中所有1像素點(diǎn)時(shí),對應(yīng)結(jié)構(gòu)元所有1像素的待膨脹二值圖像像素置為1像素;在腐蝕運(yùn)算過程中,結(jié)構(gòu)元的原點(diǎn)像素經(jīng)過待腐蝕的二值圖像中所有1像素點(diǎn)時(shí),如果結(jié)構(gòu)元中有一個(gè)1像素沒有對應(yīng)待腐蝕二值圖像的1像素,則對應(yīng)結(jié)構(gòu)元原點(diǎn)的待腐蝕二值圖像1像素置為0. 圖3.16 原始測試圖像 (左)與結(jié)構(gòu)元B(右).注意結(jié)構(gòu)元的原點(diǎn) 比中的其它像素點(diǎn)要黑一些. (a) (b)    圖3.17 膨脹與腐蝕實(shí)驗(yàn)結(jié)果.(a)被膨脹,其中原始像素的邊界用粗黑線表示.(b)被腐蝕,其中原始像素的邊界用粗黑線表示

48、. 膨脹和腐蝕展示了幾何的而不是邏輯的對偶特性,這種特性也包含了幾何互補(bǔ)性與邏輯互補(bǔ)性.二值圖像的幾何互補(bǔ)稱為它的反射.二值圖像B的反射是與B關(guān)于原點(diǎn)對稱的二值圖像,即: (3.32) 膨脹與腐蝕的對偶性由下面關(guān)系式表示: (3.33) (3.34) 與幾何對偶性相比,邏輯對偶性的關(guān)系式為:

49、 (3.35) (3.36) 上式也稱為DeMorgan定律. 腐蝕與膨脹常常用于圖像濾波.如果已知噪聲特性,則可選用適當(dāng)?shù)慕Y(jié)構(gòu)元和一系列腐蝕與膨脹運(yùn)算來去除噪聲.請注意,這樣的濾波會(huì)影響圖像中物體的形狀. 數(shù)學(xué)形態(tài)中的基本運(yùn)算可以組合成很復(fù)雜的運(yùn)算.用同一結(jié)構(gòu)元(探針)腐蝕后再膨脹可去除比結(jié)構(gòu)元小的所有區(qū)域像素點(diǎn),而留下其余部分,這一順序稱為“開”運(yùn)算.如,用一圓形的探針將所有比探針小的區(qū)域刪除,實(shí)現(xiàn)抑制加性空域細(xì)節(jié)的濾波. 與上述處理順序相反

50、的過程是膨脹后再腐蝕,稱為“關(guān)”運(yùn)算,這種順序會(huì)填滿比探針小的孔洞和凹狀區(qū).這些運(yùn)算見圖3.18和圖3.17,其中結(jié)構(gòu)元采用了相同的T形結(jié)構(gòu).這里仍然存在一個(gè)問題是去除的圖像可能與保留的圖像一樣重要.這樣的濾波器可用來抑制空域特征或區(qū)分基于尺寸的物體類型.所用的結(jié)構(gòu)元不一定是簡潔的或規(guī)則的,可以是任意模式的像素點(diǎn)集合.這樣可以探測到具有一定分布的圖像特征. 關(guān)于數(shù)學(xué)形態(tài)的詳細(xì)內(nèi)容參見[Dougherty 1988, Haralick 1992] ,關(guān)于數(shù)學(xué)形態(tài)在字符識(shí)別中的應(yīng)用見[Mitchell 1989]. 圖3.18“開”運(yùn)算.左:腐蝕;右:膨脹.圖中的粗黑線表示原始圖像邊界

51、. 圖3.19 “關(guān)”運(yùn)算.左:膨脹;右:腐蝕.圖中的粗黑線表示原始圖像邊界. 思考題 3. 1考慮一幅二進(jìn)制圖像如圖3.20所示. (a) 分別使用4-連通和8-連通,求黑像素集合中包含有多少個(gè)區(qū)域. (b) 分別使用4-連通和8-連通,求白像素集合中包含有多少個(gè)區(qū)域. 圖3.20 題3.1圖 3. 2假定圖3.21的白色像素是邊緣點(diǎn).請分別使用4-連通和8-連通細(xì)化算法去除多余的白點(diǎn)(把去除的白點(diǎn)用陰影線表示). 圖3.21 題3.2圖

52、 3. 3連通域標(biāo)記算法是許多應(yīng)用中的“瓶頸”問題.連通域標(biāo)記可以看作是視覺系統(tǒng)中連接高層和低層算法的橋梁.請你給出一種連通標(biāo)記快速算法設(shè)計(jì)的構(gòu)思?請問能否開發(fā)出一種并行算法,為什么? 計(jì)算機(jī)練習(xí)題 3.1 開發(fā)一個(gè)算法來計(jì)算區(qū)域面積和游程代碼的第一、二階矩. 3.2 開發(fā)一個(gè)中軸算法.將這一算法作用于具有不同規(guī)則物體的二值圖像上,并研究這種技術(shù)在表示物體形狀時(shí)的優(yōu)點(diǎn)與缺點(diǎn). 3.3 構(gòu)造一種算法來實(shí)現(xiàn)膨脹與收縮運(yùn)算.使用這些算法來實(shí)現(xiàn)二值圖像中不同噪聲的濾波. 3.4 設(shè)計(jì)一個(gè)機(jī)器視覺系統(tǒng),該系統(tǒng)可以獲取場景的二值圖像并識(shí)別物體.考慮一些常用物體,如,硬幣、鋼筆、筆記本和其它的辦公用品.根據(jù)你在本章中學(xué)到的物體特征來建立物體識(shí)別策略,完成所有的運(yùn)算并測試你的系統(tǒng). 專心---專注---專業(yè)

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!