數字圖像處理和邊緣檢測-中文翻譯
《數字圖像處理和邊緣檢測-中文翻譯》由會員分享,可在線閱讀,更多相關《數字圖像處理和邊緣檢測-中文翻譯(4頁珍藏版)》請在裝配圖網上搜索。
中文譯文數字圖像處理和邊緣檢測1.數字圖像處理數字圖像處理方法的研究源于兩個主要應用領域:為便于人們分析而對圖像信息進行改進;為使機器自動理解而對圖像數據進行存儲、傳輸及顯示。一幅圖像可定義為一個二維函數 ,這里 x 和 y 是空間坐標,而在任何一對空間坐標(,)fxy上的幅值 f 稱為該點圖像的強度或灰度。當 和幅值 f 為有限的、離散的數值時,則圖像為(,)xy ,數字圖像。數字圖像處理是指借用數字計算機處理數字圖像,值得提及的是數字圖像是由有限的元素組成的,每一個元素都有一個特定的位置和幅值,這些元素稱為圖像元素、畫面元素或像素。像素是廣泛用于表示數字圖像元素的詞匯。視覺是人類最高級的感知器官,所以,毫無疑問圖像在人類感知中扮演著最重要的角色。然而,人類感知只限于電磁波譜的視覺波段,成像機器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無線電波。它們可以對非人類習慣的那些圖像源進行加工,這些圖像源包括超聲波、電子顯微鏡及計算機產生的圖像。因此,數字圖像處理涉及各種各樣的應用領域。圖像處理涉及的范疇或其他相關領域(例如,圖像分析和計算機視覺)的界定在初創(chuàng)人之間并沒有一致的看法。有時用處理的輸入和輸出內容都是圖像這一特點來界定圖像處理的范圍。我們認為這一定義僅是人為界定和限制。例如,在這個定義下,甚至最普通的計算一幅圖像灰度平均值的工作都不能算做是圖像處理。另一方面,有些領域(如計算機視覺)研究的最高目標是用計算機去模擬人類視覺,包括理解和推理并根據視覺輸入采取行動等。這一領域本身是人工智能的分支,其目的是模仿人類智能。人工智能領域處在其發(fā)展過程中的初期階段,它的發(fā)展比預期的要慢的多,圖像分析(也稱為圖像理解)領域則處在圖像處理和計算機視覺兩個學科之間。從圖像處理到計算機視覺這個連續(xù)的統(tǒng)一體內并沒有明確的界線。然而,在這個連續(xù)的統(tǒng)一體中可以考慮三種典型的計算處理(即低級、中級和高級處理)來區(qū)分其中的各個學科。低級處理涉及初級操作,如降低噪聲的圖像預處理,對比度增強和圖像尖銳化。低級處理是以輸入、輸出都是圖像為特點的處理。中級處理涉及分割(把圖像分為不同區(qū)域或目標物)以及縮減對目標物的描述,以使其更適合計算機處理及對不同目標的分類(識別) 。中級圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標識等)為特點的。最后,高級處理涉及在圖像分析中被識別物體的總體理解,以及執(zhí)行與視覺相關的識別函數(處在連續(xù)統(tǒng)一體邊緣)等。根據上述討論,我們看到,圖像處理和圖像分析兩個領域合乎邏輯的重疊區(qū)域是圖像中特定區(qū)域或物體的識別這一領域。這樣,在研究中,我們界定數字圖像處理包括輸入和輸出均是圖像的處理,同時也包括從圖像中提取特征及識別特定物體的處理。舉一個簡單的文本自動分析方面的例子來具體說明這一概念。在自動分析文本時首先獲取一幅包含文本的圖像,對該圖像進行預處理,提?。ǚ指睿┳址?,然后以適合計算機處理的形式描述這些字符,最后識別這些字符,而所有這些操作都在本文界定的數字圖像處理的范圍內。理解一頁的內容可能要根據理解的復雜度從圖像分析或計算機視覺領域考慮問題。這樣,我們定義的數字圖像處理的概念將在有特殊社會和經濟價值的領域內通用。數字圖像處理的應用領域多種多樣,所以文本在內容組織上盡量達到該技術應用領域的廣度。闡述數字圖像處理應用范圍最簡單的一種方法是根據信息源來分類(如可見光、X 射線,等等) 。在今天的應用中,最主要的圖像源是電磁能譜,其他主要的能源包括聲波、超聲波和電子(以用于電子顯微鏡方法的電子束形式) 。建模和可視化應用中的合成圖像由計算機產生。建立在電磁波譜輻射基礎上的圖像是最熟悉的,特別是 X 射線和可見光譜圖像。電磁波可定義為以各種波長傳播的正弦波,或者認為是一種粒子流,每個粒子包含一定(一束)能量,每束能量成為一個光子。如果光譜波段根據光譜能量進行分組,我們會得到下圖 1 所示的伽馬射線(最高能量)到無線電波(最低能量)的光譜。如圖所示的加底紋的條帶表達了這樣一個事實,即電磁波譜的各波段間并沒有明確的界線,而是由一個波段平滑地過渡到另一個波段。圖像獲取是第一步處理。注意到獲取與給出一幅數字形式的圖像一樣簡單。通常,圖像獲取包括如設置比例尺等預處理。圖像增強是數字圖像處理最簡單和最有吸引力的領域?;旧希鰪娂夹g后面的思路是顯現(xiàn)那些被模糊了的細節(jié),或簡單地突出一幅圖像中感興趣的特征。一個圖像增強的例子是增強圖像的對比度,使其看起來好一些。應記住,增強是圖像處理中非常主觀的領域,這一點很重要。圖像復原也是改進圖像外貌的一個處理領域。然而,不像增強,圖像增強是主觀的,而圖像復原是客觀的。在某種意義上說,復原技術傾向于以圖像退化的數學或概率模型為基礎。另一方面,增強以怎樣構成好的增強效果這種人的主觀偏愛為基礎。彩色圖像處理已經成為一個重要領域,因為基于互聯(lián)網的圖像處理應用在不斷增長。就使得在彩色模型、數字域的彩色處理方面涵蓋了大量基本概念。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎。小波是在各種分辨率下描述圖像的基礎。特別是在應用中,這些理論被用于圖像數據壓縮及金字塔描述方法。在這里,圖像被成功地細分為較小的區(qū)域。壓縮,正如其名稱所指的意思,所涉及的技術是減少圖像的存儲量,或者在傳輸圖像時降低頻帶。雖然存儲技術在過去的十年內有了很大改進,但對傳輸能力我們還不能這樣說,尤其在互聯(lián)網上更是如此,互聯(lián)網是以大量的圖片內容為特征的。圖像壓縮技術對應的圖像文件擴展名對大多數計算機用戶是很熟悉的(也許沒注意) ,如 JPG 文件擴展名用于 JPEG(聯(lián)合圖片專家組)圖像壓縮標準。形態(tài)學處理設計提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉換開始。分割過程將一幅圖像劃分為組成部分或目標物。通常,自主分割是數字圖像處理中最為困難的任務之一。復雜的分割過程導致成功解決要求物體被分別識別出來的成像問題需要大量處理工作。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會導致最終失敗。通常,分割越準確,識別越成功。表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數據,其構成不是區(qū)域的邊緣(區(qū)分一個圖像區(qū)域和另一個區(qū)域的像素集)就是其區(qū)域本身的所有點。無論哪種情況,把數據轉換成適合計算機處理的形式都是必要的。首先,必須確定數據是應該被表現(xiàn)為邊界還是整個區(qū)域。當注意的焦點是外部形狀特性(如拐角和曲線)時,則邊界表示是合適的。當注意的焦點是內部特性(如紋理或骨骼形狀)時,則區(qū)域表示是合適的。則某些應用中,這些表示方法是互補的。選擇一種表現(xiàn)方式僅是解決把原始數據轉換為適合計算機后續(xù)處理的形式的一部分。為了描述數據以使感興趣的特征更明顯,還必須確定一種方法。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標與其他目標的基礎。識別是基于目標的描述給目標賦以符號的過程。如上文詳細討論的那樣,我們用識別個別目標方法的開發(fā)推出數字圖像處理的覆蓋范圍。到目前為止,還沒有談到上面圖 2 中關于先驗知識及知識庫與處理模塊之間的交互這部分內容。關于問題域的知識以知識庫的形式被編碼裝入一個圖像處理系統(tǒng)。這一知識可能如圖像細節(jié)區(qū)域那樣簡單,在這里,感興趣的信息被定位,這樣,限制性的搜索就被引導到尋找的信息處。知識庫也可能相當復雜,如材料檢測問題中所有主要缺陷的相關列表或者圖像數據庫(該庫包含變化檢測應用相關區(qū)域的高分辨率衛(wèi)星圖像) 。除了引導每一個處理模塊的操作,知識庫還要控制模塊間的交互。這一特性上面圖 2 中的處理模塊和知識庫間用雙箭頭表示。相反單頭箭頭連接處理模塊。2.邊緣檢測邊緣檢測是圖像處理和計算機視覺中的術語,尤其在特征檢測和特征抽取領域,是一種用來識別數字圖像亮度驟變點即不連續(xù)點的算法。盡管在任何關于分割的討論中,點和線檢測都是很重要的,但是邊緣檢測對于灰度級間斷的檢測是最為普遍的檢測方法。雖然某些文獻提過理想的邊緣檢測步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。相反,它們通常受到一個或多個下面所列因素的影響:1.有限場景深度帶來的聚焦模糊;2.非零半徑光源產生的陰影帶來的半影模糊;3.光滑物體邊緣的陰影;4.物體邊緣附近的局部鏡面反射或者漫反射。一個典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是邊線,可能是在另外一種不變的背景上的少數不同顏色的點。在邊線的每一邊都有一個邊緣。在對數字圖像的處理中,邊緣檢測是一項非常重要的工作。如果將邊緣認為是一定數量點亮度發(fā)生變化的地方,那么邊緣檢測大體上就是計算這個亮度變化的導數。為簡化起見,我們可以先在一維空間分析邊緣檢測。在這個例子中,我們的數據是一行不同點亮度的數據。例如,在下面的 1 維數據中我們可以直觀地說在第 4 與第 5 個點之間有一個邊界:5 7 6 4 152 148 149如果光強度差別比第四個和第五個點之間小,或者說相鄰的像素點之間光強度差更高,就不能簡單地說相應區(qū)域存在邊緣。而且,甚至可以認為這個例子中存在多個邊緣。除非場景中的物體非常簡單并且照明條件得到了很好的控制,否則確定一個用來判斷兩個相鄰點之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。實際上,這也是為什么邊緣檢測不是一個簡單問題的原因之一。有許多用于邊緣檢測的方法,它們大致可分為兩類:基于搜索和基于零交叉.基于搜索的邊緣檢測方法首先計算邊緣強度,通常用一階導數表示,例如梯度模;然后,用計算估計邊緣的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值?;诹憬徊娴姆椒ㄕ业接蓤D像得到的二階導數的零交叉點來定位邊緣。通常用拉普拉斯算子或非線性微分方程的零交叉點,我們將在后面的小節(jié)中描述.濾波做為邊緣檢測的預處理通常是必要的,通常采用高斯濾波。已發(fā)表的邊緣檢測方法應用計算邊界強度的度量, 這與平滑濾波有本質的不同. 正如許多邊緣檢測方法依賴于圖像梯度的計算, 他們用不同種類的濾波器來估計 x-方向和 y-方向的梯度.一旦我們計算出導數之后,下一步要做的就是給出一個閾值來確定哪里是邊緣位置。閾值越低,能夠檢測出的邊線越多,結果也就越容易受到圖片噪聲的影響,并且越容易從圖像中挑出不相關的特性。與此相反,一個高的閾值將會遺失細的或者短的線段。如果邊緣閾值應用于正確的的梯度幅度圖像,生成的邊緣一般會較厚,某些形式的邊緣變薄處理是必要的。然而非最大抑制的邊緣檢測,邊緣曲線的定義十分模糊,邊緣像素可能成為邊緣多邊形通過一個邊緣連接(邊緣跟蹤)的過程。在一個離散矩陣中,非最大抑制階梯能夠通過一種方法來實現(xiàn),首先預測一階導數方向、然后把它近似到 45 度的倍數、最后在預測的梯度方向比較梯度幅度。一個常用的這種方法是帶有滯后作用的閾值選擇。這個方法使用不同的閾值去尋找邊緣。首先使用一個閾值上限去尋找邊線開始的地方。一旦找到了一個開始點,我們在圖像上逐點跟蹤邊緣路徑,當大于門檻下限時一直紀錄邊緣位置,直到數值小于下限之后才停止紀錄。這種方法假設邊緣是連續(xù)的界線,并且我們能夠跟蹤前面所看到的邊緣的模糊部分,而不會將圖像中的噪聲點標記為邊緣。但是,我們仍然存在選擇適當的閾值參數的問題,而且不同圖像的閾值差別也很大。其它一些邊緣檢測操作是基于亮度的二階導數。這實質上是亮度梯度的變化率。在理想的連續(xù)變化情況下,在二階導數中檢測過零點將得到梯度中的局部最大值。另一方面,二階導數中的峰值檢測是邊線檢測,只要圖像操作使用一個合適的尺度表示。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個亮度梯度,而在另一邊看到相反的梯度。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。為了找到這些邊線,我們可以在圖像亮度梯度的二階導數中尋找過零點??傊瑸榱藢τ幸饬x的邊緣點進行分類,與這個點相聯(lián)系的灰度級變換必須比在這一點的背景上變換更為有效。由于我們用局部計算進行處理,決定一個值是否有效的選擇方法就是使用門限。因此,如果一個點的二維一階導數比指定的門限大,我們就定義圖像中的此點是一個邊緣點。術語“邊緣線段”一般在邊緣與圖像的尺寸比起來很短時才使用。分割的關鍵問題是如何將邊緣線段組合成更長的邊緣。如果我們選擇使用二階導數,則另一個可用的定義是將圖像中的邊緣點定義為它的二階導數的零交叉點。此時,邊緣的定義同上面講過的定義是一樣的。應注意,這些定義并不能保證在一幅圖像中成功地找到邊緣,它們只是給了我們一個尋找邊緣的形式體系。圖像中的一階導數用梯度計算,二階導數使用拉普拉斯算子得到。- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 數字圖像 處理 邊緣 檢測 中文翻譯
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.zhongcaozhi.com.cn/p-172571.html