《數(shù)字圖像處理》習(xí)題參考答案
《《數(shù)字圖像處理》習(xí)題參考答案》由會員分享,可在線閱讀,更多相關(guān)《《數(shù)字圖像處理》習(xí)題參考答案(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
《數(shù)字圖像處理》習(xí)題參考答案 第 1 章 概述 1.1 連續(xù)圖像和數(shù)字圖像如何相互轉(zhuǎn)換? 答:數(shù)字圖像將圖像看成是許多大小相同、形狀一致的像素組成。這樣,數(shù)字圖像可以 用二維矩陣表示。將自然界的圖像通過光學(xué)系統(tǒng)成像并由電子器件或系統(tǒng)轉(zhuǎn)化為模擬圖像 (連續(xù)圖像)信號,再由模擬/數(shù)字轉(zhuǎn)化器(ADC)得到原始的數(shù)字圖像信號。圖像的數(shù)字 化包括離散和量化兩個主要步驟。在空間將連續(xù)坐標(biāo)過程稱為離散化,而進一步將圖像的幅 度值(可能是灰度或色彩)整數(shù)化的過程稱為量化。 1.2 采用數(shù)字圖像處理有何優(yōu)點? 答:數(shù)字圖像處理與光學(xué)等模擬方式相比具有以下鮮明的特點: 1.具有數(shù)字信號處理技術(shù)共有的特點。(1)處理精度高。(2)重現(xiàn)性能好。(3)靈活 性高。 2.?dāng)?shù)字圖像處理后的圖像是供人觀察和評價的,也可能作為機器視覺的預(yù)處理結(jié)果。 3.?dāng)?shù)字圖像處理技術(shù)適用面寬。 4.?dāng)?shù)字圖像處理技術(shù)綜合性強。 1.3 數(shù)字圖像處理主要包括哪些研究內(nèi)容? 答:圖像處理的任務(wù)是將客觀世界的景象進行獲取并轉(zhuǎn)化為數(shù)字圖像、進行增強、變換、 編碼、恢復(fù)、重建、編碼和壓縮、分割等處理,它將一幅圖像轉(zhuǎn)化為另一幅具有新的意義的 圖像。 1.4 討論數(shù)字圖像處理系統(tǒng)的組成。列舉你熟悉的圖像處理系統(tǒng)并分析它們的組成和功能。 答:如圖 1.8,數(shù)字圖像處理系統(tǒng)是應(yīng)用計算機或?qū)S脭?shù)字設(shè)備對圖像信息進行處理的 信息系統(tǒng)。圖像處理系統(tǒng)包括圖像處理硬件和圖像處理軟件。圖像處理硬件主要由圖像輸入 設(shè)備、圖像運算處理設(shè)備(微計算機)、圖像存儲器、圖像輸出設(shè)備等組成。軟件系統(tǒng)包括 操作系統(tǒng)、控制軟件及應(yīng)用軟件等。 圖 1.8 數(shù)字圖像處理系統(tǒng)結(jié)構(gòu)圖 1 1.5 常見的數(shù)字圖像處理開發(fā)工具有哪些?各有什么特點? 答.目前圖像處理系統(tǒng)開發(fā)的主流工具為 Visual C++(面向?qū)ο罂梢暬晒ぞ撸┖?MATLAB 的圖像處理工具箱(Image Processing Tool box)。兩種開發(fā)工具各有所長且有相互 間的軟件接口。 Microsoft 公司的 VC++是一種具有高度綜合性能的面向?qū)ο罂梢暬晒ぞ?,用它開發(fā) 出來的 Win 32 程序有著運行速度快、可移植能力強等優(yōu)點。VC++所提供的 Microsoft 基礎(chǔ) 類庫 MFC 對大部分與用戶設(shè)計有關(guān)的 Win 32 應(yīng)用程序接口 API 進行了封裝,提高了代碼 的可重用性,大大縮短了應(yīng)用程序開發(fā)周期,降低了開發(fā)成本。由于圖像格式多且復(fù)雜,為 了減輕程序員將主要精力放在特定問題的圖像處理算法上,VC++ 6.0 提供的動態(tài)鏈接庫 ImageLoad.dll 支持 BMP、JPG、TIF 等常用 6 種格式的讀寫功能。 MATLAB 的圖像處理工具箱 MATLAB 是由 MathWorks 公司推出的用于數(shù)值計算的有 力工具,是一種第四代計算機語言,它具有相當(dāng)強大的矩陣運算和操作功能,力求使人們擺 脫繁雜的程序代碼。MATLAB 圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運用這些 函數(shù)可以完成大部分圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時間,避免程序設(shè)計 中的重復(fù)勞動。MATLAB 圖像處理工具箱涵蓋了在工程實踐中經(jīng)常遇到的圖像處理手段和 算法,如圖形句柄、圖像的表示、圖像變換、二維濾波器、圖像增強、四叉樹分解域邊緣檢 測、二值圖像處理、小波分析、分形幾何、圖形用戶界面等。但是,MATLAB 也存在不足 之處限制了其在圖像處理軟件中實際應(yīng)用。首先,強大的功能只能在安裝有 MATLAB 系統(tǒng) 的機器上使用圖像處理工具箱中的函數(shù)或自編的 m 文件來實現(xiàn)。其次,MATLAB 使用行解 釋方式執(zhí)行代碼,執(zhí)行速度很慢。第三,MATLAB 擅長矩陣運算,但對于循環(huán)處理和圖形 界面的處理不及 C++等語言。為此,通應(yīng)用程序接口 API 和編譯器與其他高級語言(如 C、 C++、Java 等)混合編程將會發(fā)揮各種程序設(shè)計語言之長協(xié)同完成圖像處理任務(wù)。API 支持 MATLAB 與外部數(shù)據(jù)與程序的交互。編譯器產(chǎn)生獨立于 MATLAB 環(huán)境的程序,從而使其他 語言的應(yīng)用程序使用 MATLAB。 1.6 常見的數(shù)字圖像應(yīng)用軟件有哪些?各有什么特點? 答:圖像應(yīng)用軟件是可直接供用戶使用的商品化軟件。用戶從使用功能出發(fā),只要了解 軟件的操作方法就可以完成圖像處理的任務(wù)。對大部分用戶來說,商品化的圖像應(yīng)用軟件無 需用戶進行編程,操作方便,功能齊全,已經(jīng)能滿足一般需求,因而得到廣泛應(yīng)用。常用圖 像處理應(yīng)用軟件有以下幾種: 1.PHOTOSHOP:當(dāng)今世界上一流的圖像設(shè)計與制作工具,其優(yōu)越性能令其產(chǎn)品望塵 莫及。PHOTOSHOP 已成為出版界中圖像處理的專業(yè)標(biāo)準(zhǔn)。高版本的 PHOTOSHOP 支持多 達 20 多種圖像格式和 TWAIN 接口,接受一般掃描儀、數(shù)碼相機等圖像輸入設(shè)備采集的圖 像。PHOTOSHOP 支持多圖層的工作方式,只是 PHOTOSHOP 的最大特色。使用圖層功能 可以很方便地編輯和修改圖像,使平面設(shè)計充滿創(chuàng)意。利用 PHOTOSHOP 還可以方便地對 圖像進行各種平面處理、繪制簡單的幾何圖形、對文字進行藝術(shù)加工、進行圖像格式和顏色 模式的轉(zhuǎn)換、改變圖像的尺寸和分辨率、制作網(wǎng)頁圖像等。 2.CorelDRAW:一種基于矢量繪圖、功能強大的圖形圖像制作與設(shè)計軟件。位圖式圖像 是由象素組成的,與其相對,矢量式圖像以幾何、色彩參數(shù)描述圖像,其內(nèi)容以線條和色塊 為主??梢?,采用不同的技術(shù)手段可以滿足用戶的設(shè)計要求。位圖式圖像善于表現(xiàn)連續(xù)、豐 富色調(diào)的自然景物,數(shù)據(jù)量較大;而矢量式圖像強于表現(xiàn)線條、色塊的圖案,數(shù)據(jù)量較小。 合理的利用兩種不同類型的圖像表現(xiàn)方式,往往會收到意想不到的藝術(shù)效果。CorelDraw是 2 當(dāng)今流行的圖像處理軟件中為數(shù)不多的特點明顯、功能強大的基于矢量繪圖的軟件包。利用 它,可以方便地制作精美的名片、賀卡、書簽、圖書封面、廣告、宣傳畫等作品。 3.ACDSee:快速、高性能的看圖程序,是目前最享盛名的圖片瀏覽器。它能廣泛應(yīng) 用于圖片的獲取、管理、瀏覽和優(yōu)化,支持 BMP、GIF、JPG、TGA、TIF 等超過 50 種常見 的圖形文件格式,圖片打開速度極快,可以直接查看動畫 GIF,處理如 Mpeg 之類常用的視 頻文件,還可以為每一個目錄建立一個相冊。ACDSee 可以從數(shù)碼相機和掃描儀高效獲取圖 片,并進行便捷的查找、組織和預(yù)覽。ACDSee 還是得心應(yīng)手的圖片編輯工具,輕松處理數(shù) 碼影像,擁有去紅眼、剪切圖像、銳化、浮雕特效、曝光調(diào)整、旋轉(zhuǎn)、鏡像等功能,還能進 行批量處理。 1.7 討論數(shù)字圖像處理的主要應(yīng)用。進一步查找資料,寫一篇關(guān)于你感興趣的應(yīng)用方面 的短文。 答:圖像處理的應(yīng)用幾乎滲透科學(xué)研究、工程技術(shù)和人類社會生活的各個領(lǐng)域。教師可 以分組對學(xué)生布置以下 6 個方面的課題,通過閱讀參考文獻、網(wǎng)絡(luò)資源等手段寫數(shù)字圖像處 理的主要應(yīng)用的短文,并安排交流機會。 1.航天和航空技術(shù)方面的應(yīng)用 2.生物醫(yī)學(xué)工程方面的應(yīng)用 3.通信工程方面的應(yīng)用 4.工業(yè)自動化和機器人視覺方面的應(yīng)用 5.軍事和公安方面的應(yīng)用 6.生活和娛樂方面的應(yīng)用 第2章 圖像的數(shù)字化與顯示 2.1 設(shè)圖像的大小為 3232 的圖標(biāo),每個像素有 16 種顏色,共有多少種不同的圖標(biāo)? 如果每 100 萬個可能的圖標(biāo)中有一個有意義,識別一個有意義的圖標(biāo)需要 1 秒鐘,則選出所 有有意義的圖標(biāo)需要多長時間? 解:163232/106 = 161024/106=1.044101227 s 可見隨機圖像的復(fù)雜度是非常高的。 2.2 掃描儀的光學(xué)分辨率是 6001200 線,一個具有 5000 個感光單元的 CCD 器件,用 于 A4 幅面掃描儀,A4 幅面的紙張寬度是 8.3 英寸,該掃描儀的光學(xué)分辨率是多少 dpi? 解:(1)6001200 線,其中前一個數(shù)字代表掃描儀的橫向分辨率,后一數(shù)字則代表縱 向分辨率。 (2)dpi 是指單位面積內(nèi)像素的多少,也就是掃描精度 ,目前國際上都是計算一英寸 面積內(nèi)像素的多少。光學(xué)分辨率是掃描儀的光學(xué)部件在每平方英寸面積內(nèi)所能捕捉到的實際 的光點數(shù),是指掃描儀 CCD 的物理分辨率,也是掃描儀的真實分辨率,它的數(shù)值是由 CCD 的像素點除以掃描儀水平最大可掃尺寸得到的數(shù)值。 每一個感光單元對應(yīng)一個像素。由于 CCD 感光單元個數(shù)為 5000, 5000/8.3=602 (dpi) 3 第3章 圖像變換 3.1 二維傅里葉變換的分離性有什么實際意義? 解:該性質(zhì)表明,一個二維傅里葉變換可由連續(xù)兩次一維傅里葉變換來實現(xiàn)。實現(xiàn)的方 法如下圖所示: 3.2 圖像處理中正交變換的目的是什么?圖像變換主要用于那些方面? 解:正交變換可以使得圖像能量主要集中分布在低頻率成分上,邊緣和線信息反映在高 頻率成分上。因此正交變換廣泛應(yīng)用在圖像增強、圖像恢復(fù)、特征提取、圖像編碼壓縮和形 狀分析等方面。 3.3 在 MATLAB 環(huán)境中,實現(xiàn)一幅圖像的傅里葉變換。 解:MATLAB 程序如下: A=imread(rice.tif); imshow(A); A2=fft2(A); A2=fftshift(A2); figure,imshow(log(abs(A2)+1),[0 10]); 3.4 利用 MATLAB 對一幅 512512 的圖像進行 DCT 變換,并保留 256256 個 DCT 變換系數(shù)進行重構(gòu)圖像,比較重建圖像與原始圖像的差異。 解:MATLAB程序如下: RGB = imread(pout512.bmp); I = rgb2gray(RGB); J = dct2(I); J(1:512,256:512) = 0; J(256:512,1:256)=0; K = idct2(J); imshow(I), figure, imshow(K,[0 255]) 3.5 離散的沃爾什變換與哈達瑪變換之間有那些異同? 解:哈達瑪(Hadamard)變換和沃爾什(Walsh)變換的變換核都是由 1,-1 組成的正交 方陣。它們不同的地方在于變換矩陣的行列排列次序不同。哈達瑪變換每行的列率排列是沒 有規(guī)則的,沃爾什變換的列率是由小到大。 4 3.6 求 N=4 對應(yīng)的沃爾什變換核矩陣。 ?1 1 1 1 ? ? ? 解: H = ?1 1 ?1 ?1? ?1 ?1 ?1 1 ? ? ? ?1 ?1 1 ?1? 3.7 什么是小波?小波基函數(shù)和傅里葉變換基函數(shù)有何區(qū)別? 解:小波信號的非零點是有限的。它與傅里葉變換的基函數(shù)(三角函數(shù)、指數(shù)信號)是 不同的,傅里葉變換的基函數(shù)從負(fù)無窮到正無窮都是等幅振蕩的。 3.8 為何稱小波變換為信號的“電子顯微鏡”,如何實現(xiàn)該功能? 解:小波變換的伸縮因子的變化,使得可以在不同尺度上觀察信號,所以又稱電子顯微 鏡。實現(xiàn)小波變換可以應(yīng)用 Mallat 的快速算法。 3.9 應(yīng)用 MATLAB 設(shè)計小波變換程序,該程序能夠讀入一幅 BMP 格式的圖像,顯示 該圖像和小波變換系數(shù)。 解:由讀者思考。 3.10 傅里葉變換、加窗傅里葉變換和小波變換的時間-頻率特性有什么不同? 解:傅里葉變換使得時間信號變成了頻域信號,加窗傅里葉變換使得時間信號變成了時 頻信號,但是窗口是固定的,小波變換同樣變成了視頻信號,但是時頻的窗口是變化的。 3.11 利用 MATLAB 進行圖像的小波變換,觀察小波系數(shù)特點。 解:MATLAB 程序如下: X=imread(rice.tif); [cA1,cH1,cV1,cD1] = dwt2(X,bior3.7); subplot(2,2,1); imshow( cA1,[0 900]); title(Approximation A1) subplot(2,2,2); imshow(cH1); title(Horizontal Detail H1) subplot(2,2,3); imshow(cV1); title(Vertical Detail V1) subplot(2,2,4); imshow(cD1); 第4章 圖像增強 4.1 圖像增強的目的是什么,它包含那些內(nèi)容? 解:圖像增強是指對圖像的某些特征,如邊緣、輪廓、對比度等進行強調(diào)或銳化,以 便于顯示、觀察或進一步分析與處理。圖像增強所包含的主要內(nèi)容如書圖 4.1。 4.2 已知灰度圖像 f(x,y)為如下矩陣所示,求經(jīng)過反轉(zhuǎn)變換后圖像 g(x,y)。反轉(zhuǎn) 變換 g=G(f)如圖 a 所示。 5 ?1 ? 解: ?1 ??1 圖 a 0 1? ? 1 1? 0 1?? 4.3 直方圖均衡,若一個 6464 的離散圖像,灰度分成 8 層,其灰度rk的值和分布情況 如下:請繪制該圖像的直方圖,并求經(jīng)過直方圖均衡后的圖像的直方圖。 k 0 1 2 3 4 5 6 7 rk 0 1 7 2 7 3 7 4 7 5 7 6 7 1 nk 560 920 1046 705 356 267 170 72 解: k 0 1 2 3 4 5 6 7 rk 0 1 7 2 7 3 7 4 7 5 7 6 7 1 nk 560 920 1046 705 356 267 170 72 pr (rk ) 0.14 0.22 0.26 0.17 0.09 0.07 0.04 0.02 ′ S k 0.14 0.36 0.62 0.79 0.88 0.95 0.99 1 ″ S k 1 7 3 7 4 7 6 7 6 7 1 1 1 S k 1 7 3 7 4 7 6 7 1 nsk 560 920 1046 1061 509 pr (sk ) 0.14 0.22 0.26 0.26 0.13 4.4 分析說明為什么對數(shù)字圖像進行直方圖均衡化后,通常并不能產(chǎn)生完全平坦的直 方圖。 解:直方圖均衡中: s = T ( r ) r = ∫0 p r ( r ) d r 對于上式積分來講 s=1,但是在實際中, pr (r) 不是連續(xù)的,所以直方圖均衡并不會 產(chǎn)生完全平坦的直方圖。 6 4.5 設(shè)對一幅圖像進行了均衡化處理,試證明第二次采用直方圖均衡化處理的結(jié)果與 k 第一次的結(jié)果相同。 解:設(shè)第二次直方圖均衡后灰度用 wk 表示, Wk = T (S k k n ) = ∑ si i =0 n = ∑ ni i =0 n 所以第二次的結(jié)果和第一次結(jié)果相同。 4.6 什么是圖像平滑?試述均值濾波的基本原理。 解:為了去除或減弱圖像中的噪聲,可以對圖像進行平滑處理,稱為圖像平滑。大部分 的噪聲都可以看作是隨機信號,它們對圖像的影響可以看作是孤立的。對于某一像素而言, 如果它與周圍像素點相比,有明顯的不同,我們就認(rèn)為該點被噪聲感染了?;谶@樣的分析, 我們可以用求均值的方法,來判斷每一點是否含有噪聲,并用適當(dāng)?shù)姆椒ㄏl(fā)現(xiàn)的噪聲。 4.7 設(shè)圖像如下表 a 所示,分別求經(jīng)過鄰域平滑和高通算子銳化的結(jié)果。其中邊緣點 保持不變,鄰域平滑掩碼取 33 矩陣,即 ?1 H = =1 ?1 8 ? ??1 1 1? ? 0 1? ,高通算子取 33 矩陣,即: 1 1?? 表 a ??1 ? H = ??1 ???1 ?1 ?1? ? 8 ?1? ?1 ?1?? 解:鄰域平滑的結(jié)果: 1 1 3 4 5 2 21/8 26/8 35/8 5 2 22/8 25/8 32/8 5 3 29/8 27/8 25/8 2 4 5 4 1 1 1 1 3 4 5 2 -13 6 5 5 2 2 15 0 5 3 -13 -4 -1 2 4 5 4 1 1 7 4.8 什么是中值濾波,有何特點? 解:中值濾波是非線性的處理方法,在去噪的同時可以兼顧到邊界信息的保留。 中值濾波首先選一個含有奇數(shù)點的窗口 W,將這個窗口在圖像上掃描,把該窗口中所含的 像素點按灰度級的升(或降)序排列,取位于中間的灰度值,來代替該點的灰度值。 4.9 設(shè)原圖像為:2 4 7 4 3 5 4 6 4 4 4,求經(jīng)過中值濾波后的值,中值 濾波取一維的模板如下圖 b 所示,待處理像素的灰度取這個模板中的灰度的中值。邊界點保 持不變。 解:2 4 4 4 4 4 4 4 4 4 4.10 試分析中值濾波及各種差分算子濾波的計算量、優(yōu)缺點和適用范圍。 解:由讀者思考。 4.11 應(yīng)用 MATLAB 設(shè)計 bmp 文件格式的圖像讀取、顯示和直方圖統(tǒng)計程序。 解:由讀者思考。 4.12 應(yīng)用 MATLAB 設(shè)計圖像銳化的程序。 解:由讀者思考。 4.13 在 MATLAB 環(huán)境中,完成圖像的增亮、變暗處理。 解:MATLAB 程序如下: A=imread(pout.tif); %讀入圖像 imshow(A); %顯示圖像 figure,imhist(A); %顯示圖像的直方圖 J1=imadjust(A,[0.3 0.7],[]); %將圖像在 0.3255~0.7255 灰度之間的值通過線性變換映射到 0~255 之間 figure,imshow(J1); %輸出圖像效果圖 figure,imhist(J1) %輸出圖像的直方圖 J2=imadjust(A,[],[0 0.7]); %使用此函數(shù),將圖像灰度通過線性變換映射到 0~2550.7 之間 figure,imshow(J2); %輸出圖像效果圖 figure,imhist(J2) %輸出圖像的直方圖 4.14 在 MATLAB 環(huán)境中,對圖像進行去噪處理。 解:參見例 4.4 4.15 在 MATLAB 環(huán)境中,對圖像進行直方圖均衡處理,分析結(jié)果。 解:參見例 4.3 8 第5章 圖像編碼與壓縮 5.1 從哪些方面說明數(shù)據(jù)壓縮的必要性? 答:采用數(shù)字技術(shù)會使信號處理的性能大為提高,但其數(shù)據(jù)量的增加也是十分驚人的。 圖像數(shù)據(jù)更是多媒體、網(wǎng)絡(luò)通信等技術(shù)重點研究的壓縮對象。不加壓縮的圖像數(shù)據(jù)是計算機 的處理速度、通信信道的容量等所無法承受的。 這樣的數(shù)據(jù)率是與當(dāng)前信息存儲介質(zhì)的容量、計算機的總線速度以及網(wǎng)絡(luò)的傳輸率不相 匹配的。盡管人們在存儲介質(zhì)、總線結(jié)構(gòu)和網(wǎng)絡(luò)性能等方面不斷有新的突破,但數(shù)據(jù)量的增 長速度遠超過硬件設(shè)施的提高水平,以上的矛盾仍然無法緩解。 如果將上述圖像信號壓縮幾倍、十幾倍,甚至上百倍,將十分有利于圖像的傳輸和存儲。 可見,在現(xiàn)有硬件設(shè)施條件下,對圖像信號本身進行壓縮是解決上述矛盾的主要出路。 5.2 討論圖像壓縮方法的分類及其各自的特點。 答:一般數(shù)據(jù)壓縮按信息損失的程度來分類。見教材圖 5.2:常見數(shù)據(jù)壓縮技術(shù)的分類。 無損壓縮:Huffman 編碼和 Shannon 編碼根據(jù)概率分布特性確定碼長;游程編碼根據(jù)連 續(xù)灰度的游程來確定編碼;算術(shù)編碼隨信源數(shù)據(jù)不斷縮小的實數(shù)區(qū)間,然后用一個與實數(shù)對 應(yīng)的二進制碼代表被編碼的信息;輪廓編碼根據(jù)相同灰度的區(qū)域邊界線進行編碼。 有損壓縮:預(yù)測編碼根據(jù)相鄰像素相關(guān)性來確定后繼像素的預(yù)測值,若用差值進行編碼 則可以壓縮數(shù)據(jù)量;變換編碼對原始圖像進行正交變換,在變換域進行抽樣達到壓縮的目的; 混合編碼將兩種編碼方法結(jié)合起來,如將預(yù)測編碼與變換編碼相結(jié)合,以取得更好的效果。 在現(xiàn)代壓縮編碼方法中,分形編碼利用宏觀與微觀的相似性來壓縮數(shù)據(jù)量,可以獲得極 大的壓縮比。該方法壓縮過程的計算量較大,但解壓縮很快,適用于圖像數(shù)據(jù)的存儲和重現(xiàn)。 模型基編碼:一種新型壓縮方法。該方法在發(fā)送端利用已知且變化慢的場景得到數(shù)據(jù)量 不大的模型參數(shù),在接收端利用綜合模型參數(shù)恢復(fù)原始圖像。這一編碼方法對于實時實現(xiàn)電 視會議等具有顯著意義。 圖 5.2 常見數(shù)據(jù)壓縮技術(shù)的分類 9 5.3 數(shù)據(jù)沒有冗余度能否壓縮?為什么? 答:圖像數(shù)據(jù)量大,同時冗余數(shù)據(jù)也是客觀存在的。一般圖像中存在著以下數(shù)據(jù)冗余因 素:(1)編碼冗余;(2)像素間的相關(guān)性形成的冗余;(3)視覺特性和顯示設(shè)備引起的冗余。 理論上,數(shù)據(jù)沒有冗余度是不壓縮的,否則無法解碼出原始數(shù)據(jù)。但在大部分應(yīng)用場合 下采用有損壓縮,數(shù)據(jù)沒有冗余度也可以進行壓縮。 5.4 如何衡量圖像編碼壓縮方法的性能? 答:一般地,圖像壓縮應(yīng)能做到壓縮比大、算法簡單、易于用硬件和軟件實現(xiàn)、壓縮和 解壓縮實時性好、解壓縮恢復(fù)的圖像失真小等。但這些指標(biāo)對同一壓縮方法很難統(tǒng)一,在實 際系統(tǒng)中往往需要抓住主要矛盾,全面權(quán)衡。常用的圖像壓縮技術(shù)指標(biāo)有:(1)圖像熵與平 均碼長;(2)圖像冗余度與編碼效率;(3)壓縮比;(4)客觀評價 SNR;(5)主觀評價。圖 像的主客觀兩種評價之間存在著密切的聯(lián)系。但一般來說,客觀評價高的主觀評價也高,因 此在圖像編碼的質(zhì)量評價時,首先作客觀評價,以主觀評價為參考。 5.5 一圖像大小為 640480,256 色。用軟件工具 SEA(version 1.3)將其分別轉(zhuǎn)成 24 位色 BMP,24 位色 JPEG,GIF(只能轉(zhuǎn)成 256 色)壓縮格式,24 位色 TIFF 壓縮格式,24 位色 TGA 壓縮格式,得到的文件大小分別為:921,654 字節(jié);17,707 字節(jié);177,152 字節(jié); 923,044 字節(jié);768,136 字節(jié)。分別計算每種壓縮圖像的壓縮比。 解:不計算較小的文件頭和彩色查找表(LTU)的數(shù)據(jù)量,原始圖像的數(shù)據(jù)量為: 6404801 byte=307,200 byte。 經(jīng)轉(zhuǎn)換后各種格式的壓縮比如下: 24 位色 BMP 格式: 307,200/921,654=0.333(增加了冗余度) 24 位色 JPEG 格式: 307,200/17,707=17.35 GIF 壓縮格式: 307,200/177,152=1.73 24 位色 TIFF 壓縮格式: 307,200/923,044=0.333(增加了冗余度) 24 位色 TGA 壓縮格式: 307,200/768,136=0.400(增加了冗余度) 5.6 大部分視頻壓縮方法是有損壓縮還是無損壓縮?為什么? 答:視頻比靜態(tài)圖像數(shù)據(jù)量更大,同時可壓縮的冗余信息更多。大部分視頻壓縮方法是 以人眼感覺無明顯失真為依據(jù)的,因此采用有損壓縮。事實上,視頻可以看成是一幅幅不同 但相關(guān)的靜態(tài)圖像的時間序列。因此,靜態(tài)圖像的壓縮技術(shù)和標(biāo)準(zhǔn)可以直接應(yīng)用于視頻的單 幀圖像。另外,利用視頻幀間信息的冗余可以大大提高視頻的壓縮比。 5.7 若圖像上任意兩像素點的亮度電平值相等或者任意兩時刻同一位置上的像素的亮 度電平值相等,能夠說明上述兩種情況下像素相關(guān)嗎?為什么? 答:不能。像素的空間相關(guān)性和時間相關(guān)性是以空間和時間的相鄰性為基礎(chǔ)的。因此, 圖像上任意兩像素點的亮度電平值相等或者任意兩時刻同一位置上的像素的亮度電平值相 等帶有偶然性,不能說明兩像素相關(guān)。 5.8 根據(jù) JPEG 算法說明 JPEG 圖像顯示時會出現(xiàn)馬賽克現(xiàn)象的原因。 答:由于 JPEG 算法將整幅圖像分成若干個 88 的子塊,解碼也是以子塊為單位的,所 以塊間的解碼誤差可能反映為方塊效應(yīng),在視覺上會出現(xiàn)馬賽克現(xiàn)象。 10 5.9 討論混合編碼的優(yōu)點。 答:混合編碼一般指將預(yù)測編碼與變換編碼相結(jié)合進行編碼的方法。預(yù)測編碼根據(jù)相鄰 像素相關(guān)性來確定后繼像素的預(yù)測值,若用差值進行編碼則可以壓縮數(shù)據(jù)量;變換編碼對原 始圖像進行正交變換,在變換域進行抽樣達到壓縮的目的;混合編碼將兩種編碼方法結(jié)合起 來,可以發(fā)揮兩種編碼方法的優(yōu)點,取得更好的效果。 5.10 有了離散傅里葉及其快速算法 FFT,為什么還要提出離散余弦算法 DCT 及其快 速算法?為什么許多視頻國際標(biāo)準(zhǔn)將 DCT 作為幀內(nèi)編碼的基本壓縮算法? 答:在所有的變換編碼方案中,離散 K-L 變換是最佳變換,理論價值較高,常常作為 對其他變換特性進行評價的標(biāo)準(zhǔn)。但此變換沒有快速算法,在工程應(yīng)用中受到限制。在次最 佳變換算法中,DFT 和 DCT 都是常用的變換編碼方法,它們分別有快速算法:FFT 和 FCT。 這兩種方法相比較,DFT 涉及到復(fù)數(shù)運算,而 DCT 是實數(shù)變換具有十分吸引人的一些特點: 它是一種實數(shù)變換,計算量較小,其變換矩陣的基向量很好地描述了人類視覺的相關(guān)性,且 對于大多數(shù)圖像來說,該變換的壓縮性能很接近離散 K-L 變換,而且其變換矩陣與圖像內(nèi) 容無關(guān),另外由于它構(gòu)造對稱的數(shù)據(jù)序列,避免了在圖像邊界處的跳躍及所引起的 Gibbs 效應(yīng),并且也有快速算法,因而得到廣泛的應(yīng)用。作為準(zhǔn)最佳變換,它已成為一些靜態(tài)圖像、 視頻壓縮國際標(biāo)準(zhǔn)(或建議)中的基本處理模塊。JPEG 制定了基于 DCT 的有失真靜止圖像 壓縮標(biāo)準(zhǔn)。在 MPEG 視頻編碼器中幀內(nèi)圖像(I 圖像)采用 DCT 的編碼方法。 5.11 為什么二維 DCT 可以轉(zhuǎn)換成兩次一維 DCT 計算? 答:參考第 3 章圖像變換。二維變換可以分解成兩次變換,如先進行變換,再進行列變 換,或反之。 5.12 Huffman 編碼有何優(yōu)缺點? 答: Huffman 編碼在無失真的編碼方法中效率優(yōu)于其他編碼方法,是一種最佳變長碼, 其平均碼長接近于熵值。但當(dāng)信源數(shù)據(jù)成分復(fù)雜時,龐大的信源集致使 Huffman 碼表較大, 碼表生成的計算量增加,編譯碼速度相應(yīng)變慢;另外不等長編碼致使硬件譯碼電路實現(xiàn)困難。 上述原因致使 Huffman 編碼的實際應(yīng)用受到限制。 5.13 Huffman 編碼是最佳編碼,為什么還要研究算術(shù)編碼等其他熵編碼算法? 答:題 5.12 中討論了 Huffman 編碼的優(yōu)缺點,其他熵編碼方法可以在某些性能上克服 Huffman 編碼的不足。如,雖然算術(shù)編碼的硬件實現(xiàn)比 Huffman 編碼方法復(fù)雜,但對圖像的 編碼測試結(jié)果表明,在信源符號概率接近的條件下,算術(shù)編碼效率高于 Huffman 編碼。 5.14 算術(shù)編碼有何優(yōu)點?舉例說明其適用范圍。 答:在信源符號概率接近的條件下,算術(shù)編碼效率高于 Huffman 編碼。因此,在擴展 的 JPEG 系統(tǒng)中用算術(shù)編碼取代了 Huffman 編碼。另外,算術(shù)編碼除了常見的基于概率統(tǒng)計 的模式外,還有自適應(yīng)模式。在這種模式下,各個符號的初始概率相同,它們依據(jù)出現(xiàn)的符 號而發(fā)生變化。這種模式特別適用于不便于進行符號概率統(tǒng)計的實際場合中。- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
15 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖像處理 數(shù)字圖像 處理 習(xí)題 參考答案
鏈接地址:http://m.zhongcaozhi.com.cn/p-10232574.html