數(shù)字圖像處理第8章數(shù)字視頻處理.ppt

上傳人：max****ui

文檔編號(hào)：12175098

上傳時(shí)間：2020-05-07

格式：PPT

頁(yè)數(shù)：62

大?。?04.50KB

《數(shù)字圖像處理第8章數(shù)字視頻處理.ppt》由會(huì)員分享，可在線閱讀，更多相關(guān)《數(shù)字圖像處理第8章數(shù)字視頻處理.ppt（62頁(yè)珍藏版）》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1,第8章數(shù)字視頻處理,8.1視頻技術(shù)及其應(yīng)用8.2快速運(yùn)動(dòng)估計(jì)技術(shù)8.3視頻壓縮技術(shù)8.4視頻壓縮標(biāo)準(zhǔn),2,8.1視頻技術(shù)及其應(yīng)用,與靜止圖像相反，視頻(Video)為活動(dòng)圖像(或運(yùn)動(dòng)圖像)。我們所看到的電影和電視都屬于視頻的范疇，它實(shí)際上是由許多單一的畫(huà)面所組成，每一幅畫(huà)面稱(chēng)為一幀。由于人眼的視覺(jué)惰性，每秒24幀的電影畫(huà)面就形成了連續(xù)活動(dòng)影象感覺(jué)的電影。因此，幀是構(gòu)成視頻信息的最小和最基本的單元。,3,8.1.1視頻信號(hào)的數(shù)字化,大家日常使用的電視和錄像等都屬于模擬視頻，它是基于模擬技術(shù)以及圖像的廣播與顯示所確定的國(guó)際標(biāo)準(zhǔn)。模擬視頻圖像具有成本低和還原度好等優(yōu)點(diǎn)。因此在電視上看到的風(fēng)景錄象，往往具有身臨其境的感覺(jué)。但它的最大缺點(diǎn)是經(jīng)過(guò)長(zhǎng)時(shí)間的存放之后，視頻質(zhì)量將大為降低，而且經(jīng)過(guò)多次復(fù)制之后，圖像的失真就會(huì)很明顯。而數(shù)字視頻可以彌補(bǔ)這些缺陷。它不僅可以無(wú)失真地進(jìn)行無(wú)限次復(fù)制，而且還可以對(duì)視頻進(jìn)行創(chuàng)造性的編輯，如特技效果等。而數(shù)字視頻是基于數(shù)字技術(shù)以及其它更為拓展的圖像顯示標(biāo)準(zhǔn)。數(shù)字視頻有兩層涵義，一是模擬視頻信號(hào)輸入計(jì)算機(jī)進(jìn)行數(shù)字化視頻編輯，最后制成數(shù)字視頻產(chǎn)品；二是指視頻圖像由數(shù)字?jǐn)z象機(jī)拍攝下來(lái)，從信號(hào)源開(kāi)始，就是無(wú)失真的數(shù)字硯頻，視頻圖像輸入計(jì)算機(jī)時(shí)不再者慮視頻質(zhì)量的衰臧問(wèn)題。現(xiàn)在的數(shù)字視頻技術(shù)主要還是第一層涵義，即模擬視頻的數(shù)字化處理、存儲(chǔ)和輸出技術(shù)。,4,視頻的數(shù)字化是指在一段時(shí)間內(nèi)以一定的速度對(duì)模擬頻信號(hào)進(jìn)行捕捉并加以采樣后形成數(shù)字化數(shù)據(jù)的處理過(guò)程。通常的視頻信號(hào)都是模擬的，在進(jìn)入計(jì)算機(jī)前必須進(jìn)行數(shù)字化處理，即A／D轉(zhuǎn)換和彩色空間變換等。視頻信號(hào)數(shù)字化是對(duì)視頻信號(hào)進(jìn)行采樣捕獲，其采樣深度可以是8、16或24位等。采樣深度是經(jīng)采樣后每幀所包含的顏色位，然后將來(lái)樣后所得數(shù)據(jù)保存起來(lái)，以便對(duì)它進(jìn)行編輯、處理和播放。視頻信號(hào)的采集就是將模擬視頻信號(hào)經(jīng)硬件數(shù)字化后，再將數(shù)字化數(shù)據(jù)加以存儲(chǔ)。使用時(shí)，將數(shù)字化數(shù)據(jù)從存儲(chǔ)介質(zhì)中讀出，并還原成圖象信號(hào)加以輸出。視頻信號(hào)的采集可分為單幅畫(huà)面采集和多幅動(dòng)態(tài)連續(xù)采集。在單幅畫(huà)面采集時(shí)，可以將輸入的視頻信息定格，并將定格后的單幅畫(huà)面以多種圖象文件格式加以存儲(chǔ)，對(duì)于多幅動(dòng)態(tài)連續(xù)采集，可對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)，動(dòng)態(tài)地捕獲和壓縮，并以文件形式存儲(chǔ)。對(duì)視頻信號(hào)進(jìn)行數(shù)字化采樣后，則可以對(duì)數(shù)字視頻進(jìn)行編輯或加工。比如復(fù)制、刪除、特技變換和改變視頻格式等。,5,8.1.2視頻信號(hào)的處理,視頻信號(hào)處理是指根據(jù)人的要求對(duì)視頻圖像進(jìn)行某種處理，主要包括：(1)在保證一定圖像質(zhì)量的前提下盡可能壓縮視頻圖像的數(shù)據(jù)量(即視頻壓縮)。(2)消除視頻信號(hào)產(chǎn)生、獲取和傳輸過(guò)程中引入的失真和干擾，使視頻信號(hào)盡可能逼真地重現(xiàn)景物。例如使用圖像增強(qiáng)技術(shù)和圖像恢復(fù)技術(shù)。(3)根據(jù)某些準(zhǔn)則，盡可能除去視頻圖像中的無(wú)用信息而突出其主要信息。(4)從視頻圖像中提取某些特征，以便對(duì)其進(jìn)行描述、分類(lèi)和識(shí)別。,6,8.1.3視頻信號(hào)的壓縮編碼,壓縮目標(biāo)是在盡可能保證視覺(jué)效果的前提下減少視頻數(shù)據(jù)率。由于視頻是連續(xù)的靜態(tài)圖像，因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處，但視頻還有其自身的特性，因此壓縮時(shí)還應(yīng)考慮其運(yùn)動(dòng)特性才能達(dá)到高壓縮的目標(biāo)。在視頻壓縮中常需用以下的一些基本概念：（1）有損和無(wú)損壓縮：在視頻壓縮中有損和無(wú)損的概念與靜態(tài)圖像中基本類(lèi)似。（2）幀內(nèi)和幀間壓縮：幀內(nèi)(Intraframe)壓縮也稱(chēng)為空間壓縮(SpatialCompression)。當(dāng)壓縮一幀圖像時(shí)，僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息，這實(shí)際上與靜態(tài)圖像壓縮類(lèi)似。幀內(nèi)一般采用有損壓縮算法，由于幀內(nèi)壓縮時(shí)各個(gè)幀之間沒(méi)有相互關(guān)系，所以壓縮后的視頻數(shù)據(jù)仍可以以幀為單位進(jìn)行編輯。幀內(nèi)壓縮一般達(dá)不到很高的壓縮。,7,采用幀間(Interframe)壓縮是基于許多視頻或動(dòng)畫(huà)的連續(xù)前后兩幀具有很大的相關(guān)性，或者說(shuō)前后兩幀信息變化很小的特點(diǎn)。也即連續(xù)的視頻其相鄰幀之間具有冗余信息，根據(jù)這一特性，壓縮相鄰幀之間的冗余量就可以進(jìn)一步提高壓縮量，減小壓縮比。幀間壓縮也稱(chēng)為時(shí)間壓縮(Temporalcompression)，它通過(guò)比較時(shí)間軸上不同幀之間的數(shù)據(jù)進(jìn)行壓縮。幀間壓縮一般是無(wú)損的。如：幀差值(Framedifferencing)算法通過(guò)比較本幀與相鄰幀之間的差異，僅記錄本幀與其相鄰幀的差值，這樣可以大大減少數(shù)據(jù)量。,8,(3)對(duì)稱(chēng)和不對(duì)稱(chēng)編碼：對(duì)稱(chēng)(symmetric)意味著壓縮和解壓縮占用相同的計(jì)算處理能力和時(shí)間，對(duì)稱(chēng)算法適合于實(shí)時(shí)壓縮和傳送視頻，如視頻會(huì)議應(yīng)用就以采用對(duì)稱(chēng)的壓縮編碼算法為好。而在電子出版和其它多媒體應(yīng)用中，一般是把視頻預(yù)先壓縮處理好，爾后再播放，因此可以采用不對(duì)稱(chēng)(asymmetric)編碼。不對(duì)稱(chēng)或非對(duì)稱(chēng)意味著壓縮時(shí)需要花費(fèi)大量的處理能力和時(shí)間，而解壓縮時(shí)則能較好地實(shí)時(shí)回放，也即以不同的速度進(jìn)行壓縮和解壓縮。,9,8.1.4視頻信號(hào)的傳輸與存儲(chǔ),為了有效而高質(zhì)量地傳輸視頻信號(hào)，需要解決以下幾個(gè)問(wèn)題：（1）視頻信號(hào)在傳輸過(guò)程中會(huì)引入各種干擾和噪聲，如何降低甚至消除這些噪聲和干擾，是視頻信號(hào)傳輸要解決的首要問(wèn)題。通常的解決辦法有：采用糾錯(cuò)編碼、自適應(yīng)均衡和自適應(yīng)濾波等。（2）為了節(jié)省頻帶，除了使用高效壓縮技術(shù)壓縮信源信息外，還可以使用先進(jìn)的數(shù)字調(diào)制技術(shù)，例如殘留邊帶調(diào)制(VSB)、正交幅度調(diào)制(QAM)和格狀編碼調(diào)制(TCM)等。（3）視頻信號(hào)除可通過(guò)廣播傳輸外，還可通過(guò)有線電視、光纖、微波等進(jìn)行傳輸。隨著窄帶綜合業(yè)務(wù)數(shù)字網(wǎng)的普及和寬帶綜合業(yè)務(wù)數(shù)字網(wǎng)的發(fā)展，視頻通信的前景將會(huì)更加光明。,10,對(duì)于模擬電視信號(hào)，最常見(jiàn)的存儲(chǔ)媒體是錄像帶。另一種存儲(chǔ)模擬視頻信號(hào)的媒體是激光影碟（LD）。但1994年出現(xiàn)了建立在激光唱盤(pán)（CD）基礎(chǔ)上的視頻激光視盤(pán)（V-CD）。后者采用MPEG-l標(biāo)準(zhǔn)，可以在標(biāo)準(zhǔn)的12厘米CD上存儲(chǔ)74分鐘VHS質(zhì)量的視頻節(jié)目和具有CD質(zhì)量的立體聲。V-CD與世界的所有廣播電視制式兼容，易于使用和存放，而且生產(chǎn)成本也較低。播放V-CD既可使用多媒體計(jì)算機(jī)，也可使用專(zhuān)門(mén)的V-CD播放機(jī)。由于數(shù)字視盤(pán)（DVD）采用了MPEG-2標(biāo)準(zhǔn)中的MP@ML標(biāo)準(zhǔn)，所以視頻圖像質(zhì)量大大優(yōu)于V-CD，而音頻部分采用杜比公司開(kāi)發(fā)的AC-3系統(tǒng)，其圖像和聲音質(zhì)量將超過(guò)其它系統(tǒng)。,11,8.1.5視頻技術(shù)的應(yīng)用,（1）視頻技術(shù)在廣播電視中的應(yīng)用廣播電視是視頻技術(shù)的傳統(tǒng)領(lǐng)域，早期的黑白電視和現(xiàn)仍廣泛使用的彩色電視及其相關(guān)產(chǎn)品，采用的是模擬視頻技術(shù)，而數(shù)字電視（常規(guī)數(shù)字電視、電視電話、會(huì)議電視和高清晰度電視）全面使用數(shù)字視頻技術(shù)，其編碼、存儲(chǔ)、傳輸和播放都實(shí)行數(shù)字化。數(shù)字視頻技術(shù)在廣播電視中的應(yīng)用主要包括：地面電視廣播、衛(wèi)星電視廣播、數(shù)字視頻廣播、衛(wèi)星電視直播、有線電視、交互式電視、常規(guī)電視和高清晰度電視等。,12,（2）視頻技術(shù)在通信領(lǐng)域中的應(yīng)用以前視頻通信一直局限于傳輸單向的模擬電視，在通信網(wǎng)中，高質(zhì)量的彩色數(shù)字視頻通信要占用34Mbps以上的帶寬，因而很不經(jīng)濟(jì)。由于視頻壓縮技術(shù)的發(fā)展，使得視頻信號(hào)的數(shù)碼率大大降低。另一方面，通信技術(shù)的迅速發(fā)展又為視頻通信提供了所需的帶寬。視頻技術(shù)在通信領(lǐng)域中的應(yīng)用主要包括：電視電話、會(huì)議電視、多媒體通信、視頻點(diǎn)播、常規(guī)電視和高清晰度電視、交互式電視以及視頻數(shù)據(jù)庫(kù)等。,13,（3）視頻技術(shù)在娛樂(lè)領(lǐng)域中的應(yīng)用電視機(jī)及其相關(guān)產(chǎn)品長(zhǎng)久不衰的原因在于它是大眾娛樂(lè)消費(fèi)產(chǎn)品，電視是目前人類(lèi)最重要的信息傳播媒體，它對(duì)人類(lèi)生活的影響之大，簡(jiǎn)直難以用語(yǔ)言表達(dá)，它已成為人們生活的重要組成部分。視頻技術(shù)賴(lài)以生存和迅速發(fā)展的基礎(chǔ)在于娛樂(lè)領(lǐng)域，其主要應(yīng)用包括：常規(guī)電視和高清晰度電視、記錄、存儲(chǔ)和顯示設(shè)備、V-CD和DVD、交互式電視、電視電話、電視購(gòu)物、視頻點(diǎn)播和視頻游戲等。（4）視頻技術(shù)在計(jì)算機(jī)領(lǐng)域中的應(yīng)用視頻技術(shù)已廣泛應(yīng)用到計(jì)算機(jī)領(lǐng)域?，F(xiàn)在高檔計(jì)算機(jī)幾乎都配置有視頻解壓縮卡、CD-ROM和視頻播放軟件，這種多媒體計(jì)算機(jī)集視頻畫(huà)面的真實(shí)性和計(jì)算機(jī)的交互性于一體，已成為當(dāng)前計(jì)算機(jī)領(lǐng)域的熱門(mén)話題。視頻技術(shù)在計(jì)算機(jī)領(lǐng)域中的應(yīng)用主要包括：多媒體計(jì)算機(jī)、CD-ROM和V-CD、視頻數(shù)據(jù)庫(kù)、多媒體通信、交互式電視、三維圖形圖像、動(dòng)畫(huà)設(shè)計(jì)與制作、視頻制作以及虛擬現(xiàn)實(shí)（VR）等。,14,8.2快速運(yùn)動(dòng)估計(jì)技術(shù),視頻序列在時(shí)間上有很強(qiáng)的相關(guān)性，利用運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償技術(shù)可以有效地去除圖像的幀間冗余度，從而實(shí)現(xiàn)比幀內(nèi)壓縮方案更高的壓縮比。因此這種技術(shù)已廣泛用于視頻壓縮的一些國(guó)際標(biāo)準(zhǔn)，如H.261、H.263、MPEG-1、MPEG-2和MPEG-4等。作為幀間壓縮的核心和關(guān)鍵，運(yùn)動(dòng)估計(jì)技術(shù)受到了人們的廣泛關(guān)注，出現(xiàn)了多種研究方案，主要有光流方程法、像素遞歸法和塊匹配法（BMA：BlockMatchingAlgorithm）三種。綜合考慮計(jì)算復(fù)雜度和編碼效率等因素，塊匹配法由于簡(jiǎn)單實(shí)用，已經(jīng)成為運(yùn)動(dòng)估計(jì)算法的主流。,15,8.2.1運(yùn)動(dòng)估計(jì)模型,活動(dòng)圖像(視頻)編碼主要研究由物體和攝像機(jī)的相對(duì)運(yùn)動(dòng)而形成的二維運(yùn)動(dòng)。假定運(yùn)動(dòng)物體在幀間做平移運(yùn)動(dòng)，相對(duì)應(yīng)的運(yùn)動(dòng)模型可以表示為：u=x+Vx,v=y+Vy當(dāng)運(yùn)動(dòng)物體在幀間有旋轉(zhuǎn)、形狀和大小等變化時(shí)，采用上式所表示的運(yùn)動(dòng)模型作運(yùn)動(dòng)估計(jì)，會(huì)產(chǎn)生很大的估計(jì)誤差。為了解決這個(gè)問(wèn)題，有人提出了如下12個(gè)參數(shù)的運(yùn)動(dòng)模型：,這種運(yùn)動(dòng)模型雖然能有效地估計(jì)運(yùn)動(dòng)物體的平移、旋轉(zhuǎn)和縮放等不同的運(yùn)動(dòng)變化，但需要進(jìn)行很復(fù)雜的參數(shù)估計(jì)，因此并不實(shí)用。,16,上述模型都是基于運(yùn)動(dòng)物體的，然而在視頻編碼過(guò)程中把圖像分割成有不同運(yùn)動(dòng)的物體非常困難。通常采用兩種比較簡(jiǎn)單的方法：一種方法是把圖像分成若干矩形塊，假定塊做平移運(yùn)動(dòng)，對(duì)塊的運(yùn)動(dòng)進(jìn)行匹配估計(jì)；另一種方法是對(duì)每個(gè)像素的位移進(jìn)行遞歸估計(jì)。通常像素遞歸估計(jì)的精度高，對(duì)多運(yùn)動(dòng)畫(huà)面的適應(yīng)性強(qiáng)，但它的跟蹤范圍小，實(shí)現(xiàn)復(fù)雜。塊匹配運(yùn)動(dòng)估計(jì)雖然精度低，但它的位移跟蹤能力強(qiáng)，容易實(shí)現(xiàn)，因而得到了廣泛的應(yīng)用，并被H.26x和MPEG標(biāo)準(zhǔn)采用。,17,8.2.2塊匹配運(yùn)動(dòng)估計(jì)的原理,塊匹配的基本思想就是將當(dāng)前幀分成若干個(gè)大小相同的塊，對(duì)每一個(gè)塊(當(dāng)前塊)分別在參考幀中的一定區(qū)域(稱(chēng)為搜索窗)內(nèi)，按照一定的匹配準(zhǔn)則搜索與之最接近的塊(稱(chēng)為預(yù)測(cè)塊)，預(yù)測(cè)塊與當(dāng)前塊間的位移稱(chēng)為運(yùn)動(dòng)矢量，它們的像素間的差值稱(chēng)為殘差塊，預(yù)測(cè)塊與當(dāng)前塊之間通過(guò)匹配準(zhǔn)則函數(shù)得到的值稱(chēng)為塊失真度(BDM)。這樣當(dāng)前幀中的每一塊都可用一個(gè)殘差塊和一對(duì)運(yùn)動(dòng)矢量來(lái)表示。圖8-1為塊匹配運(yùn)動(dòng)估計(jì)的示意圖。,圖8-1塊匹配運(yùn)動(dòng)估計(jì)示意圖,18,這里，搜索窗尺寸(搜索范圍)的選取對(duì)搜索結(jié)果有很大影響：搜索范圍越大，得到更小殘差塊的可能性越大，但這會(huì)帶來(lái)更大的時(shí)間開(kāi)銷(xiāo)。通常選擇的搜索范圍有7,16,32,48,64,128等。由于塊匹配時(shí)需要在前后幀間逐像素比較，如果采用全搜索算法(即窮盡參考幀搜索區(qū)域所有可能的點(diǎn)進(jìn)行比較，從中找到全局最優(yōu)點(diǎn))，計(jì)算量非常巨大。如對(duì)格式為CIF(352288)的圖像，若塊大小為1616，當(dāng)搜索范圍為16時(shí)，每個(gè)塊的搜索點(diǎn)數(shù)為1089，每幀圖像的搜索點(diǎn)數(shù)則達(dá)到431244；當(dāng)搜索范圍為128時(shí)，每幀圖像的搜索點(diǎn)數(shù)將達(dá)到26155404，因此快速塊匹配算法的研究是非常必要的。,顯然，殘差塊的值越小，越有利于壓縮。因此運(yùn)動(dòng)估計(jì)的主要目標(biāo)就是使預(yù)測(cè)塊與當(dāng)前塊之間的BDM盡量小，即：,19,8.2.3塊匹配運(yùn)動(dòng)估計(jì)的各個(gè)環(huán)節(jié),塊匹配運(yùn)動(dòng)估計(jì)可從三個(gè)方向進(jìn)行研究：(1)塊形狀與大??；(2)塊匹配準(zhǔn)則；(3)搜索策略。目前，塊形狀與大小以及塊匹配準(zhǔn)則由于相對(duì)簡(jiǎn)單，已經(jīng)有了比較一致的選擇；而搜索策略最為復(fù)雜，它決定了一個(gè)算法的好壞，因此一直是快速運(yùn)動(dòng)估計(jì)研究的主要方向。,20,8.2.3.1塊形狀與大小,塊匹配法隱含著如下假設(shè)：同一塊內(nèi)的像素的運(yùn)動(dòng)是一致的。顯然這個(gè)假設(shè)具有一定的片面性，但選擇合適的塊形狀與大小可在一定程度上消除這種片面性。一般來(lái)說(shuō)，塊形狀選用正方形是比較自然的選擇，這樣既便于圖像的劃分，又有利于塊匹配準(zhǔn)則函數(shù)的計(jì)算。但這并非總是最佳選擇，因此也有的算法采用了其它形狀。,21,關(guān)于塊的大小，顯然塊越小，得到的殘差塊越小，但這會(huì)引入較多的運(yùn)動(dòng)矢量，可能降低編碼的效率。作為折衷，通常選擇1616和88像素的正方形塊。在H.261、MPEG-1和MPEG-2中，運(yùn)動(dòng)矢量是以1616的宏塊為單位的，由于塊尺寸相對(duì)較大，可能包含圖像中不同的運(yùn)動(dòng)部分，造成預(yù)測(cè)精度的下降；在H.263和MPEG-4中標(biāo)準(zhǔn)則在宏塊運(yùn)動(dòng)矢量的基礎(chǔ)上加入了以88塊的運(yùn)動(dòng)矢量，預(yù)測(cè)精度得到了一定的提高。另外，有的運(yùn)動(dòng)估計(jì)算法，如分級(jí)塊匹配法采用的是塊大小可變的方案。其基本思想是從最低分辨率級(jí)開(kāi)始，在每一層依次進(jìn)行運(yùn)動(dòng)估計(jì)。較低分辨率用于確定相對(duì)較大塊的位移的初略估計(jì)，接著把低分辨率級(jí)位移矢量的估計(jì)值傳遞到下一個(gè)高分辨率級(jí)，較高分辨率級(jí)用于精確調(diào)整位移矢量的估計(jì)。,22,8.2.3.2塊匹配準(zhǔn)則,塊匹配準(zhǔn)則是判斷塊相似程度的依據(jù)，因此匹配準(zhǔn)則的好壞直接影響了運(yùn)動(dòng)估計(jì)的精度；另一方面，匹配運(yùn)算復(fù)雜度、數(shù)據(jù)讀取復(fù)雜度在很大程度上取決于所采用的塊匹配準(zhǔn)則。因此，提高運(yùn)動(dòng)估計(jì)算法的速度可以有兩種途徑，一種是減少搜索匹配的點(diǎn)數(shù)，另一種則是降低塊匹配準(zhǔn)則的計(jì)算復(fù)雜度。常用的塊匹配準(zhǔn)則有以下幾種：,(1)均方誤差函數(shù)(MSE),該準(zhǔn)則取MSE最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。(2)絕對(duì)平均差函數(shù)(MAD),該準(zhǔn)則取MAD最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。,23,t為閾值，是判斷每個(gè)像素或歸入匹配像素，或歸入非匹配像素的依據(jù)。該準(zhǔn)則取MPC最大者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。上述各公式中，-W≤i,j≤+W，W為搜索范圍，N為宏塊大小，匹配函數(shù)的值為塊失真度BDM。,(3)最大誤差最小函數(shù)(MME),該準(zhǔn)則取MME最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。(4)最大匹配像素?cái)?shù)(MPC),其中,24,MSE匹配函數(shù)運(yùn)動(dòng)估計(jì)的精度最高，但其眾多的乘方運(yùn)算在VLSI實(shí)現(xiàn)中比較困難；MAD匹配函數(shù)略差，但其相對(duì)簡(jiǎn)單的運(yùn)算易于在VLSI中實(shí)現(xiàn)；MME匹配函數(shù)則過(guò)于簡(jiǎn)單，沒(méi)有充分利用匹配塊所包含的特征信息，使運(yùn)動(dòng)估計(jì)的精度大大降低。相對(duì)而言，MAD準(zhǔn)則函數(shù)比較實(shí)用，一度得到廣泛運(yùn)用。,,25,8.2.3.3搜索策略,搜索策略是運(yùn)動(dòng)估計(jì)算法最關(guān)鍵也是最復(fù)雜的部分。從搜索方向上看有梯度式(圖8-2)、螺旋式(圖8-3)，從搜索路線上看有矩形(圖8-2)、交叉線形(圖8-4)、圓形(圖8-5)和菱形(圖8-6)。將它們與不同的搜索步長(zhǎng)相結(jié)合，可得到不同的搜索模式；為保證搜索過(guò)程及時(shí)停止，需要選擇合適的中止準(zhǔn)則。搜索模式體現(xiàn)了搜索算法的基本特征，它從根本上決定了搜索算法的效率；搜索中止準(zhǔn)則是保證搜索過(guò)程結(jié)束的條件。一般來(lái)說(shuō)，梯度式搜索能夠自動(dòng)中止搜索，螺旋式搜索則需要指定搜索的中止條件。好的搜索中止準(zhǔn)則能進(jìn)一步提高搜索算法的效率。,26,圖8-2梯度式搜索圖8-3螺旋式搜索,圖8-4交叉線型搜索圖8-5圓形搜索圖8-6菱形搜索,27,8.2.4典型塊匹配算法介紹,最簡(jiǎn)單的BMA是全搜索法（FS），它窮盡參考幀搜索窗內(nèi)所有可能的點(diǎn)進(jìn)行比較，確實(shí)能找到BDM最小的匹配塊，因此，一般來(lái)說(shuō)，F(xiàn)S的預(yù)測(cè)精度最高。但FS巨大的時(shí)間開(kāi)銷(xiāo)妨礙了它在實(shí)際中的應(yīng)用，因此出現(xiàn)了各種類(lèi)型的快速算法。下面介紹一些典型的快速算法。,28,1)三步搜索法(3SS),3SS（如圖8-7）于1981年提出，是經(jīng)典的采用梯度式搜索的快速BMA。由于早期的搜索范圍為7，該算法經(jīng)過(guò)三步搜索即可結(jié)束，故得此名。如果擴(kuò)大搜索范圍，實(shí)際搜索過(guò)程就不止三步了，此時(shí)稱(chēng)之為“Log-D搜索”更為確切。,●第一步■第二步▲第三步圖8-7三步搜索法,29,3SS具有簡(jiǎn)單易實(shí)現(xiàn)、每個(gè)塊的搜索點(diǎn)數(shù)相同的優(yōu)點(diǎn)。但它也有一個(gè)致命的缺陷：第一步過(guò)于粗糙，在搜索范圍較大(如16或更大)時(shí)，初始步長(zhǎng)相對(duì)于塊的運(yùn)動(dòng)矢量估計(jì)來(lái)說(shuō)就太大了，跳出了可能性比較大的區(qū)域，導(dǎo)致搜索方向的不確定性，因此很容易陷入局部最優(yōu)。為克服3SS的上述缺點(diǎn)，1994年出現(xiàn)了新三步搜索法(N3SS)，該算法利用視頻運(yùn)動(dòng)矢量的中心偏置分布特點(diǎn)，加強(qiáng)對(duì)搜索中心區(qū)域，因此搜索精度有一定程度的提高。另外，N3SS引入了“中途退出”(Halfway-stop)的思想，雖然比較粗造，但為以后的快速算法指出了一種新的策略。,30,2)四步搜索法(4SS),4SS(如圖8-8)于1996年提出，其得名原因與3SS類(lèi)似。4SS既秉承了3SS梯度式搜索的方向性，又吸收了N3SS的優(yōu)點(diǎn)—利用運(yùn)動(dòng)矢量的中心偏置特點(diǎn)。如果說(shuō)N3SS過(guò)分強(qiáng)調(diào)對(duì)中心區(qū)域的搜索，顯得有些粗造的話，那么4SS的搜索顯得相對(duì)穩(wěn)妥：采用較小的步長(zhǎng)漸進(jìn)地搜索。因此，其搜索精度較N3SS又有進(jìn)一步的提高。,●第一步■第二步▲第三步◆第四步圖8-8四步搜索法,31,3)動(dòng)態(tài)搜索窗調(diào)整算法(DSWA),1993年推出的DSWA是另一種克服3SS搜索步長(zhǎng)過(guò)大缺陷的算法，它在搜索過(guò)程中能根據(jù)搜索窗收斂因子的大小自動(dòng)調(diào)整下一個(gè)搜索階段的搜索窗的尺寸，是一種自適應(yīng)的梯度式搜索算法。DSWA算法的搜索窗收斂因子Rw為當(dāng)前階段搜索窗大小與上一階段搜索窗大小之比，可以表示為：,其中，Th=0.6，Tl=0.3，M表示當(dāng)前搜索階段中所有搜索點(diǎn)BDM的次最小值，N表示所有搜索點(diǎn)BDM的最小值。,32,搜索窗內(nèi)搜索點(diǎn)的分布有兩種模式：“十”字形和“X”形(如圖7-9)，兩種模式在搜索的每一個(gè)階段交替使用，用以對(duì)搜索方向進(jìn)行補(bǔ)償。DSWA算法在克服3SS缺陷的效果方面不如后來(lái)出現(xiàn)的N3SS和4SS，其改變搜索步長(zhǎng)的計(jì)算也略顯復(fù)雜。但無(wú)論如何，它在搜索過(guò)程模式的轉(zhuǎn)變方面還是作出了有益的嘗試。,圖8-9DSWA的兩種搜索模式,33,4)菱形搜索法(DS),DS出現(xiàn)于1997年，它其實(shí)是在4SS的基礎(chǔ)上采用菱形搜索路線得到的一種算法。這個(gè)看起來(lái)不大的改變，卻給后來(lái)的快速運(yùn)動(dòng)估計(jì)算法帶來(lái)了巨大的影響。由于菱形更接近運(yùn)動(dòng)矢量的分布，該算法比4SS性能有較大的提高。DS曾于1999年7月被MPEG組織采用，作為VM軟件的運(yùn)動(dòng)估計(jì)算法。,圖7-10菱形搜索過(guò)程示例,DS算法最大的貢獻(xiàn)是提出了菱形搜索模式，更有利于運(yùn)動(dòng)矢量的編碼。但與新一代搜索算法相比，DS在搜索策略方面顯得過(guò)于簡(jiǎn)單，因而搜索效率不夠高，而且PSNR有時(shí)有較大損失(如對(duì)CCIR格式的Bus序列，平均PSNR比FS下降了2.61dB)。,34,5)APDZS,(1)采用螺旋式菱形搜索；(2)根據(jù)相鄰塊的運(yùn)動(dòng)矢量對(duì)搜索起點(diǎn)進(jìn)行預(yù)測(cè)；(3)在兩個(gè)指定大小(4圈)的中心區(qū)域進(jìn)行搜索；在一定程度上克服了局部最優(yōu)，但也帶來(lái)了搜索效率的問(wèn)題。(4)利用SAD的閾值中止搜索過(guò)程。若MinSAD<=thresa，中止搜索；若thresa=1)之前，計(jì)算虛擬緩沖器的占有率：,或,或,其中和為I、P和B三種幀類(lèi)型虛擬緩沖器的初始占有率；Bj為圖像中至第j個(gè)宏塊已編碼比特?cái)?shù)總和；MB_cnt為每幀圖像的宏塊總數(shù)；和分別為三種幀類(lèi)型在第j個(gè)宏塊時(shí)虛擬緩沖器占有率。由此可得第j個(gè)宏塊的參考量化尺度因子：,55,其中r為反映參數(shù)，可由下式得到：,由此可得第j個(gè)宏塊的參考量化尺度因子：,而虛擬緩沖器的初始占有率為：,上述碼率控制方法根據(jù)I、P和B三種類(lèi)型幀壓縮效率不同，預(yù)分配了不同的比特?cái)?shù)，而碼率控制則是通過(guò)監(jiān)視虛擬緩沖器狀態(tài)，在宏塊級(jí)上調(diào)節(jié)量化級(jí)因子，以使實(shí)際幀編碼比特?cái)?shù)盡可能接近于預(yù)分配幀編碼比特?cái)?shù)，它完全符合MPEG-2標(biāo)準(zhǔn)定義的視頻緩沖校驗(yàn)器(VideoBufferingVerifier，VBV)對(duì)緩沖器不產(chǎn)生“上溢”或“下溢”的要求。,56,需要注意的是，上述碼率控制方法的基本前提是場(chǎng)景類(lèi)似，但在實(shí)際電視節(jié)目中，會(huì)經(jīng)常發(fā)生場(chǎng)景切換，此時(shí)碼率控制方法就將發(fā)生問(wèn)題。由于場(chǎng)景切換時(shí)不能進(jìn)行正確的比特分配，特別是場(chǎng)景切換發(fā)生后，因切換幀編碼比特?cái)?shù)激增，會(huì)引起后面連續(xù)多幀分配比特?cái)?shù)下降，從而造成這些幀圖像質(zhì)量，特別是當(dāng)影響下一個(gè)GOP的I幀圖像時(shí)，由于I幀所處的重要地位，它的質(zhì)量好壞常常決定了整個(gè)GOP圖像的質(zhì)量，可能引起整個(gè)圖像質(zhì)量的下降。而從人眼的視覺(jué)特性來(lái)看，在場(chǎng)景切換時(shí)，人眼對(duì)圖像質(zhì)量的降質(zhì)不敏感，即不要求保證切換幀的圖像質(zhì)量，這就為解決場(chǎng)景切換時(shí)的碼率控制問(wèn)題提供了方便。因?yàn)橐鉀Q上述問(wèn)題，關(guān)鍵是要保證切換幀實(shí)際編碼比特?cái)?shù)盡量與預(yù)分配編碼比特?cái)?shù)接近，以不減少后續(xù)幀預(yù)分配編碼比特?cái)?shù)。然后通過(guò)修正碼率控制方案，以使后續(xù)幀能合理地分配碼字；且合理調(diào)整幀初始量化級(jí)，從而使得后續(xù)幀量化級(jí)能迅速降下來(lái)，保證后續(xù)幀圖像質(zhì)量。,57,8.4視頻壓縮標(biāo)準(zhǔn),,58,8.4.1H.261標(biāo)準(zhǔn),,59,8.4.2MPEG-1視頻壓縮標(biāo)準(zhǔn),,60,8.4.3MPEG-2視頻標(biāo)準(zhǔn),,61,8.4.4H.263建議,,62,8.4.5MPEG-4視頻標(biāo)準(zhǔn)簡(jiǎn)介,,

下載提示(請(qǐng)認(rèn)真閱讀)

1.請(qǐng)仔細(xì)閱讀文檔，確保文檔完整性，對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
2.下載的文檔，不會(huì)出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預(yù)覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請(qǐng)點(diǎn)此認(rèn)領(lǐng)！既往收益都?xì)w您。

同意并開(kāi)始全文預(yù)覽

文檔包含非法信息？點(diǎn)此舉報(bào)后獲取現(xiàn)金獎(jiǎng)勵(lì)！

文檔加載中……請(qǐng)稍候！
如果長(zhǎng)時(shí)間未打開(kāi)，您也可以點(diǎn)擊刷新試試。

下載文檔到電腦，查找使用更方便

14.9 積分

還剩頁(yè)未讀，繼續(xù)閱讀

舉報(bào)

版權(quán)申訴 word格式文檔無(wú)特別注明外均可編輯修改；預(yù)覽文檔經(jīng)過(guò)壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁(yè)顯示word圖標(biāo)，表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
特殊限制：: 部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片，僅作為作品整體效果示例展示，禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
關(guān) 鍵詞：: 數(shù)字圖像處理數(shù)字視頻

溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶(hù)自行上傳分享，僅供網(wǎng)友學(xué)習(xí)交流，未經(jīng)上傳用戶(hù)書(shū)面授權(quán)，請(qǐng)勿作他用。

關(guān)于本文

本文標(biāo)題：數(shù)字圖像處理第8章數(shù)字視頻處理.ppt
鏈接地址：http://m.zhongcaozhi.com.cn/p-12175098.html

相關(guān)資源更多

正為您匹配相似的精品文檔

相關(guān)搜索

數(shù)字圖像 處理 數(shù)字視頻

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號(hào):蜀ICP備2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)

本站為文檔C2C交易模式，即用戶(hù)上傳的文檔直接被用戶(hù)下載，本站只是中間服務(wù)平臺(tái)，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知裝配圖網(wǎng)，我們立即給予刪除！

數(shù)字圖像處理第8章數(shù)字視頻處理.ppt

最新文檔