數(shù)字圖像處理第8章數(shù)字視頻處理.ppt
《數(shù)字圖像處理第8章數(shù)字視頻處理.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)字圖像處理第8章數(shù)字視頻處理.ppt(62頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1,第8章數(shù)字視頻處理,8.1視頻技術(shù)及其應(yīng)用8.2快速運(yùn)動(dòng)估計(jì)技術(shù)8.3視頻壓縮技術(shù)8.4視頻壓縮標(biāo)準(zhǔn),2,8.1視頻技術(shù)及其應(yīng)用,與靜止圖像相反,視頻(Video)為活動(dòng)圖像(或運(yùn)動(dòng)圖像)。我們所看到的電影和電視都屬于視頻的范疇,它實(shí)際上是由許多單一的畫(huà)面所組成,每一幅畫(huà)面稱(chēng)為一幀。由于人眼的視覺(jué)惰性,每秒24幀的電影畫(huà)面就形成了連續(xù)活動(dòng)影象感覺(jué)的電影。因此,幀是構(gòu)成視頻信息的最小和最基本的單元。,3,8.1.1視頻信號(hào)的數(shù)字化,大家日常使用的電視和錄像等都屬于模擬視頻,它是基于模擬技術(shù)以及圖像的廣播與顯示所確定的國(guó)際標(biāo)準(zhǔn)。模擬視頻圖像具有成本低和還原度好等優(yōu)點(diǎn)。因此在電視上看到的風(fēng)景錄象,往往具有身臨其境的感覺(jué)。但它的最大缺點(diǎn)是經(jīng)過(guò)長(zhǎng)時(shí)間的存放之后,視頻質(zhì)量將大為降低,而且經(jīng)過(guò)多次復(fù)制之后,圖像的失真就會(huì)很明顯。而數(shù)字視頻可以彌補(bǔ)這些缺陷。它不僅可以無(wú)失真地進(jìn)行無(wú)限次復(fù)制,而且還可以對(duì)視頻進(jìn)行創(chuàng)造性的編輯,如特技效果等。而數(shù)字視頻是基于數(shù)字技術(shù)以及其它更為拓展的圖像顯示標(biāo)準(zhǔn)。數(shù)字視頻有兩層涵義,一是模擬視頻信號(hào)輸入計(jì)算機(jī)進(jìn)行數(shù)字化視頻編輯,最后制成數(shù)字視頻產(chǎn)品;二是指視頻圖像由數(shù)字?jǐn)z象機(jī)拍攝下來(lái),從信號(hào)源開(kāi)始,就是無(wú)失真的數(shù)字硯頻,視頻圖像輸入計(jì)算機(jī)時(shí)不再者慮視頻質(zhì)量的衰臧問(wèn)題。現(xiàn)在的數(shù)字視頻技術(shù)主要還是第一層涵義,即模擬視頻的數(shù)字化處理、存儲(chǔ)和輸出技術(shù)。,4,視頻的數(shù)字化是指在一段時(shí)間內(nèi)以一定的速度對(duì)模擬頻信號(hào)進(jìn)行捕捉并加以采樣后形成數(shù)字化數(shù)據(jù)的處理過(guò)程。通常的視頻信號(hào)都是模擬的,在進(jìn)入計(jì)算機(jī)前必須進(jìn)行數(shù)字化處理,即A/D轉(zhuǎn)換和彩色空間變換等。視頻信號(hào)數(shù)字化是對(duì)視頻信號(hào)進(jìn)行采樣捕獲,其采樣深度可以是8、16或24位等。采樣深度是經(jīng)采樣后每幀所包含的顏色位,然后將來(lái)樣后所得數(shù)據(jù)保存起來(lái),以便對(duì)它進(jìn)行編輯、處理和播放。視頻信號(hào)的采集就是將模擬視頻信號(hào)經(jīng)硬件數(shù)字化后,再將數(shù)字化數(shù)據(jù)加以存儲(chǔ)。使用時(shí),將數(shù)字化數(shù)據(jù)從存儲(chǔ)介質(zhì)中讀出,并還原成圖象信號(hào)加以輸出。視頻信號(hào)的采集可分為單幅畫(huà)面采集和多幅動(dòng)態(tài)連續(xù)采集。在單幅畫(huà)面采集時(shí),可以將輸入的視頻信息定格,并將定格后的單幅畫(huà)面以多種圖象文件格式加以存儲(chǔ),對(duì)于多幅動(dòng)態(tài)連續(xù)采集,可對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí),動(dòng)態(tài)地捕獲和壓縮,并以文件形式存儲(chǔ)。對(duì)視頻信號(hào)進(jìn)行數(shù)字化采樣后,則可以對(duì)數(shù)字視頻進(jìn)行編輯或加工。比如復(fù)制、刪除、特技變換和改變視頻格式等。,5,8.1.2視頻信號(hào)的處理,視頻信號(hào)處理是指根據(jù)人的要求對(duì)視頻圖像進(jìn)行某種處理,主要包括:(1)在保證一定圖像質(zhì)量的前提下盡可能壓縮視頻圖像的數(shù)據(jù)量(即視頻壓縮)。(2)消除視頻信號(hào)產(chǎn)生、獲取和傳輸過(guò)程中引入的失真和干擾,使視頻信號(hào)盡可能逼真地重現(xiàn)景物。例如使用圖像增強(qiáng)技術(shù)和圖像恢復(fù)技術(shù)。(3)根據(jù)某些準(zhǔn)則,盡可能除去視頻圖像中的無(wú)用信息而突出其主要信息。(4)從視頻圖像中提取某些特征,以便對(duì)其進(jìn)行描述、分類(lèi)和識(shí)別。,6,8.1.3視頻信號(hào)的壓縮編碼,壓縮目標(biāo)是在盡可能保證視覺(jué)效果的前提下減少視頻數(shù)據(jù)率。由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處,但視頻還有其自身的特性,因此壓縮時(shí)還應(yīng)考慮其運(yùn)動(dòng)特性才能達(dá)到高壓縮的目標(biāo)。在視頻壓縮中常需用以下的一些基本概念:(1)有損和無(wú)損壓縮:在視頻壓縮中有損和無(wú)損的概念與靜態(tài)圖像中基本類(lèi)似。(2)幀內(nèi)和幀間壓縮:幀內(nèi)(Intraframe)壓縮也稱(chēng)為空間壓縮(SpatialCompression)。當(dāng)壓縮一幀圖像時(shí),僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實(shí)際上與靜態(tài)圖像壓縮類(lèi)似。幀內(nèi)一般采用有損壓縮算法,由于幀內(nèi)壓縮時(shí)各個(gè)幀之間沒(méi)有相互關(guān)系,所以壓縮后的視頻數(shù)據(jù)仍可以以幀為單位進(jìn)行編輯。幀內(nèi)壓縮一般達(dá)不到很高的壓縮。,7,采用幀間(Interframe)壓縮是基于許多視頻或動(dòng)畫(huà)的連續(xù)前后兩幀具有很大的相關(guān)性,或者說(shuō)前后兩幀信息變化很小的特點(diǎn)。也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性,壓縮相鄰幀之間的冗余量就可以進(jìn)一步提高壓縮量,減小壓縮比。幀間壓縮也稱(chēng)為時(shí)間壓縮(Temporalcompression),它通過(guò)比較時(shí)間軸上不同幀之間的數(shù)據(jù)進(jìn)行壓縮。幀間壓縮一般是無(wú)損的。如:幀差值(Framedifferencing)算法通過(guò)比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數(shù)據(jù)量。,8,(3)對(duì)稱(chēng)和不對(duì)稱(chēng)編碼:對(duì)稱(chēng)(symmetric)意味著壓縮和解壓縮占用相同的計(jì)算處理能力和時(shí)間,對(duì)稱(chēng)算法適合于實(shí)時(shí)壓縮和傳送視頻,如視頻會(huì)議應(yīng)用就以采用對(duì)稱(chēng)的壓縮編碼算法為好。而在電子出版和其它多媒體應(yīng)用中,一般是把視頻預(yù)先壓縮處理好,爾后再播放,因此可以采用不對(duì)稱(chēng)(asymmetric)編碼。不對(duì)稱(chēng)或非對(duì)稱(chēng)意味著壓縮時(shí)需要花費(fèi)大量的處理能力和時(shí)間,而解壓縮時(shí)則能較好地實(shí)時(shí)回放,也即以不同的速度進(jìn)行壓縮和解壓縮。,9,8.1.4視頻信號(hào)的傳輸與存儲(chǔ),為了有效而高質(zhì)量地傳輸視頻信號(hào),需要解決以下幾個(gè)問(wèn)題:(1)視頻信號(hào)在傳輸過(guò)程中會(huì)引入各種干擾和噪聲,如何降低甚至消除這些噪聲和干擾,是視頻信號(hào)傳輸要解決的首要問(wèn)題。通常的解決辦法有:采用糾錯(cuò)編碼、自適應(yīng)均衡和自適應(yīng)濾波等。(2)為了節(jié)省頻帶,除了使用高效壓縮技術(shù)壓縮信源信息外,還可以使用先進(jìn)的數(shù)字調(diào)制技術(shù),例如殘留邊帶調(diào)制(VSB)、正交幅度調(diào)制(QAM)和格狀編碼調(diào)制(TCM)等。(3)視頻信號(hào)除可通過(guò)廣播傳輸外,還可通過(guò)有線電視、光纖、微波等進(jìn)行傳輸。隨著窄帶綜合業(yè)務(wù)數(shù)字網(wǎng)的普及和寬帶綜合業(yè)務(wù)數(shù)字網(wǎng)的發(fā)展,視頻通信的前景將會(huì)更加光明。,10,對(duì)于模擬電視信號(hào),最常見(jiàn)的存儲(chǔ)媒體是錄像帶。另一種存儲(chǔ)模擬視頻信號(hào)的媒體是激光影碟(LD)。但1994年出現(xiàn)了建立在激光唱盤(pán)(CD)基礎(chǔ)上的視頻激光視盤(pán)(V-CD)。后者采用MPEG-l標(biāo)準(zhǔn),可以在標(biāo)準(zhǔn)的12厘米CD上存儲(chǔ)74分鐘VHS質(zhì)量的視頻節(jié)目和具有CD質(zhì)量的立體聲。V-CD與世界的所有廣播電視制式兼容,易于使用和存放,而且生產(chǎn)成本也較低。播放V-CD既可使用多媒體計(jì)算機(jī),也可使用專(zhuān)門(mén)的V-CD播放機(jī)。由于數(shù)字視盤(pán)(DVD)采用了MPEG-2標(biāo)準(zhǔn)中的MP@ML標(biāo)準(zhǔn),所以視頻圖像質(zhì)量大大優(yōu)于V-CD,而音頻部分采用杜比公司開(kāi)發(fā)的AC-3系統(tǒng),其圖像和聲音質(zhì)量將超過(guò)其它系統(tǒng)。,11,8.1.5視頻技術(shù)的應(yīng)用,(1)視頻技術(shù)在廣播電視中的應(yīng)用廣播電視是視頻技術(shù)的傳統(tǒng)領(lǐng)域,早期的黑白電視和現(xiàn)仍廣泛使用的彩色電視及其相關(guān)產(chǎn)品,采用的是模擬視頻技術(shù),而數(shù)字電視(常規(guī)數(shù)字電視、電視電話、會(huì)議電視和高清晰度電視)全面使用數(shù)字視頻技術(shù),其編碼、存儲(chǔ)、傳輸和播放都實(shí)行數(shù)字化。數(shù)字視頻技術(shù)在廣播電視中的應(yīng)用主要包括:地面電視廣播、衛(wèi)星電視廣播、數(shù)字視頻廣播、衛(wèi)星電視直播、有線電視、交互式電視、常規(guī)電視和高清晰度電視等。,12,(2)視頻技術(shù)在通信領(lǐng)域中的應(yīng)用以前視頻通信一直局限于傳輸單向的模擬電視,在通信網(wǎng)中,高質(zhì)量的彩色數(shù)字視頻通信要占用34Mbps以上的帶寬,因而很不經(jīng)濟(jì)。由于視頻壓縮技術(shù)的發(fā)展,使得視頻信號(hào)的數(shù)碼率大大降低。另一方面,通信技術(shù)的迅速發(fā)展又為視頻通信提供了所需的帶寬。視頻技術(shù)在通信領(lǐng)域中的應(yīng)用主要包括:電視電話、會(huì)議電視、多媒體通信、視頻點(diǎn)播、常規(guī)電視和高清晰度電視、交互式電視以及視頻數(shù)據(jù)庫(kù)等。,13,(3)視頻技術(shù)在娛樂(lè)領(lǐng)域中的應(yīng)用電視機(jī)及其相關(guān)產(chǎn)品長(zhǎng)久不衰的原因在于它是大眾娛樂(lè)消費(fèi)產(chǎn)品,電視是目前人類(lèi)最重要的信息傳播媒體,它對(duì)人類(lèi)生活的影響之大,簡(jiǎn)直難以用語(yǔ)言表達(dá),它已成為人們生活的重要組成部分。視頻技術(shù)賴(lài)以生存和迅速發(fā)展的基礎(chǔ)在于娛樂(lè)領(lǐng)域,其主要應(yīng)用包括:常規(guī)電視和高清晰度電視、記錄、存儲(chǔ)和顯示設(shè)備、V-CD和DVD、交互式電視、電視電話、電視購(gòu)物、視頻點(diǎn)播和視頻游戲等。(4)視頻技術(shù)在計(jì)算機(jī)領(lǐng)域中的應(yīng)用視頻技術(shù)已廣泛應(yīng)用到計(jì)算機(jī)領(lǐng)域?,F(xiàn)在高檔計(jì)算機(jī)幾乎都配置有視頻解壓縮卡、CD-ROM和視頻播放軟件,這種多媒體計(jì)算機(jī)集視頻畫(huà)面的真實(shí)性和計(jì)算機(jī)的交互性于一體,已成為當(dāng)前計(jì)算機(jī)領(lǐng)域的熱門(mén)話題。視頻技術(shù)在計(jì)算機(jī)領(lǐng)域中的應(yīng)用主要包括:多媒體計(jì)算機(jī)、CD-ROM和V-CD、視頻數(shù)據(jù)庫(kù)、多媒體通信、交互式電視、三維圖形圖像、動(dòng)畫(huà)設(shè)計(jì)與制作、視頻制作以及虛擬現(xiàn)實(shí)(VR)等。,14,8.2快速運(yùn)動(dòng)估計(jì)技術(shù),視頻序列在時(shí)間上有很強(qiáng)的相關(guān)性,利用運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償技術(shù)可以有效地去除圖像的幀間冗余度,從而實(shí)現(xiàn)比幀內(nèi)壓縮方案更高的壓縮比。因此這種技術(shù)已廣泛用于視頻壓縮的一些國(guó)際標(biāo)準(zhǔn),如H.261、H.263、MPEG-1、MPEG-2和MPEG-4等。作為幀間壓縮的核心和關(guān)鍵,運(yùn)動(dòng)估計(jì)技術(shù)受到了人們的廣泛關(guān)注,出現(xiàn)了多種研究方案,主要有光流方程法、像素遞歸法和塊匹配法(BMA:BlockMatchingAlgorithm)三種。綜合考慮計(jì)算復(fù)雜度和編碼效率等因素,塊匹配法由于簡(jiǎn)單實(shí)用,已經(jīng)成為運(yùn)動(dòng)估計(jì)算法的主流。,15,8.2.1運(yùn)動(dòng)估計(jì)模型,活動(dòng)圖像(視頻)編碼主要研究由物體和攝像機(jī)的相對(duì)運(yùn)動(dòng)而形成的二維運(yùn)動(dòng)。假定運(yùn)動(dòng)物體在幀間做平移運(yùn)動(dòng),相對(duì)應(yīng)的運(yùn)動(dòng)模型可以表示為:u=x+Vx,v=y+Vy當(dāng)運(yùn)動(dòng)物體在幀間有旋轉(zhuǎn)、形狀和大小等變化時(shí),采用上式所表示的運(yùn)動(dòng)模型作運(yùn)動(dòng)估計(jì),會(huì)產(chǎn)生很大的估計(jì)誤差。為了解決這個(gè)問(wèn)題,有人提出了如下12個(gè)參數(shù)的運(yùn)動(dòng)模型:,這種運(yùn)動(dòng)模型雖然能有效地估計(jì)運(yùn)動(dòng)物體的平移、旋轉(zhuǎn)和縮放等不同的運(yùn)動(dòng)變化,但需要進(jìn)行很復(fù)雜的參數(shù)估計(jì),因此并不實(shí)用。,16,上述模型都是基于運(yùn)動(dòng)物體的,然而在視頻編碼過(guò)程中把圖像分割成有不同運(yùn)動(dòng)的物體非常困難。通常采用兩種比較簡(jiǎn)單的方法:一種方法是把圖像分成若干矩形塊,假定塊做平移運(yùn)動(dòng),對(duì)塊的運(yùn)動(dòng)進(jìn)行匹配估計(jì);另一種方法是對(duì)每個(gè)像素的位移進(jìn)行遞歸估計(jì)。通常像素遞歸估計(jì)的精度高,對(duì)多運(yùn)動(dòng)畫(huà)面的適應(yīng)性強(qiáng),但它的跟蹤范圍小,實(shí)現(xiàn)復(fù)雜。塊匹配運(yùn)動(dòng)估計(jì)雖然精度低,但它的位移跟蹤能力強(qiáng),容易實(shí)現(xiàn),因而得到了廣泛的應(yīng)用,并被H.26x和MPEG標(biāo)準(zhǔn)采用。,17,8.2.2塊匹配運(yùn)動(dòng)估計(jì)的原理,塊匹配的基本思想就是將當(dāng)前幀分成若干個(gè)大小相同的塊,對(duì)每一個(gè)塊(當(dāng)前塊)分別在參考幀中的一定區(qū)域(稱(chēng)為搜索窗)內(nèi),按照一定的匹配準(zhǔn)則搜索與之最接近的塊(稱(chēng)為預(yù)測(cè)塊),預(yù)測(cè)塊與當(dāng)前塊間的位移稱(chēng)為運(yùn)動(dòng)矢量,它們的像素間的差值稱(chēng)為殘差塊,預(yù)測(cè)塊與當(dāng)前塊之間通過(guò)匹配準(zhǔn)則函數(shù)得到的值稱(chēng)為塊失真度(BDM)。這樣當(dāng)前幀中的每一塊都可用一個(gè)殘差塊和一對(duì)運(yùn)動(dòng)矢量來(lái)表示。圖8-1為塊匹配運(yùn)動(dòng)估計(jì)的示意圖。,圖8-1塊匹配運(yùn)動(dòng)估計(jì)示意圖,18,這里,搜索窗尺寸(搜索范圍)的選取對(duì)搜索結(jié)果有很大影響:搜索范圍越大,得到更小殘差塊的可能性越大,但這會(huì)帶來(lái)更大的時(shí)間開(kāi)銷(xiāo)。通常選擇的搜索范圍有7,16,32,48,64,128等。由于塊匹配時(shí)需要在前后幀間逐像素比較,如果采用全搜索算法(即窮盡參考幀搜索區(qū)域所有可能的點(diǎn)進(jìn)行比較,從中找到全局最優(yōu)點(diǎn)),計(jì)算量非常巨大。如對(duì)格式為CIF(352288)的圖像,若塊大小為1616,當(dāng)搜索范圍為16時(shí),每個(gè)塊的搜索點(diǎn)數(shù)為1089,每幀圖像的搜索點(diǎn)數(shù)則達(dá)到431244;當(dāng)搜索范圍為128時(shí),每幀圖像的搜索點(diǎn)數(shù)將達(dá)到26155404,因此快速塊匹配算法的研究是非常必要的。,顯然,殘差塊的值越小,越有利于壓縮。因此運(yùn)動(dòng)估計(jì)的主要目標(biāo)就是使預(yù)測(cè)塊與當(dāng)前塊之間的BDM盡量小,即:,19,8.2.3塊匹配運(yùn)動(dòng)估計(jì)的各個(gè)環(huán)節(jié),塊匹配運(yùn)動(dòng)估計(jì)可從三個(gè)方向進(jìn)行研究:(1)塊形狀與大??;(2)塊匹配準(zhǔn)則;(3)搜索策略。目前,塊形狀與大小以及塊匹配準(zhǔn)則由于相對(duì)簡(jiǎn)單,已經(jīng)有了比較一致的選擇;而搜索策略最為復(fù)雜,它決定了一個(gè)算法的好壞,因此一直是快速運(yùn)動(dòng)估計(jì)研究的主要方向。,20,8.2.3.1塊形狀與大小,塊匹配法隱含著如下假設(shè):同一塊內(nèi)的像素的運(yùn)動(dòng)是一致的。顯然這個(gè)假設(shè)具有一定的片面性,但選擇合適的塊形狀與大小可在一定程度上消除這種片面性。一般來(lái)說(shuō),塊形狀選用正方形是比較自然的選擇,這樣既便于圖像的劃分,又有利于塊匹配準(zhǔn)則函數(shù)的計(jì)算。但這并非總是最佳選擇,因此也有的算法采用了其它形狀。,21,關(guān)于塊的大小,顯然塊越小,得到的殘差塊越小,但這會(huì)引入較多的運(yùn)動(dòng)矢量,可能降低編碼的效率。作為折衷,通常選擇1616和88像素的正方形塊。在H.261、MPEG-1和MPEG-2中,運(yùn)動(dòng)矢量是以1616的宏塊為單位的,由于塊尺寸相對(duì)較大,可能包含圖像中不同的運(yùn)動(dòng)部分,造成預(yù)測(cè)精度的下降;在H.263和MPEG-4中標(biāo)準(zhǔn)則在宏塊運(yùn)動(dòng)矢量的基礎(chǔ)上加入了以88塊的運(yùn)動(dòng)矢量,預(yù)測(cè)精度得到了一定的提高。另外,有的運(yùn)動(dòng)估計(jì)算法,如分級(jí)塊匹配法采用的是塊大小可變的方案。其基本思想是從最低分辨率級(jí)開(kāi)始,在每一層依次進(jìn)行運(yùn)動(dòng)估計(jì)。較低分辨率用于確定相對(duì)較大塊的位移的初略估計(jì),接著把低分辨率級(jí)位移矢量的估計(jì)值傳遞到下一個(gè)高分辨率級(jí),較高分辨率級(jí)用于精確調(diào)整位移矢量的估計(jì)。,22,8.2.3.2塊匹配準(zhǔn)則,塊匹配準(zhǔn)則是判斷塊相似程度的依據(jù),因此匹配準(zhǔn)則的好壞直接影響了運(yùn)動(dòng)估計(jì)的精度;另一方面,匹配運(yùn)算復(fù)雜度、數(shù)據(jù)讀取復(fù)雜度在很大程度上取決于所采用的塊匹配準(zhǔn)則。因此,提高運(yùn)動(dòng)估計(jì)算法的速度可以有兩種途徑,一種是減少搜索匹配的點(diǎn)數(shù),另一種則是降低塊匹配準(zhǔn)則的計(jì)算復(fù)雜度。常用的塊匹配準(zhǔn)則有以下幾種:,(1)均方誤差函數(shù)(MSE),該準(zhǔn)則取MSE最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。(2)絕對(duì)平均差函數(shù)(MAD),該準(zhǔn)則取MAD最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。,23,t為閾值,是判斷每個(gè)像素或歸入匹配像素,或歸入非匹配像素的依據(jù)。該準(zhǔn)則取MPC最大者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。上述各公式中,-W≤i,j≤+W,W為搜索范圍,N為宏塊大小,匹配函數(shù)的值為塊失真度BDM。,(3)最大誤差最小函數(shù)(MME),該準(zhǔn)則取MME最小者對(duì)應(yīng)的運(yùn)動(dòng)矢量作為搜索結(jié)果。(4)最大匹配像素?cái)?shù)(MPC),其中,24,MSE匹配函數(shù)運(yùn)動(dòng)估計(jì)的精度最高,但其眾多的乘方運(yùn)算在VLSI實(shí)現(xiàn)中比較困難;MAD匹配函數(shù)略差,但其相對(duì)簡(jiǎn)單的運(yùn)算易于在VLSI中實(shí)現(xiàn);MME匹配函數(shù)則過(guò)于簡(jiǎn)單,沒(méi)有充分利用匹配塊所包含的特征信息,使運(yùn)動(dòng)估計(jì)的精度大大降低。相對(duì)而言,MAD準(zhǔn)則函數(shù)比較實(shí)用,一度得到廣泛運(yùn)用。,,25,8.2.3.3搜索策略,搜索策略是運(yùn)動(dòng)估計(jì)算法最關(guān)鍵也是最復(fù)雜的部分。從搜索方向上看有梯度式(圖8-2)、螺旋式(圖8-3),從搜索路線上看有矩形(圖8-2)、交叉線形(圖8-4)、圓形(圖8-5)和菱形(圖8-6)。將它們與不同的搜索步長(zhǎng)相結(jié)合,可得到不同的搜索模式;為保證搜索過(guò)程及時(shí)停止,需要選擇合適的中止準(zhǔn)則。搜索模式體現(xiàn)了搜索算法的基本特征,它從根本上決定了搜索算法的效率;搜索中止準(zhǔn)則是保證搜索過(guò)程結(jié)束的條件。一般來(lái)說(shuō),梯度式搜索能夠自動(dòng)中止搜索,螺旋式搜索則需要指定搜索的中止條件。好的搜索中止準(zhǔn)則能進(jìn)一步提高搜索算法的效率。,26,圖8-2梯度式搜索圖8-3螺旋式搜索,圖8-4交叉線型搜索圖8-5圓形搜索圖8-6菱形搜索,27,8.2.4典型塊匹配算法介紹,最簡(jiǎn)單的BMA是全搜索法(FS),它窮盡參考幀搜索窗內(nèi)所有可能的點(diǎn)進(jìn)行比較,確實(shí)能找到BDM最小的匹配塊,因此,一般來(lái)說(shuō),F(xiàn)S的預(yù)測(cè)精度最高。但FS巨大的時(shí)間開(kāi)銷(xiāo)妨礙了它在實(shí)際中的應(yīng)用,因此出現(xiàn)了各種類(lèi)型的快速算法。下面介紹一些典型的快速算法。,28,1)三步搜索法(3SS),3SS(如圖8-7)于1981年提出,是經(jīng)典的采用梯度式搜索的快速BMA。由于早期的搜索范圍為7,該算法經(jīng)過(guò)三步搜索即可結(jié)束,故得此名。如果擴(kuò)大搜索范圍,實(shí)際搜索過(guò)程就不止三步了,此時(shí)稱(chēng)之為“Log-D搜索”更為確切。,●第一步■第二步▲第三步圖8-7三步搜索法,29,3SS具有簡(jiǎn)單易實(shí)現(xiàn)、每個(gè)塊的搜索點(diǎn)數(shù)相同的優(yōu)點(diǎn)。但它也有一個(gè)致命的缺陷:第一步過(guò)于粗糙,在搜索范圍較大(如16或更大)時(shí),初始步長(zhǎng)相對(duì)于塊的運(yùn)動(dòng)矢量估計(jì)來(lái)說(shuō)就太大了,跳出了可能性比較大的區(qū)域,導(dǎo)致搜索方向的不確定性,因此很容易陷入局部最優(yōu)。為克服3SS的上述缺點(diǎn),1994年出現(xiàn)了新三步搜索法(N3SS),該算法利用視頻運(yùn)動(dòng)矢量的中心偏置分布特點(diǎn),加強(qiáng)對(duì)搜索中心區(qū)域,因此搜索精度有一定程度的提高。另外,N3SS引入了“中途退出”(Halfway-stop)的思想,雖然比較粗造,但為以后的快速算法指出了一種新的策略。,30,2)四步搜索法(4SS),4SS(如圖8-8)于1996年提出,其得名原因與3SS類(lèi)似。4SS既秉承了3SS梯度式搜索的方向性,又吸收了N3SS的優(yōu)點(diǎn)—利用運(yùn)動(dòng)矢量的中心偏置特點(diǎn)。如果說(shuō)N3SS過(guò)分強(qiáng)調(diào)對(duì)中心區(qū)域的搜索,顯得有些粗造的話,那么4SS的搜索顯得相對(duì)穩(wěn)妥:采用較小的步長(zhǎng)漸進(jìn)地搜索。因此,其搜索精度較N3SS又有進(jìn)一步的提高。,●第一步■第二步▲第三步◆第四步圖8-8四步搜索法,31,3)動(dòng)態(tài)搜索窗調(diào)整算法(DSWA),1993年推出的DSWA是另一種克服3SS搜索步長(zhǎng)過(guò)大缺陷的算法,它在搜索過(guò)程中能根據(jù)搜索窗收斂因子的大小自動(dòng)調(diào)整下一個(gè)搜索階段的搜索窗的尺寸,是一種自適應(yīng)的梯度式搜索算法。DSWA算法的搜索窗收斂因子Rw為當(dāng)前階段搜索窗大小與上一階段搜索窗大小之比,可以表示為:,其中,Th=0.6,Tl=0.3,M表示當(dāng)前搜索階段中所有搜索點(diǎn)BDM的次最小值,N表示所有搜索點(diǎn)BDM的最小值。,32,搜索窗內(nèi)搜索點(diǎn)的分布有兩種模式:“十”字形和“X”形(如圖7-9),兩種模式在搜索的每一個(gè)階段交替使用,用以對(duì)搜索方向進(jìn)行補(bǔ)償。DSWA算法在克服3SS缺陷的效果方面不如后來(lái)出現(xiàn)的N3SS和4SS,其改變搜索步長(zhǎng)的計(jì)算也略顯復(fù)雜。但無(wú)論如何,它在搜索過(guò)程模式的轉(zhuǎn)變方面還是作出了有益的嘗試。,圖8-9DSWA的兩種搜索模式,33,4)菱形搜索法(DS),DS出現(xiàn)于1997年,它其實(shí)是在4SS的基礎(chǔ)上采用菱形搜索路線得到的一種算法。這個(gè)看起來(lái)不大的改變,卻給后來(lái)的快速運(yùn)動(dòng)估計(jì)算法帶來(lái)了巨大的影響。由于菱形更接近運(yùn)動(dòng)矢量的分布,該算法比4SS性能有較大的提高。DS曾于1999年7月被MPEG組織采用,作為VM軟件的運(yùn)動(dòng)估計(jì)算法。,圖7-10菱形搜索過(guò)程示例,DS算法最大的貢獻(xiàn)是提出了菱形搜索模式,更有利于運(yùn)動(dòng)矢量的編碼。但與新一代搜索算法相比,DS在搜索策略方面顯得過(guò)于簡(jiǎn)單,因而搜索效率不夠高,而且PSNR有時(shí)有較大損失(如對(duì)CCIR格式的Bus序列,平均PSNR比FS下降了2.61dB)。,34,5)APDZS,(1)采用螺旋式菱形搜索;(2)根據(jù)相鄰塊的運(yùn)動(dòng)矢量對(duì)搜索起點(diǎn)進(jìn)行預(yù)測(cè);(3)在兩個(gè)指定大小(4圈)的中心區(qū)域進(jìn)行搜索;在一定程度上克服了局部最優(yōu),但也帶來(lái)了搜索效率的問(wèn)題。(4)利用SAD的閾值中止搜索過(guò)程。若MinSAD<=thresa,中止搜索;若thresa- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖像 處理 數(shù)字視頻
鏈接地址:http://m.zhongcaozhi.com.cn/p-12175098.html