《一種新的數(shù)字視頻關鍵幀編碼技術的創(chuàng)新》由會員分享,可在線閱讀,更多相關《一種新的數(shù)字視頻關鍵幀編碼技術的創(chuàng)新(2頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、一種新的數(shù)字視頻關鍵幀編碼技術的創(chuàng)新
中圖分類號:TN919.81
分布式視頻編碼中WZ幀編碼技術研究。分布式視頻編碼是一種新興的編碼技術,它和傳統(tǒng)編碼技術不同,傳統(tǒng)的視頻編碼技術基本都是,編碼端比較復雜,解碼端比較簡單。而分布式編碼的編碼端比較簡單,解碼端則比較復雜。為了達到這個目的,學術界提出了很多實現(xiàn)方案,在這些方案之中,最為著名的,是斯坦福大學研究小組提出的分布式編碼方案。整個視頻序列被劃分為關鍵幀和WZ幀,它們使用兩個獨立的系統(tǒng)進行編碼。
1 視頻幀編碼
視頻圖像的各幀之間的數(shù)據(jù)存在很多冗余性和相關性,這些冗余信息我們將它分為空域冗余和時域冗余信息兩種。因此我們在
2、壓縮編碼中就是將數(shù)據(jù)中的冗余信息盡量去掉,采用某種關聯(lián)的形式存儲包含在幀內(nèi)和幀間的圖像數(shù)據(jù)。幀間圖像數(shù)據(jù)的壓縮技術一般熵編碼壓縮技術,我們以MPEG-2為例,圖像壓縮編碼和幀內(nèi)壓縮編碼方式分別見圖1和見圖2。
圖1 視頻圖像幀內(nèi)壓縮編碼原理
壓縮之前需要找到也就是識別每個視頻場和幀之間的時間和空間的冗余信息,通過無信號損失的雙向數(shù)學過程DCT變換可以去除視頻信號空間冗余。幀間信號空間分布的變化程度轉(zhuǎn)變?yōu)樾枰噩F(xiàn)空間分布的頻率帶寬,為了達到減少冗余數(shù)據(jù)的目的,MPEG-2格式視頻將4:2:2轉(zhuǎn)換成4:2:0,同時量化減少每一個系數(shù)的Byte數(shù)目。
圖2 幀間壓縮編碼方式
3、2 關鍵幀編碼方式改進
關鍵幀中一幀就是視頻中的一個畫面。視頻編碼是按"組";進行的,每一組也叫一個GOP,GOP與GOP之間是沒有聯(lián)系的,編碼關系只在GOP中間產(chǎn)生。每一個GOP組都從一個關鍵幀開始。關鍵幀是一輻完整的畫面GOP中間的那些幀都是不完整的,需要由關鍵幀、前面的幀或者也包括后面的幀一起,運算后得到。對于普通視頻文件,加大GOP長度有利于減小體積;從原理上可知,GOP長度也不能過大,太大則會導致GOP后部幀的畫面失真。一般建議GOP長度在250幀以下為宜。由于PAL制式每秒有25幀(N制為30幀),如果是用于實時視頻,如電視、網(wǎng)上視頻等,GOP長度應在15至25之間。這樣可以
4、在一秒內(nèi)完成視頻快進或回退。
在現(xiàn)有的變換域Wyner-Ziv視頻編解碼框架中,對于關鍵幀采用幀內(nèi)編碼和幀內(nèi)解碼的形式,同時通過DCT變換消除幀間的空間相關性,但這種去除冗余信息的方法,并沒有利用關鍵幀間的時間相關性。在分布式視頻編碼中,幀邊信息可視作WZ幀的一個估計,通過估計可以在解碼端重構WZ幀。以為內(nèi)所生成的邊信息的精確程度決定重構幀與真實WZ幀的逼真度。時空聯(lián)合的視頻對象分割,時域采用多幀幀差,形態(tài)學處理和高斯聚類,空域采用小波變換和分水嶺變換。時域分割的模板與空域分水嶺變換的結果融合得到最終的分割結果。采用編碼模式選擇模塊在解碼前端完成編碼模式的選擇。有效避免過多冗余信息存在,
5、在解碼端,計算當前幀的低頻部分與其對應的邊信息的失真去決定采用Wyner-Ziv編碼還是幀內(nèi)編碼。解碼端判斷完成后,解碼端通過已有的反饋信道向編碼端發(fā)送一個比特位的判斷信息。本文將Wyner-Ziv編碼思想應用到關鍵幀編碼中,提出的基于頻帶劃分的關鍵幀編碼模式選擇方法的系統(tǒng)框圖如圖3所示。
圖3 關鍵幀編碼方式框圖
運動估計是視頻編碼的關鍵技術,其最基本的原理是利用相鄰幀間的時間 相關性,通過預測來減少時間冗余度。在實際編碼中,為了節(jié)省碼率,并不傳 輸每一幀的全部數(shù)據(jù),而是利用運動估計求出每一幀與其預測參考幀之間的差 值。運動估計越準確,差值的分布越趨近與零,差值塊的能量越小,經(jīng)過
6、變換、 量化和熵編碼后所產(chǎn)生的碼流的比特位率也越少。已解碼的低頻帶和已解碼前一關鍵幀的高頻帶部分進一步細化邊信息,將得到的邊信息用于高頻帶的解碼,不同的相鄰分組數(shù)目v實現(xiàn)的pts抑制ofdm峰均比的算法,可以仿真出v越大,papr的性能越好本文采用的匹配準則為均方誤差函數(shù)準則(MSE),計算公式如下:
其中,N1xN2為運動估計中塊的大小,(mvx,mvy)為運動矢量,f1(x,y)和fi-1(x+d1,y+d2)分別表示當前幀和參考幀的像素點。用matlab編的關鍵幀提取的代碼,參考了光流法的代碼。實現(xiàn)幀差法求背景的matlab程序,編寫的幀差法濾波程序,對于視頻監(jiān)控的背景建模有用,是
7、基于幀差的歐式距離,均值,方差,差異系數(shù)下的關鍵幀提取。
3 結束語
基于DCT的WZ幀編碼方案在解碼質(zhì)量上大致相當于H.263+幀內(nèi)編碼的水平。而基于小波的WZ幀編碼方案,在解碼質(zhì)量上基本可以達到H.264幀內(nèi)編碼的水平。本文編碼冗余信息上提出的這種數(shù)字視頻關鍵幀編碼技術有一定研究意義和價值。
參考文獻:
【1】王強.視頻編碼中塊匹配運動估計算法研究.山西大學,2012.
【2】樊曉平,熊哲源,陳志杰.無線多媒體傳感器網(wǎng)絡視頻編碼研究.通信學報,2011(09):137-146.
【3】宋曉麗,劉冀偉,張曉星.分布式視頻編碼的關鍵幀提取算法.智能系統(tǒng)學報,2011(06):539-543.
【4】張曉星,劉冀偉,張波.分布式視頻編碼中基于幀間相關性的自適應關鍵幀選取算法.光電子-激光,2010(10):1536-1541.