首頁 > 新聞係統 > 電子技術 > 技術 > 消費電子設計 正文 > 論壇 返回 打印

基於水印技術的MPEG-4形狀錯誤隱藏

  l 引言

  隨著網絡和多媒體技術的迅速發展,人們對應用提出了新的要求,基於內容的交互編碼標準就是適應這一要求而提出來的。MPEG-4視頻編碼標準麵向內容編碼,視頻數據以基於內容的方式進行壓縮、傳輸、編輯、檢索,與以往視頻編碼標準的主要區別在於對象的概念,輸入的視頻不再足象素,而是視頻對象,以視頻對象作為操作的單位實現傳統編碼的所有功能。視頻對象按照時空關係組成的場景,但是場景的前景對象和背景對象得以獨立編碼,如圖1有兩種基本的基於視頻對象的視頻場景的組成方法,每個場景可以由直接從視頻序列中分隔的視頻對象組成((a)分隔場景),也可以是現有的視頻對象進行組合((b)組成場景)。另外也有可能場景是由上述的兩種方法結合組成。

  MPEG-4視頻序列根據視頻對象進行解釋和處理,這些視頻對象是由運動信息,紋理信息和形狀信息定義的。MPEG-4視頻包通常是基於數據分隔模式編碼的,形狀信息和運動信息是獨立於紋理信息的,是分別傳輸的。如果紋理信息發生了丟失,利用正確解碼的形狀信息和運動信息可以進行紋理錯誤隱藏。而如果形狀和運動信息都丟失了,則丟棄整個視頻包。

分隔

  圖 1 分隔、組成場景的組成方式

  形狀信息用Alpha掩模平麵來表示,用二值定義(1表示不透明,0表示透明),或用灰度級定義(象素的透明程度介於0~255之間,1表示不透明,0表示透明)。一般都是使用二值掩模平麵,視頻對象的每個象素位置被定義為完全透明或完全不透明。二值的形狀信息對於網絡上發生的錯誤很敏感,並且會很容易發生錯誤擴散,將會影響連續幀的視頻對象解碼,現有的紋理和運動信息錯誤隱藏技術都是在正確獲得形狀信息的基礎上得到的[1],這說明形狀錯誤隱藏是很必要的。

  2形狀錯誤隱藏技術回顧

  MPEG-4編碼標準提出了例如插入同步碼,數據分割,可逆變長編碼等錯誤隱藏技術。但是這些技術對於現在的通信是不能滿足要求的。隨著錯誤隱藏技術的發展,並且形狀錯誤隱藏漸漸引起了很多專家的關注,一些關於形狀的錯誤隱藏技術也相繼的被提出。在文獻[2-7]中提出了近年來的一些形狀錯誤隱藏技術。

  提出的這些技術不外乎是根據圖像的自然屬性進行錯誤隱藏的,分空間域的錯誤隱藏和時間域的錯誤隱藏,空間域的主要是針對I幀的視頻對象形狀信息,而時間域的主要是針對P幀和B幀的視頻對象的形狀信息。時間域的錯誤隱藏技術也都是基於I幀的形狀信息正確解碼,所以空間錯誤隱藏更具有意義。文獻[2]提出的方法是利用了自適應馬爾可夫域的最大後驗估計(MAP)模型對圖像進行預先的估計,馬爾可夫是為了二值形狀信息設計的,參數是根據相鄰塊的信息自適應確定的。據試驗表明此方法能夠很精確地恢複形狀丟失的形狀信息,與中值濾波的方法比較,本文提出的方法能夠多恢複20%的丟失信息,獲得更好的客觀質量。文獻[3,4]是比自適應馬爾可夫方法更簡單的曲線插值方法,利用Hermite曲線和貝葉斯曲線的特性根據圖像的空間連續性來對邊界錯誤塊進行錯誤隱藏。文獻[5-7]則是利用時間和運動信息進行錯誤隱藏的。

  這些方法都是在解碼端對錯誤塊進行修複,並且也取得了很好的效果,但是這些方法針對的錯誤率是有一定限製的,一旦出現了很嚴重的錯誤,很大的丟包率則很難精確地恢複出正確的信息。不僅如此如果丟失的是細節部分利用曲線的特性並不能很精確地恢複信息,這些都對視頻對象的解碼很不利,並且如果是I幀的形狀信息沒有恢複,則之後的利用時間域錯誤隱藏技術也得不到理想的效果。

  3本文的算法

  針對此問題本文提出了一個新穎的基於數據隱藏的方法。此方法是收到數字的啟發。數字水印是信息隱藏技術的一種,廣泛地用於圖像、視頻、音頻等版權問題,具有透明性、魯棒性和可證明性,因此數字水印技術也越來越多地運用到內容認證等其他領域。本文就是利用數字水印的特性與形狀的錯誤隱藏技術進行結合,這也是本文的主要創新點。本文主要是針對分隔場景視頻的I幀的形狀錯誤隱藏,提出的主要思想是根據的形狀信息產生待嵌入的水印信息,而人們關注較少的背景對象則作為嵌入的宿主。

  數字水印按照嵌入的過程分為時域/空域水印和頻域/變換域水印,一般情況下頻域水印比時域水印有更強的魯棒性與透明性。本文則分別利用這兩種不同的實現方法來進行。下麵對這兩種方法分別進行說明。

  3.1 利用頻域水印嵌入方法

  本文提出的頻域的方法是在DCT變換域中的,具體的實施方法如下:

  (1)首先將二值掩模圖像進行采樣,縮小到原圖像的1/4。根據數字水印技術原理,嵌入的信息量越大則透明性越差。這樣做的目的是為了不會太大的影響宿主圖像的客觀質量。

  (2)其次是選擇宿主圖像,本文是選擇背景對象作為宿主,一般視頻的背景對象可以轉換成RGB三個分量,據研究綠色分量對有損壓縮具有很強的頑健性[8]。為了完整地嵌入二值掩模還要對分隔場景的背景對象進行插值,就是利用最簡單的水平插值的方法,利用每一行的與零象素相鄰的兩個非零值的平均值對零值象素位進行填充。填充好的背景圖像作為最後的宿主圖像。

  (3)在上兩步的基礎上本文選擇將水印信息嵌入到宿主圖像的頻域信息中,將背景圖像分隔成2×2的圖像塊,對每個塊進行DCT變換,將水印嵌入到DCT係數的中頻係數中,直接用水印的值代替所選擇的中頻係數。

  (4)最後就是水印的提取,二值掩模圖像的恢複了。提取則是嵌入的逆過程,直接對接收到的背景圖像分割成2×2的圖像塊,對每個塊進行DCT變換,直接提取所選擇的中頻係數即可,對提取出來的二值圖像放大到原來的4倍,這樣即得到了恢複的二值掩模圖像。

  3.2 利用空域水印嵌入方法

  本文采用的水印算法是在X.Kang等人提出的算法基礎上提出的[9],首先將作為水印的形狀信息則是原掩模二值圖像,不做任何改變。方法如下:

  (1)得到的欲嵌入水印圖像應用式(1)進行嵌入。
算法

  式中rood為模運算,[α/4,3α/4]是一對最好的參數選擇,他保證了0和1都 在具有相等的最大判決範圍,使得嵌人水印之後f′與/的差值在[一0.5α,0.5α]之間。當w(m,n)=1時,f(m,n)mod α=3α/4;當ω(m,n)=0時,f(m/n)modα=α/4。因此當提取水印時f*滿足f*(m,n)mod α>α/2,那麼提取的水印值為ω*(m,n)=l,否則為0。

  (2)本文所用的水印嵌入算法是屬於盲水印檢測,提取過程是不需要原始載體圖像的參與。按照公式(2)提取嵌入的水印數據ω*(m,n)。

  提取的水印數據ω*(m,n)即為恢複的掩模二值圖像。此水印嵌入法將對背景的圖像質量會有一定程度的損失,損失程度與嵌入水印時所選的參數α有關。但是水印的提取也與此參數有關。為r能夠正確地恢複出水印值,而,f*與/之問的絕對誤差(由圖像失真引起)必須小於α/4,這裏的參數α的適當選擇能夠很好地折衷水印的透明性與魯棒性之間的矛盾。α大對圖像的損失大,而小不利於水印的魯棒。根據仿真實驗測試,這裏a的取值為20。據實驗比較,α參數為20時對圖像質量的損失還是町以容忍的。
算法
算法

  4仿真結果

  對本文提出的算法運用Matlab仿真工具,按照上述的方法對經典序列"Foreman"中的第50幀圖像進行實驗。原視頻幀如圖2(a)所示,圖2(b)為此幀圖像編碼的形狀信息,圖2(c)為傳輸中由於出現錯誤,接收端得到的錯誤形狀信息。

  在第二部分已經闡述了,現有的方法很可能對這種情況不能得到很好的解決。若發生很嚴重的傳輸錯誤或很高的丟包率則形狀信息會受到嚴重的破壞,影響視頻對象的正確解碼。利用本文提出的兩個算法,從接收到的背景綠色分量中提取作為水印的形狀信息,本方法的前提是背景的正確傳輸。圖3(a)和圖3(b)分別是用頻域法嵌入後在解碼端正確解碼的視頻背景對象的效果,以及正確提取恢複的二值掩模圖,圖3(c)和圖3(d)是用空域法嵌入的效果圖和提取恢複的二值掩模圖。

仿真結果

  利用相似性量度來對恢複的掩模圖和原掩模圖進行比較,來看一下本文的效果如何。相似性量度式為式(3),實驗結果表明頻域法和空域法恢複的掩模圖與原圖的相似程度都非常接近1,空域法的效果要比頻域法的效果好一些。空域法的背景圖像的相似性也比頻域法的略好些,頻域法嵌入後背景圖像信噪比為31.14,空域法嵌入後背景圖像信噪比為34.88。比較來說,本文提出的空域法要比頻域法的效果更好一些。人們對視頻畫麵的要求往往比靜態圖片的要求低,並且在基於對象編碼中人們對視頻背景對象的關注也相對少,所以視頻背景對象的視覺損耗也是可以容忍的。

仿真結果

  5 結 語

  本文提出的算法是與數字水印結合的新穎的形狀信息錯誤隱藏方法,如果接收端的形狀信息損失很嚴重,尤其是I-VOP的形狀掩模,若其損壞則會導致隨後的VOP預測破壞嚴重。根據本文提出的兩個基於水印的算法則可以獲得和原掩模相似度很高的掩模,進而能夠得到沒有近似、沒有損失的對象。但是該算法還是存在一些不足:該方法是基於背景區域沒有損失或有一定的丟包率的前提下進行的,並且對背景區域的圖像有一定的質量損失。爭取找到更魯棒的嵌入方法和更能忍受的嵌入透明度,這是下一步需要進行的研究工作。



http://www.autooo.net/autooo/Electronic/Tech/Design/2007-10-27/38920.html