H.264 標準詳解

 JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標準化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標準,以實現視頻的高壓縮比、高圖像質量、良好的網絡適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標準稱爲H.264標準,該標準也被ISO接納,稱爲AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。

  H.264標準可分爲三檔:

  基本檔次(其簡單版本,應用面廣);

  主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);

  擴展檔次(可用於各種網絡的視頻流傳輸)。

  H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網絡傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網絡中的分組傳輸,支持網絡中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網絡資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網絡中的視頻傳輸,網絡親和性好。

  一、H.264視頻壓縮系統

  H.264標準壓縮系統由視頻編碼層(VCL)和網絡提取層(Network Abstraction Layer,NAL)兩部分組成。VCL中包括VCL編碼器與VCL解碼器,主要功能是視頻數據壓縮編碼和解碼,它包括運動補償、變換編碼、熵編碼等壓縮單元。NAL則用於爲VCL提供一個與網絡無關的統一接口,它負責對視頻數據進行封裝打包後使其在網絡中傳送,它採用統一的數據格式,包括單個字節的包頭信息、多個字節的視頻數據與組幀、邏輯信道信令、定時信息、序列結束信號等。包頭中包含存儲標誌和類型標誌。存儲標誌用於指示當前數據不屬於被參考的幀。類型標誌用於指示圖像數據的類型。
VCL可以傳輸按當前的網絡情況調整的編碼參數。

  二、H.264的特點

  H.264和H.261、H.263一樣,也是採用DCT變換編碼加DPCM的差分編碼,即混合編碼結構。同時,H.264在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實際應用。
H.264沒有繁瑣的選項,而是力求簡潔的“迴歸基本”,它具有比H.263++更好的壓縮性能,又具有適應多種信道的能力。

  H.264的應用目標廣泛,可滿足各種不同速率、不同場合的視頻應用,具有較好的抗誤碼和抗丟包的處理能力。

  H.264的基本系統無需使用版權,具有開放的性質,能很好地適應IP和無線網絡的使用,這對目前因特網傳輸多媒體信息、移動網中傳輸寬帶信息等都具有重要意義。

  儘管H.264編碼基本結構與H.261、H.263是類似的,但它在很多環節做了改進,現列舉如下。

  1.多種更好的運動估計

  高精度估計

  在H.263中採用了半像素估計,在H.264中則進一步採用1/4像素甚至1/8像素的運動估計。即真正的運動矢量的位移可能是以1/4甚至1/8像素爲基本單位的。顯然,運動矢量位移的精度越高,則幀間剩餘誤差越小,傳輸碼率越低,即壓縮比越高。

  在H.264中採用了6階FIR濾波器的內插獲得1/2像素位置的值。當1/2像素值獲得後, 1/4像素值可通過線性內插獲得,

  對於4:1:1的視頻格式,亮度信號的1/4 像素精度對應於色度部分的1/8像素的運動矢量,因此需要對色度信號進行1/8像素的內插運算。

  理論上,如果將運動補償的精度增加一倍(例如從整像素精度提高到1/2像素精度),可有0.5bit/Sample的編碼增益,但實際驗證發現在運動矢量精度超過1/8像素後,系統基本上就沒有明顯增益了,因此,在H.264中,只採用了1/4像素精度的運動矢量模式,而不是採用1/8像素的精度。

  多宏塊劃分模式估計

  在H.264的預測模式中,一個宏塊(MB)可劃分成7種不同模式的尺寸,這種多模式的靈活、細微的宏塊劃分,更切合圖像中的實際運動物體的形狀,於是,在每個宏塊中可包含有1、2、4、8或16個運動矢量。

  多參數幀估計

  在H.264中,可採用多個參數幀的運動估計,即在編碼器的緩存中存有多個剛剛編碼好的參數幀,編碼器從其中選擇一個給出更好的編碼效果的作爲參數幀,並指出是哪個幀被用於預測,這樣就可獲得比只用上一個剛編碼好的幀作爲預測幀的更好的編碼效果。

  2.小尺寸4?4的整數變換

  視頻壓縮編碼中以往的常用單位爲8?8塊。在H.264中卻採用小尺寸的4?4塊,由於變換塊的尺寸變小了,運動物體的劃分就更爲精確。這種情況下,圖像變換過程中的計算量小了,而且在運動物體邊緣的銜接誤差也大爲減少。

  當圖像中有較大面積的平滑區域時,爲了不產生因小尺寸變換帶來的塊間灰度差異,H.264可對幀內宏塊亮度數據的16個4?4塊的DCT係數進行第二次4?4塊的變換,對色度數據的4個4?4塊的DC係數(每個小塊一個,共4個DC係數)進行2?2塊的變換。

  H.263不僅使圖像變換塊尺寸變小,而且這個變換是整數操作,而不是實數運算,即編碼器和解碼器的變換和反變換的精度相同,沒有“反變換誤差”。

  3.更精確的幀內預測

  在H.264中,每個4?4塊中的每個像素都可用17個最接近先前已編碼的像素的不同加權和來進行幀內預測。

  4.統一的VLC

  H.264中關於熵編碼有兩種方法。

  統一的VLC(即UVLC:Universal VLC)。UVLC使用一個相同的碼錶進行編碼,而解碼器很容易識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。

  內容自適應二進制算術編碼(CABAC:Context Adaptive Binary Arithmetic Coding)。其編碼性能比UVLC稍好,但複雜度較高。

  三、性能優勢

  H.264與MPEG-4、H.263++編碼性能對比採用了以下6個測試速率:32kbit/s、10F/s和QCIF;64kbit/s、15F/s和QCIF;128kbit/s、15F/s和CIF;256kbit/s、15F/s和QCIF;512kbit/s、30F/s和CIF;1024kbit/s、30F/s和CIF。測試結果標明,H.264具有比MPEG和H.263++更優秀的PSNR性能。
H.264的 PSNR比MPEG-4平均要高2dB,比H.263++平均要高3dB。

  四、新的快速運動估值算法

  新的快速運動估值算法UMHexagonS(中國專利)是一種運算量相對於H.264中原有的快速全搜索算法可節約90%以上的新算法,全名叫“非對稱十字型多層次六邊形格點搜索算法”(Unsymmetrical-Cross Muti-Hexagon Search)”,這是一種整像素運動估值算法。由於它在高碼率大運動圖像序列編碼時,在保持較好率失真性能的條件下,運算量十分低,已被H.264標準正式採納。

  ITU和 ISO合作發展的 H.264(MPEG-4 Part 10)有可能被廣播、通信和存儲媒體(CD DVD)接受成爲統一的標準,最有可能成爲寬帶交互新媒體的標準。我國的信源編碼標準尚未制定,密切關注H.264的發展,制定我國的信源編碼標準的工作正在加緊進行。

  H264標準使運動圖像壓縮技術上升到了一個更高的階段,在較低帶寬上提供高質量的圖像傳輸是H.264的應用亮點。H.264的推廣應用對視頻終端、網守、網關、MCU等系統的要求較高,將有力地推動視頻會議軟、硬件設備在各個方面的不斷完善。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章