H.264 和 MPEG-4 基礎

H.264 和 MPEG-4 的關係:

  • H.264 /AVC ( Advanced Video Coding )標準,是 MPEG-4 的第 10 部分。
  • MPEG-4的初衷是將DVD質量的圖像碼流從每秒6兆降低到1.5兆,將高清電視的碼流從每秒幾十兆降低到6~8兆。要實現這樣的編碼壓縮水平,就要用到一種叫AVC(Advanced Video CODEC)的技術。國際電聯(ITU)將這項技術命名爲H.264標準,MPEG 把這項技術放到MPEG-4標準裏的第10章(Part 10)。這就是MPEG-4和H.264的關係。
  • H.264/AVC是由ISO/IEC與ITU-T組成的聯合視頻組(JVT)制定的新一代視頻壓縮編碼標準,於2003年5月完成制訂。相對於先前的標準,H.264/AVC無論在壓縮效率、還是在網絡適應性方面都有明顯的提高,因此,業界普遍預測其將在未來的視頻應用中替代現有的視頻壓縮標準。
    但是,H.264/AVC標準由於對視頻源的限制,僅支持娛樂級視頻質量。爲了進一步擴大其應用範圍,使其適應高保真視頻壓縮的應用,JVT於2004年7月對H.264/AVC做了重要的補充擴展,稱爲FRExt(Fidelity Range Extensions)。
    H.264/AVC標準第一版支持的源圖像爲每象素8b,且採樣方式僅限於4∶2∶0;而新近擴展的FRExt部分則擴大了標準的應用範圍,如專業級的視頻應用、高分辨率/高保真的視頻壓縮等。FRExt對H.264/AVC的改善主要在:(1)進一步引入一些先進的編碼工具,提高了壓縮效率;(2)視頻源的每個樣值均可超過8b,最高可達12b;(3)增加了4∶2∶2與4∶4∶4的採樣格式;(4)更高的比特率,更高的圖像分辨率;(5)可達到圖像高保真的要求,支持無損壓縮;(6)支持RGB格式的壓縮,同時避免了色度空間轉換的舍入誤差。
  • MPEG-4 Visual (MPEG-4 Part 2)與H.264 (MPEG-4 Part 10)均爲新一代多媒體通訊壓縮與解壓縮國際標準。其中MPEG-4目前作爲消費性電子核心技術正處於市場導入期。如目前利潤最高的高端Smart Phone多帶有動態影音攝影的功能,其壓縮標準主流即爲MPEG-4 Visual。此外3G(第三代行動電話)手機所支持的影音功能亦多包含MPEG-4 Visual編解碼功能。多媒體播放器的頂端產品(注:iPod屬中階產品)目前非PMP (Portable Media Player)莫屬,單價高達2K~6K¥的系統均需包含MPEG-4 Visual的播放功能。下一代的PMP將進一步結合數字相機與攝影機的功能達到全功能實時多媒體攝、錄、放與傳輸的需求。當然MPEG-4 Visual還是扮演核心與關鍵技術角色。H.264整合ISO/IEC與ITU-T兩大標準陣營,制定MPEG-4 Visual的下一代影音壓縮標準。目的在進一步提高自然影像的壓縮率,且在通訊環境變化時亦能確保一定的影音品質,是下一代數字電視的編解碼標準。H.264爲達成上述目的,採用多項創新技術(亦使H.264與MPEG-1/-2/-4 Visual不兼容),故軟硬件設計上與MPEG-4 Visual炯異。而重要的是H.264將應用在3G行動通訊之上。故H.264爲下一代3C產品的殺手級核心技術。
  • 通常所說H.264和MPEG4的比較是指H.264和MPEG-4 Part 2 Advanced Simple Profile (ASP)的比較而言

分辨率和實時性術語:

  • 完全實時:PAL=25F/S、NTSC=30F/S
  • 基本實時(準實時):PAL:8~15F/S  NTSC:10~17F/S
  • 非實時:PAL<8F/S  NTSC<10F/S
  •  
  • CIF (352 x 240  NTSC, 352 x 288  PAL)
  • QCIF=CIF*1/4=176*120 NTSC,176*144 PAL
  • FD1(D1)=4*CIF=704*480 NTSC,704*576 PAL
  • HD1(Half-D1)=D1*1/2=704*240 NTSC,704*288 PAL
  • D1爲480i格式,和NTSC模擬電視清晰度相同
  • D2爲480P格式,和逐行掃描DVD規格相同,DVD的分辨率爲480P,也就是720x480(NTSC)720X576(PAL)
  • D3爲1080i格式,分辨率爲1920×1080 i/60Hz
  • D4爲 720p格式,分辨率爲1280×720 p/60Hz
  • D5爲1080p格式,分辨率爲1920×1080逐行掃描,專業格式

專利費問題:

  • 在專利許可政策上,H.264 也吸取了MPEG2 及MPEG4 part2 的經驗和教訓,推出了較之前標準更低和操作性更強的許可政策。例如,AVC 許可政策每臺產品0.20 美元的收費,與MPEG-2 每個終端收費4-6美元(2002 年前)和2.5 美元(2002 年之後)相比,降價幅度超過一個數量級。而其相比於MPEG4 part2,除了取消了按編解碼時間收費(2 美分/小時)以外,也降低了對於內容的收費,從而受到了更多機構、企業和運營商的歡迎。

 基礎知識:

  • H.264 標準壓縮系統由視頻編碼層( VCL )和網絡提取層( Network Abstraction Layer , NAL )兩部分組成。 VCL 中包括 VCL 編碼器與 VCL 解碼器,主要功能是視頻數據壓縮編碼和解碼,它包括運動補償、變換編碼、熵編碼等壓縮單元。 NAL 則用於爲 VCL 提供一個與網絡無關的統一接口,它負責對視頻數據進行封裝打包後使其在網絡中傳送,它採用統一的數據格式,包括單個字節的包頭信息、多個字節的視頻數據與組幀、邏輯信道信令、定時信息、序列結束信號等。包頭中包含存儲標誌和類型標誌。存儲標誌用於指示當前數據不屬於被參考的幀。類型標誌用於指示圖像數據的類型。VCL 可以傳輸按當前的網絡情況調整的編碼參數。
  • H.264 和 H.261 、 H.263 一樣,也是採用 DCT 變換編碼加 DPCM 的差分編碼,即混合編碼結構。同時,
  • H.264 在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實際應用。
  • H.264 沒有繁瑣的選項,而是力求簡潔的 “ 迴歸基本 ” ,它具有比 H.263++ 更好的壓縮性能,又具有適應多種信道的能力。
  • H.264 的應用目標廣泛,可滿足各種不同速率、不同場合的視頻應用,具有較好的抗誤碼和抗丟包的處理能力。
  • H.264 的基本系統無需使用版權,具有開放的性質,能很好地適應 IP 和無線網絡的使用,這對目前因特網傳輸多媒體信息、移動網中傳輸寬帶信息等都具有重要意義。
  • 新的快速運動估值算法 UMHexagonS (中國專利)是一種運算量相對於 H.264 中原有的快速全搜索算法可節約 90 %以上的新算法,全名叫 “ 非對稱十字型多層次六邊形格點搜索算法 ” ( Unsymmetrical-Cross Muti-Hexagon Search ) ” ,這是一種整像素運動估值算法。由於它在高碼率大運動圖像序列編碼時,在保持較好率失真性能的條件下,運算量十分低,已被 H.264 標準正式採納。

參考資料:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章