H.264與MPEG4兩種壓縮算法的比較

JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標準化組織的有關視頻編碼的專家聯合組成。 JVT的工作目標是制定一個新的視頻編碼標準,以實現視頻的高壓縮比、高圖像質量、良好的網絡適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標準稱爲H.264標準,該標準也被ISO接納,稱爲AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。

H.264標準可分爲三檔:

基本檔次(其簡單版本,應用面廣);

主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);

擴展檔次(可用於各種網絡的視頻流傳輸)。

H.264 不僅比H.263和MPEG-4節約了50%的碼率,而且對網絡傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網絡中的分組傳輸,支持網絡中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網絡資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網絡中的視頻傳輸,網絡親和性好。

一、H.264視頻壓縮系統

H.264標準壓縮系統由視頻編碼層(VCL)和網絡提取層(Network Abstraction Layer,NAL)兩部分組成。VCL中包括VCL編碼器與VCL解碼器,主要功能是視頻數據壓縮編碼和解碼,它包括運動補償、變換編碼、熵編碼等壓縮單元。NAL則用於爲VCL提供一個與網絡無關的統一接口,它負責對視頻數據進行封裝打包後使其在網絡中傳送,它採用統一的數據格式,包括單個字節的包頭信息、多個字節的視頻數據與組幀、邏輯信道信令、定時信息、序列結束信號等。包頭中包含存儲標誌和類型標誌。存儲標誌用於指示當前數據不屬於被參考的幀。類型標誌用於指示圖像數據的類型。

VCL可以傳輸按當前的網絡情況調整的編碼參數。

二、H.2**特點

H.264和H.261、H.263一樣,也是採用DCT變換編碼加DPCM的差分編碼,即混合編碼結構。同時,H.264在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實際應用。

H.264沒有繁瑣的選項,而是力求簡潔的“迴歸基本”,它具有比H.263++更好的壓縮性能,又具有適應多種信道的能力。

H.2**應用目標廣泛,可滿足各種不同速率、不同場合的視頻應用,具有較好的抗誤碼和抗丟包的處理能力。

H.2**基本系統無需使用版權,具有開放的性質,能很好地適應IP和無線網絡的使用,這對目前因特網傳輸多媒體信息、移動網中傳輸寬帶信息等都具有重要意義。

儘管H.264編碼基本結構與H.261、H.263是類似的,但它在很多環節做了改進,現列舉如下。

1.多種更好的運動估計

高精度估計

在H.263中採用了半像素估計,在H.264中則進一步採用1/4像素甚至1/8像素的運動估計。即真正的運動矢量的位移可能是以1/4甚至1/8像素爲基本單位的。顯然,運動矢量位移的精度越高,則幀間剩餘誤差越小,傳輸碼率越低,即壓縮比越高。

在H.264中採用了6階FIR濾波器的內插獲得1/2像素位置的值。當1/2像素值獲得後, 1/4像素值可通過線性內插獲得,

對於4:1:1的視頻格式,亮度信號的1/4 像素精度對應於色度部分的1/8像素的運動矢量,因此需要對色度信號進行1/8像素的內插運算。

理論上,如果將運動補償的精度增加一倍(例如從整像素精度提高到1/2像素精度),可有0.5bit/Sample的編碼增益,但實際驗證發現在運動矢量精度超過1/8像素後,系統基本上就沒有明顯增益了,因此,在H.264中,只採用了1/4像素精度的運動矢量模式,而不是採用1/8像素的精度。

多宏塊劃分模式估計

在H.2**預測模式中,一個宏塊(MB)可劃分成7種不同模式的尺寸,這種多模式的靈活、細微的宏塊劃分,更切合圖像中的實際運動物體的形狀,於是,在每個宏塊中可包含有1、2、4、8或16個運動矢量。

多參數幀估計

在H.264中,可採用多個參數幀的運動估計,即在編碼器的緩存中存有多個剛剛編碼好的參數幀,編碼器從其中選擇一個給出更好的編碼效果的作爲參數幀,並指出是哪個幀被用於預測,這樣就可獲得比只用上一個剛編碼好的幀作爲預測幀的更好的編碼效果。

2.小尺寸4?4的整數變換

視頻壓縮編碼中以往的常用單位爲8?8塊。在H.264中卻採用小尺寸的4?4塊,由於變換塊的尺寸變小了,運動物體的劃分就更爲精確。這種情況下,圖像變換過程中的計算量小了,而且在運動物體邊緣的銜接誤差也大爲減少。

當圖像中有較大面積的平滑區域時,爲了不產生因小尺寸變換帶來的塊間灰度差異,H.264可對幀內宏塊亮度數據的16個4?4塊的DCT係數進行第二次4?4塊的變換,對色度數據的4個4?4塊的DC係數(每個小塊一個,共4個DC係數)進行2?2塊的變換。

H.263不僅使圖像變換塊尺寸變小,而且這個變換是整數操作,而不是實數運算,即編碼器和解碼器的變換和反變換的精度相同,沒有“反變換誤差”。

3.更精確的幀內預測

在H.264中,每個4?4塊中的每個像素都可用17個最接近先前已編碼的像素的不同加權和來進行幀內預測。

4.統一的VLC

H.264中關於熵編碼有兩種方法。

統一的VLC(即UVLC:Universal VLC)。UVLC使用一個相同的碼錶進行編碼,而解碼器很容易識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。

內容自適應二進制算術編碼(CABAC:Context Adaptive Binary Arithmetic Coding)。其編碼性能比UVLC稍好,但複雜度較高。

三、性能優勢

H.264 與MPEG-4、H.263++編碼性能對比採用了以下6個測試速率:32kbit/s、10F/s和QCIF;64kbit/s、15F/s和 QCIF;128kbit/s、15F/s和CIF;256kbit/s、15F/s和QCIF;512kbit/s、30F/s和CIF; 1024kbit/s、30F/s和CIF。測試結果標明,H.264具有比MPEG和H.263++更優秀的PSNR性能。

H.2** PSNR比MPEG-4平均要高2dB,比H.263++平均要高3dB。

四、新的快速運動估值算法

視頻編碼研究與MPEG標準演進

人類獲取的信息中70%來自於視覺,視頻信息在多媒體信息中佔有重要地位;同時視頻數據冗餘度最大,經壓縮處理後的視頻質量高低是決定多媒體服務質量的關鍵因素。因此數字視頻技術是多媒體應用的核心技術,對視頻編碼的研究已成爲信息技術領域的熱門話題。

視頻編碼的研究課題主要有數據壓縮比、壓縮/解壓速度及快速實現算法三方面內容。以壓縮/解壓後數據與壓縮前原始數據是否完全一致作爲衡量標準,可將數據壓縮劃分爲無失真壓縮(即可逆壓縮)和有失真壓縮(即不可逆壓縮)兩類。

傳統壓縮編碼建立在仙農信息論基礎之上的,以經典集合論爲工具,用概率統計模型來描述信源,其壓縮思想基於數據統計,因此只能去除數據冗餘,屬於低層壓縮編碼的範疇。

伴隨着視頻編碼相關學科及新興學科的迅速發展,新一代數據壓縮技術不斷誕生並日益成熟,其編碼思想由基於像素和像素塊轉變爲基於內容(content-based)。它突破了仙農信息論框架的束縛,充分考慮了人眼視覺特性及信源特性,通過去除內容冗餘來實現數據壓縮,可分爲基於對象(object-based)和基於語義(semantics-based)兩種,前者屬於中層壓縮編碼,後者屬於高層壓縮編碼。

與此同時,視頻編碼相關標準的制定也日臻完善。視頻編碼標準主要由ITU-T和ISO/IEC開發。ITU-T發佈的視頻標準有H.261、 H.262、 H.263、 H.263+、H.263++,ISO/IEC公佈的MPEG系列標準有MPEG-1、MPEG-2 、MPEG-4 和MPEG-7,並且計劃公佈MPEG-21。

MPEG即Moving Picture Expert Group(運動圖像專家組),它是專門從事制定多媒體視音頻壓縮編碼標準的國際組織。MPEG系列標準已成爲國際上影響最大的多媒體技術標準,其中 MPEG-1和MPEG-2是採用以仙農信息論爲基礎的預測編碼、變換編碼、熵編碼及運動補償等第一代數據壓縮編碼技術;MPEG-4(ISO/IEC 14496)則是基於第二代壓縮編碼技術制定的國際標準,它以視聽媒體對象爲基本單元,採用基於內容的壓縮編碼,以實現數字視音頻、圖形合成應用及交互式多媒體的集成。MPEG系列標準對VCD、DVD等視聽消費電子及數字電視和高清晰度電視(DTV&&HDTV)、多媒體通信等信息產業的發展產生了巨大而深遠的影響。

MPEG-4視頻編碼核心思想及關鍵技術

核心思想

在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是採用第一代壓縮編碼技術,着眼於圖像信號的統計特性來設計編碼器,屬於波形編碼的範疇。第一代壓縮編碼方案把視頻序列按時間先後分爲一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:

· 將圖像固定地分成相同大小的塊,在高壓縮比的情況下會出現嚴重的塊效應,即馬賽克效應;

· 不能對圖像內容進行訪問、編輯和回放等*作;

· 未充分利用人類視覺系統(HVS,Human Visual System)的特性。

MPEG-4則代表了基於模型/對象的第二代壓縮編碼技術,它充分利用了人眼視覺特性,抓住了圖像信息傳輸的本質,從輪廓、紋理思路出發,支持基於視覺內容的交互功能,這適應了多媒體信息的應用由播放型轉向基於內容的訪問、檢索及*作的發展趨勢。

AV對象(AVO,Audio Visual Object)是MPEG-4爲支持基於內容編碼而提出的重要概念。對象是指在一個場景中能夠訪問和*縱的實體,對象的劃分可根據其獨特的紋理、運動、形狀、模型和高層語義爲依據。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個個視聽場景(AV場景),這些不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內容的表示單元,其基本單位是原始AV對象,它可以是自然的或合成的聲音、圖像。原始AV對象具有高效編碼、高效存儲與傳輸以及可交互*作的特性,它又可進一步組成複合AV對象。因此MPEG-4標準的基本內容就是對AV對象進行高效編碼、組織、存儲與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術。

MPEG-4不僅可提供高壓縮率,同時也可實現更好的多媒體內容互動性及全方位的存取性,它採用開放的編碼系統,可隨時加入新的編碼算法模塊,同時也可根據不同應用需求現場配置解碼器,以支持多種多媒體應用。

MPEG-4 採用了新一代視頻編碼技術,它在視頻編碼發展史上第一次把編碼對象從圖像幀拓展到具有實際意義的任意形狀視頻對象,從而實現了從基於像素的傳統編碼向基於對象和內容的現代編碼的轉變,因而引領着新一代智能圖像編碼的發展潮流。

關鍵技術

MPEG-4除採用第一代視頻編碼的核心技術,如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的有創見性的關鍵技術,並在第一代視頻編碼技術基礎上進行了卓有成效的完善和改進。下面重點介紹其中的一些關鍵技術。

A. 視頻對象提取技術

MPEG-4實現基於內容交互的首要任務就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然後針對不同對象採用相應編碼方法,以實現高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關鍵技術,也是新一代視頻編碼的研究熱點和難點。

視頻對象分割涉及對視頻內容的分析和理解,這與人工智能、圖像理解、模式識別和神經網絡等學科有密切聯繫。目前人工智能的發展還不夠完善,計算機還不具有觀察、識別、理解圖像的能力;同時關於計算機視覺的研究也表明要實現正確的圖像分割需要在更高層次上對視頻內容進行理解。因此,儘管MPEG-4 框架已經制定,但至今仍沒有通用的有效方法去根本解決視頻對象分割問題,視頻對象分割被認爲是一個具有挑戰性的難題,基於語義的分割則更加困難。

目前進行視頻對象分割的一般步驟是:先對原始視頻/圖像數據進行簡化以利於分割,這可通過低通濾波、中值濾波、形態濾波來完成;然後對視頻/圖像數據進行特徵提取,可以是顏色、紋理、運動、幀差、位移幀差乃至語義等特徵;再基於某種均勻性標準來確定分割決策,根據所提取特徵將視頻數據歸類;最後是進行相關後處理,以實現濾除噪聲及準確提取邊界。

在視頻分割中基於數學形態理論的分水嶺(watershed)算法被廣泛使用,它又稱水線算法,其基本過程是連續腐蝕二值圖像,由圖像簡化、標記提取、決策、後處理四個階段構成。分水嶺算法具有運算簡單、性能優良,能夠較好提取運動對象輪廓、準確得到運動物體邊緣的優點。但分割時需要梯度信息,對噪聲較敏感,且未利用幀間信息,通常會產生圖像過度分割。

B. VOP視頻編碼技術

視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的採樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO採用不同的編碼策略,即對前景VO的壓縮編碼儘可能保留細節和平滑;對背景VO則採用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基於對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產生的方塊效應,而且使用戶可與場景交互,從而既提高了壓縮比,又實現了基於內容的交互,爲視頻編碼提供了廣闊的發展空間。

MPEG-4支持任意形狀圖像與視頻的編解碼。對於任意形狀視頻對象。對於極低比特率實時應用,如可視電話、會議電視,MPEG-4則採用VLBV(Very Low Bit-rate Video,極低比特率視頻)核進行編碼。

傳統的矩形圖在MPEG-4中被看作是VO的一種特例,這正體現了傳統編碼與基於內容編碼在MPEG-4中的統一。VO概念的引入,更加符合人腦對視覺信息的處理方式,並使視頻信號的處理方式從數字化進展到智能化,從而提高了視頻信號的交互性和靈活性,使得更廣泛的視頻應用及更多的內容交互成爲可能。因此 VOP視頻編碼技術被譽爲視頻信號處理技術從數字化進入智能化的初步探索。

C. 視頻編碼可分級性技術

隨着因特網業務的巨大增長,在速率起伏很大的IP(Internet Protocol)網絡及具有不同傳輸特性的異構網絡上進行視頻傳輸的要求和應用越來越多。在這種背景下,視頻分級編碼的重要性日益突出,其應用非常廣泛,且具有很高的理論研究及實際應用價值,因此受到人們的極大關注。

視頻編碼的可分級性(scalability)是指碼率的可調整性,即視頻數據只壓縮一次,卻能以多個幀率、空間分辨率或視頻質量進行解碼,從而可支持多種類型用戶的各種不同應用要求。

MPEG-4通過視頻對象層(VOL,Video Object Layer)數據結構來實現分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(Spatial Scalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱爲基本層,高層稱爲增強層。基本層提供了視頻序列的基本信息,增強層提供了視頻序列更高的分辨率和細節。

在隨後增補的視頻流應用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable,漸進精細可伸縮性)視頻編碼算法。

FGS編碼實現簡單,可在編碼速率、顯示分辨率、內容、解碼複雜度等方面提供靈活的自適應和可擴展性,且具有很強的帶寬自適應能力和抗誤碼性能。但還存在編碼效率低於非可擴展編碼及接收端視頻質量非最優兩個不足。

PFGS則是爲改善FGS編碼效率而提出的視頻編碼算法,其基本思想是在增強層圖像編碼時使用前一幀重建的某個增強層圖像爲參考進行運動補償,以使運動補償更加有效,從而提高編碼效率。

D. 運動估計與運動補償技術

MPEG-4採用I-VOP、P-VOP、B-VOP三種幀格式來表徵不同的運動補償類型。它採用了H.263中的半像素搜索(half pixel searching)技術和重疊運動補償(overlapped motion compensation)技術,同時又引入重複填充(repetitive padding)技術和修改的塊(多邊形)匹配(modified block (polygon)matching)技術以支持任意形狀的VOP區域。

此外,爲提高運動估計算法精度,MPEG-4採用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進的PMVFAST(Predictive MVFAST)方法用於運動估計。對於全局運動估計,則採用了基於特徵的快速頑健的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。

新的快速運動估值算法UMHexagonS(中國專利)是一種運算量相對於H.264中原有的快速全搜索算法可節約 90%以上的新算法,全名叫“非對稱十字型多層次六邊形格點搜索算法”(Unsymmetrical-Cross Muti-Hexagon Search)”,這是一種整像素運動估值算法。由於它在高碼率大運動圖像序列編碼時,在保持較好率失真性能的條件下,運算量十分低,已被H.264標準正式採納。

ITU和 ISO合作發展的 H.264(MPEG-4 Part 10)有可能被廣播、通信和存儲媒體(CD DVD)接受成爲統一的標準,最有可能成爲寬帶交互新媒體的標準。我國的信源編碼標準尚未制定,密切關注H.2**發展,制定我國的信源編碼標準的工作正在加緊進行。

H264標準使運動圖像壓縮技術上升到了一個更高的階段,在較低帶寬上提供高質量的圖像傳輸是H.2**應用亮點。H.2**推廣應用對視頻終端、網守、網關、MCU等系統的要求較高,將有力地推動視頻會議軟、硬件設備在各個方面的不斷完善。

MPEG4視頻壓縮編碼技術詳解

MPEG 全稱是Moving Pictures Experts Group,它是“動態圖象專家組”的英文縮寫,該專家組成立於1988年,致力於運動圖像及其伴音的壓縮編碼標準化工作,原先他們打算開發MPEG1、 MPEG2、MPEG3和MPEG4四個版本,以適用於不同帶寬和數字影像質量的要求。

目前,MPEG1技術被廣泛的應用於VCD,而MPEG2 標準則用於廣播電視和DVD等。MPEG3最初是爲HDTV開發的編碼和壓縮標準,但由於MPEG2的出色性能表現, MPEG3只能是死於襁褓了。而我們今天要談論的主角——MPEG4於1999年初正式成爲國際標準。它是一個適用於低傳輸速率應用的方案。與MPEG1 和MPEG2相比,MPEG4更加註重多媒體系統的交互性和靈活性。下面就讓我們一起進入多彩的MPEG4世界。

MPEG4的技術特點

MPEG1、MPEG2技術當初制定時,它們定位的標準均爲高層媒體表示與結構,但隨着計算機軟件及網絡技術的快速發展,MPEG1.MPEG2技術的弊端就顯示出來了:交互性及靈活性較低,壓縮的多媒體文件體積過於龐大,難以實現網絡的實時傳播。而MPEG4技術的標準是對運動圖像中的內容進行編碼,其具體的編碼對象就是圖像中的音頻和視頻,術語稱爲“AV對象”,而連續的AV對象組合在一起又可以形成AV場景。因此,MPEG4標準就是圍繞着AV對象的編碼、存儲、傳輸和組合而制定的,高效率地編碼、組織、存儲、傳輸AV對象是MPEG4標準的基本內容。

在視頻編碼方面,MPEG4支持對自然和合成的視覺對象的編碼。(合成的視覺對象包括2D、3D動畫和人面部表情動畫等)。在音頻編碼上,MPEG4可以在一組編碼工具支持下,對語音、音樂等自然聲音對象和具有迴響、空間方位感的合成聲音對象進行音頻編碼。

由於MPEG4只處理圖像幀與幀之間有差異的元素,而捨棄相同的元素,因此大大減少了合成多媒體文件的體積。應用MPEG4技術的影音文件最顯著特點就是壓縮率高且成像清晰,一般來說,一小時的影像可以被壓縮爲350M左右的數據,而一部高清晰度的DVD電影, 可以壓縮成兩張甚至一張650M CD光碟來存儲。對廣大的“平民”計算機用戶來說, 這就意味着, 您不需要購置 DVD-ROM就可以欣賞近似DVD質量的高品質影像。而且採用MPEG4編碼技術的影片,對機器硬件配置的要求非常之低,300MHZ 以上CPU,64M的內存和一個 8M顯存的顯卡就可以流暢的播放。在播放軟件方面,它要求也非常寬鬆,你只需要安裝一個 500K左右的 MPEG4 編碼驅動後,用 WINDOWS 自帶的媒體播放器就可以流暢的播放了(下面我們會具體講到)。 

在MPEG-4視頻編碼中,運動估計相當耗時,對編碼的實時性影響很大。因此這裏特別強調快速算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者複雜度很高,實際中應用較少,後者則在H.263和MPEG中廣泛採用。在塊匹配法中,重點研究塊匹配準則及搜索方法。目前有三種常用的匹配準則:

(1)絕對誤差和(SAD, Sum of Absolute Difference)準則;

(2)均方誤差(MSE, Mean Square Error)準則;

(3)歸一化互相關函數(NCCF, Normalized Cross Correlation Function)準則。

在上述三種準則中,SAD準則具有不需乘法運算、實現簡單方便的優點而使用最多,但應清楚匹配準則的選用對匹配結果影響不大。

在選取匹配準則後就應進行尋找最優匹配點的搜索工作。最簡單、最可靠的方法是全搜索法(FS, Full Search),但計算量太大,不便於實時實現。因此快速搜索法應運而生,主要有交叉搜索法、二維對數法和鑽石搜索法,其中鑽石搜索法被MPEG-4校驗模型(VM, Verification Model)所採納,下面詳細介紹。

鑽石搜索(DS, Diamond Search)法以搜索模板形狀而得名,具有簡單、魯棒、高效的特點,是現有性能最優的快速搜索算法之一。其基本思想是利用搜索模板的形狀和大小對運動估計算法速度及精度產生重要影響的特性。在搜索最優匹配點時,選擇小的搜索模板可能會陷入局部最優,選擇大的搜索模板則可能無法找到最優點。因此DS算法針對視頻圖像中運動矢量的基本規律,選用了兩種形狀大小的搜索模板。

· 大鑽石搜索模板(LDSP, Large Diamond Search Pattern),包含9個候選位置;

· 小鑽石搜索模板(SDSP, Small Diamond Search Pattern),包含5個候選位置。

DS算法搜索過程如下:開始階段先重複使用大鑽石搜索模板,直到最佳匹配塊落在大鑽石中心。由於LDSP步長大,因而搜索範圍廣,可實現粗定位,使搜索不會陷於局部最小,當粗定位結束後,可認爲最優點就在LDSP 周圍8 個點所圍菱形區域中。然後再使用小鑽石搜索模板來實現最佳匹配塊的準確定位,以不產生較大起伏,從而提高運動估計精度。

此外Sprite視頻編碼技術也在MPEG-4中應用廣泛,作爲其核心技術之一。Sprite又稱鑲嵌圖或背景全景圖,是指一個視頻對象在視頻序列中所有出現部分經拼接而成的一幅圖像。利用Sprite可以直接重構該視頻對象或對其進行預測補償編碼。

Sprite視頻編碼可視爲一種更爲先進的運動估計和補償技術,它能夠克服基於固定分塊的傳統運動估計和補償技術的不足,MPEG-4正是採用了將傳統分塊編碼技術與Sprite編碼技術相結合的策略。

MPEG4的應用領域

憑藉着出色的性能,MPEG4技術目前在多媒體傳輸、多媒體存儲等領域得到了廣泛的應用,下面我們就來看看目前在那些領域MPEG4技術得到了大顯伸手的機會。

1、精彩的視頻世界

精彩的視頻世界是MPEG4技術應用最多也是最爲廣大朋友所熟悉的的形式。目前它主要以兩種形式出現,一種是DIVX-MPEG4影碟(國內市面上已出現,且D版居多),另一種是網上MPEG4電影。

(1)、我們先來說說DIVX-MPEG4影碟,DIVX視頻編碼技術實際上就是MPEG4壓縮技術,它由微軟MPEG4V3修改而來,使用的是MPEG4壓縮算法,並同時分離視頻和音頻。它的核心部分便是由DivX對DVD音視頻進行壓縮,生成Mpeg4視頻格式文件(也就是AVI格式)。

小提示:筆者也是經常被朋友所問到:“我看到的MPEG4電影片段明明是avi(擴展名)格式文件,並且Windows的媒體播放器也與之關聯,但就是無法播放”。其實, MPEG4並沒有確定必須用什麼擴展名,它只是一種編碼方法而已。使用avi作爲擴展名,是一種習慣性的沿用。

在計算機上播放MPEG4影音文件的方法目前有兩種:第一種是用諸如DivxPlayer等專門的播放軟件來播放;第二種播放方法是安裝MPEG4(Divx)插件後,用Windows自帶的媒體播放機來播放。

(2)、隨着網絡技術的不斷髮展,互聯網上的視頻流應用也成爲了近幾年的熱門話題。目前,在互聯網上比較流行的幾種影像格式包括Quicktime、 RealPlay以及微軟的MediaPlayer等。MPEG4技術出現之後,互聯網上又出現了MPEG4格式的電影,不過在觀看前,系統會提示你下載最新的MPEG4解碼軟件。

小提示:大家平時在網上可能經常會看見ASF格式的電影,其實它也是微軟公司開發出的一種可以直接在網上觀看視頻節目的壓縮格式。使用的也是MPEG4的壓縮算法,但因爲它是以網上即時觀看電影的視頻流格式存在的,所以它的圖像質量相對要差一些。

2、低比特率下的多媒體通信,

目前,MPEG4技術已經廣泛的應用在如視頻電話、視頻電子郵件、移動通信、電子新聞等多媒體通信領域。由於這些應用對傳輸速率要求較低,一般在 4.8~64kbit/s之間,分辨率爲176×144左右。因此MPEG4技術完全可以充分的利用網絡帶寬,通過幀重建技術壓縮和傳輸數據,以最少的數據量獲得最佳的圖像質量。

3、實時多媒體監控。

多媒體監控領域原來一直是MPEG1技術擔當重任,但近些年來,它們也是“城頭變換大王旗”了。由於MPEG4壓縮技術原本是一種適用在低帶寬下進行信息交換的音視頻處理技術,它的特點是可以動態的偵測圖像各個區域變化,基於對象的調整壓縮方法可以獲得比MPEG1更大的壓縮比,使壓縮碼流更低。因此,儘管MPEG4技術一開始並不是專爲視頻監控壓縮領域而開發的,但它高清晰度的視頻壓縮,在實時多媒體監控上,無能是存儲量,傳輸的速率,清晰度都比MPEG1具有更大的優勢。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章