音視頻編解碼標準簡介

AVS(Audio Video coding Standard)即數字音視頻編解碼技術標準,爲中國第二代信源編碼標準,此編碼技術主要解決數字音視頻海量數據(即初始數據、信源)的編碼壓縮問題,故也稱數字音視頻編解碼技術。

AVS工作組即數字音視頻編解碼技術標準工作組(Audio Video coding Standard Workgroup of China)由國家原信息產業部科學技術司於2002年6月批准成立。工作組的任務是:面向我國的信息產業需求,聯合國內企業和科研機構,制(修)訂數字音視頻的壓縮、解壓縮、處理和表示等共性技術標準,爲數字音視頻設備與系統提供高效經濟的編解碼技術,服務於高分辨率數字廣播、高密度激光數字存儲媒體、無線寬帶多媒體通訊、互聯網寬帶流媒體等重大信息產業應用。自AVS工作組2002年成立以來,至今,已制定了兩代AVS標準。

AVS標準工作簡況與進展:AVS是我國具備自主知識產權的第二代信源編碼標準。顧名思義,”信源”是信息的”源頭”,信源編碼技術解決的重點問題是數字音視頻海量數據(即初始數據、信源)的編碼壓縮問題,故也稱數字音視頻編解碼技術。顯而易見,它是其後數字信息傳輸、存儲、播放等環節的前提,因此是數字音視頻產業的共性基礎標準。

國際上音視頻編解碼標準主要兩大系列:ISO/IEC JTC1制定的MPEG系列標準;ITU針對多媒體通信制定的H.26x系列視頻編碼標準和G.7系列音頻編碼標準。1994年由MPEG和ITU合作制定的MPEG-2是第一代音視頻編解碼標準的代表,也是目前國際上最爲通行的音視頻標準。

經過十年多演變,音視頻編碼技術本身和產業應用背景都發生了明顯變化,後起之秀輩出。目前音視頻產業可以選擇的信源編碼標準有五個:MPEG-2、MPEG-4、MPEG-4 AVC(簡稱AVC,也稱JVT、H.264)、HEVC、AVS。從制訂者分,前四個標準是由MPEG專家組完成的,第五個是我國自主制定的。從發展階段分,MPEG-2是第一代信源標準,其餘四個爲第二代標準。從主要技術指標----編碼效率比較:MPEG-4是MPEG-2的1.4倍,第一代AVS和AVC相當,都是MPEG-2兩倍以上。第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265)。

可以推測,由於技術陳舊需要更新及收費較高等原因,MPEG-2即將退出歷史舞臺。MPEG-4出臺的新專利許可政策被認爲過於苛刻令人無法接受,導致被衆多運營商圍攻,陷入無法推廣產業化的泥沼而無力自拔,前途未卜。而AVS是基於我國創新技術和部分公開技術的自主標準,第一代AVS編碼效率比MPEG-2高2-3倍,與AVC相當,技術方案簡潔,芯片實現複雜度低,達到了第二代標準的最高水平;而且,AVS通過簡潔的一站式許可政策,解決了AVC專利許可問題死結,是開放式制訂的國家、國際標準,易於推廣;第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265)。此外,AVC僅是一個視頻編碼標準,而AVS是一套包含系統、視頻、音頻、數字版權管理在內的完整標準體系,爲數字音視頻產業提供更全面的解決方案。綜上所述,AVS可稱第二代信源標準的上選。

第一代AVS標準制訂起始於2002年,指系列國家標準《信息技術 先進音視頻編碼》(簡稱AVS1,國家標準代號GB/T 20090)和廣電系列標準《廣播電視先進音視頻編解碼》(簡稱AVS+)。AVS1包括系統、視頻、音頻、數字版權管理等四個主要技術標準和符合性測試等支撐標準,目前共14個部分。GB/T 20090視頻標準於2006年2月頒佈,目前GB/T 20090系列國家標準已頒佈9項。針對廣電應用制訂的行業標準《廣播電視先進音視頻編解碼 第1部分:視頻》於2012年7月獲批爲行業標準,行標號爲GY/T 257.1----2012,簡稱AVS+。

第二代AVS標準包括系列國家標準《信息技術 高效多媒體編碼》(簡稱AVS2),AVS2主要面向超高清電視節目的傳輸,定位在引領未來五到十年數字媒體產業的發展,並爭取爲相關國際標準的制定發揮關鍵作用。在第一代AVS推廣應用的同時,AVS技術的持續演進工作在積極推進,第二代標準AVS2技術已開發完成,2016年5月,廣電總局頒佈AVS2視頻爲行業標準,2016年12月30日,頒佈爲國家標準。

經國家新聞出版廣電總局、工業和信息化部測試機構測試,第一代AVS的壓縮效率與同期國際標準MPEG-4 AVC/H.264相當,比原視頻編碼國家標準GB/T 17975.2-2000(等同採用ISO/IEC 13818.2-1994,即MPEG-2)提高一倍以上。因而能夠成倍節省頻譜和帶寬,經濟效益突出。根據國家新聞出版廣電總局廣播電視規劃院進行的嚴格測試,第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265),相對於第一代AVS標準,第二代AVS標準可節省一半的傳輸帶寬,將支撐未來幾年超高清電視在我國的推廣應用。

目前,AVS標準除在廣電領域廣泛使用,已進入互聯網領域,下一步AVS2會進入監控應用。

2016年初,AVS已啓動VR國際標準和國家標準的制定,AVS VR國際標準已完成立項。2017年1月開始,AVS工作組已啓動《信息技術 虛擬現實內容高效編碼》(簡稱AVS VR標準)系列標準的國家立項申請工作。

2018年初,第二代AVS系統部分《信息技術 高效多媒體編碼 第1部分:系統》和音頻部分《信息技術 高效多媒體編碼 第3部分:音頻》進入國標委審批,等待頒佈。

2018年6月7日,我國第二代數字音頻編碼標準《信息技術 高效多媒體編碼 第3部分:音頻》(簡稱AVS2音頻標準)由國家市場監督管理總局和國家標準化管理委員會頒佈爲國家標準,標準代號GB/T 33475.3-2018,將於2019年1月1日正式實施。AVS2音頻標準立足提供完整的高清三維視聽技術方案,與第二代AVS視頻編碼(AVS2視頻)配套,是更適合超高清、3D等新一代視聽系統需要的高質量、高效率音頻編解碼標準。將應用於全景聲電影、超高清電視、互聯網寬帶音視頻業務、數字音視頻廣播無線寬帶多媒體通信、虛擬現實和增強現實及視頻監控等領域。

AVS產業化的主要產品形態包括

(1). 芯片:高清晰度/標準清晰度AVS解碼芯片和編碼芯片。

(2). 軟件:AVS節目製作與管理系統,Linux和Window平臺上基於AVS標準的流媒體播出、點播、回放軟件。

(3). 整機:AVS機頂盒、AVS硬盤播出服務器、AVS編碼器、AVS高清晰度激光視盤機、AVS高清晰度數字電視機頂盒和接收機、AVS手機、AVS便攜式數碼產品等。

MPEG是ISO/IEC JTC1 1988年成立的運動圖像專家組(Moving Picture Expert Group)的簡稱,負責數字視頻、音頻和其它媒體的壓縮、解壓縮、處理和表示等國際技術標準的制定工作

MPEG-1制定於1992年,它是將視頻數據壓縮成1~2Mb/s的標準數據流。它主要用於家用VCD,它需要的存儲空間比較大。

MPEG-2制定於1994年,是爲高級工業標準的圖像質量以及更高的傳輸率而設計,它是高質量視頻音頻編碼標準。在常規電視的數字化、高清晰電視HDTV、視頻點播VOD,交互式電視等各個領域中都是核心的技術之一。

MPEG-4於1998年11月公佈,主要應用於視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低。它與MPEG-2相比,可節省90%的儲存空間。MPEG-4標準是面向對象的壓縮方式,不是像MPEG-1和MPEG-2簡單地將圖像分爲一些像塊,而是根據圖像內容,將其中的對象(物體、人物、背景)分離出來分別進行幀內、幀間編碼壓縮,並允許在不同的對象之間靈活分配碼率,對重要的對象分配較多的字節,對次要的對象分配較少的字節,從而大大提高了壓縮比,使其在較低的碼率下獲得較好的效果。

MPEG-7是針對存儲形式(在線、脫機)或流形式(如 Internet上的廣播、推送模型)的應用而制定的,並且可以在實時和非實時環境中操作。它是爲互聯網視頻檢索制定的壓縮標準。MPEG-7標準的正式名稱爲”多媒體內容描述接口”(Multimedia Content Description Interface), 其目標就是產生一種描述多媒體內容數據的標準,滿足實時、非實時以及推-拉應用的需求,它既不同於基於波形和基於壓縮的表示方式如MPEG-1和MPEG -2,又不同於基於對象的表示方式如MPEG-4,而是將對各種不同類型的多媒體信息進行標準化描述,並將該描述與所描述的內容相聯繫,以實現快速有效的搜索。

MPEG-21 Multimedia Framework是致力於在大範圍的網絡上實現透明的傳輸和對多媒體資源的充分利用。MPEG-21致力於爲多媒體傳輸和使用定義一個標準化的開放框架。

WMV(WINDOWS MEDIA VIDEO):是微軟推出的一種流媒體格式,WMV格式的體積非常小,適合在網上播放和傳輸。但由於非開放性標準,時延非常大。

H.261:於1990年完成,實際的編碼算法類似於MPEG算法,但不能與後者兼容。用於電視會議、可視電話。

H.263:於1996年完成,與H.261相比採用了半象素的運動補償,並增加了4種有效的壓縮編碼模式。但是其限制了應用的圖像輸入格式,僅允許5種視頻源格式。

H.263+:允許更大範圍的圖像輸入格式,自定義圖像的尺寸,從而拓寬了標準使用的範圍,使之可以處理基於視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。

H.263++:在H263+基礎上增加了3個選項,主要是爲了增強碼流在惡劣信道上的抗誤碼性能,同時爲了提高增強編碼效率。

H.264/MPEG-4 AVC:壓縮能力比H.263更強。高壓縮比、高圖像質量、良好的網絡適應性,在較低帶寬上提供高質量的圖像傳輸。是爲新一代交互視頻通訊制定的標準。該標準也被稱爲AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。

H.265:是繼H.264之後所制定的新的視頻編碼標準。H.265標準圍繞着現有的視頻編碼標準H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼質量、延時和算法複雜度之間的關係,達到最優化設置。H.265旨在在有限帶寬下傳輸更高質量的網絡視頻,僅需原先的一半帶寬即可播放相同質量的視頻。這也意味着,我們的智能手機、平板機等移動設備將能夠直接在線播放1080p的全高清視頻。H.265標準也同時支持4K(4096×2160)和8K(8192×4320)超高清視頻。

IPB:視頻中每幀代表一幅靜止的圖像,而在實際壓縮時,會採取各種算法減少數據的容量,其中IPB就是最常見的。

I幀是關鍵幀,屬於幀內壓縮(P、B爲幀間)。儘可能去除圖像空間冗餘信息來壓縮傳輸數據量的幀內編碼圖像。I幀法是基於離散餘弦變換DCT(Discrete Cosine Transform)的壓縮技術,這種算法與JPEG壓縮算法類似。採用I幀壓縮可達到1/6的壓縮比而無明顯的壓縮痕跡。解碼時僅用I幀的數據就可重構完整圖像。

P幀也叫預測幀,表示的是這一幀跟之前的一個關鍵幀(或P幀)的差別,解碼時需要用之前緩存的畫面疊加上本幀定義的差別,生成最終畫面。也就是差別幀,P幀沒有完整畫面數據,只有與前一幀的畫面差別的數據。

B幀也叫雙向預測幀。既考慮與源圖像序列前面已編碼幀,也顧及源圖像序列後面已編碼幀之間的時間冗餘信息來壓縮傳輸數據量的編碼圖像。B幀不是參考幀,不會造成解碼錯誤的擴散。

一般地,I幀壓縮效率最低,P幀較高,B幀最高。I、B、P各幀是根據壓縮算法的需要,是人爲定義的,它們都是實實在在的物理幀,至於圖像中的哪一幀是I幀,是隨機的,一旦確定確定了I幀,以後的各幀就嚴格按規定順序排列。

視頻文件封裝(容器):封裝格式就是將已經編碼壓縮好的視頻軌和音頻軌按照一定的格式放到一個文件中,這個文件也就相當於一個容器。採用不同的方式把視頻編碼和音頻編碼打包成一個完整的多媒體文件,也就出現了不同的後綴,常見的封裝格式:

(1). AVI:微軟在90年代初創立的封裝標準,其含義是Audio Video Interactive,就是把視頻和音頻編碼混合在一起儲存。

(2). mov:QuickTime Movie是由蘋果公司開發的容器。

(3). WMV:是微軟公司開發的一組數位視頻編解碼格式的通稱。

(4). mkv: Matroska的簡稱,萬能封裝器,有良好的兼容和跨平臺性、糾錯性,可帶外掛字幕。

(5). flv: 這種封裝方式可以很好的保護原始地址,一些視頻分享網站採用這種封裝方式。

(6). rmvb/rm:Real Video,由RealNetworks開發的應用於rmvb和rm的不同封裝方式。rm是固定碼率,rmvb是動態碼率(就是靜態畫面採用用低碼率,動態採用高碼率)。

(7). MP4:主要應用於mpeg4的封裝。

(8). 3GP:主要應用於H.263的封裝。

由於不同的播放器支持不同的視頻文件格式,或者計算機中缺少相應格式的解碼器,或者一些外部播放裝置(比如手機、MP4等)只能播放固定的格式,因此就會出現視頻無法播放的現象。在這種情況下就要使用格式轉換器軟件來彌補這一缺陷。

注:以上全部內容均來自網絡,主要參考:

1. http://www.avs.org.cn/

2. https://blog.csdn.net/leixiaohua1020/article/details/12031631 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章