第8章 MPEG簡介

 

  MPEG標準一直是許多科研機構和大學的科研熱點,也是工業界產品開發的熱點。MPEG標準闡明瞭聲音和電視圖像的編碼和解碼過程,嚴格規定了聲音和圖像數據編碼後組成比特數據流的句法,提供瞭解碼器的測試方法等,但沒有對所有內容都作嚴格規定,尤其是對壓縮和解壓縮的算法,這樣既保證瞭解碼器能對符合MPEG標準的聲音數據和電視圖像數據進行正確解碼,又給MPEG標準的具體實現留有很大餘地。人們可以不斷改進編碼和解碼算法,提高聲音和電視圖像的質量以及編碼效率。
  本章介紹MPEG標準的概貌,爲讀者比較深入地瞭解MPEG提供最基本的背景材料。如果讀者感興趣可參考本章提供的參考文獻[1]~[3]。

8.1 MPEG是什麼

8.1.1 MPEG是什麼

  MPEG(Moving Picture Expert Group)是在1988年由國際標準化組織(International Organization for Standardization,ISO)和國際電工委員會(International Electrotechnical Commission,IEC)聯合成立的專家組,負責開發電視圖像數據和聲音數據的編碼、解碼和它們的同步等標準。這個專家組開發的標準稱爲MPEG標準,到目前爲止,已經開發和正在開發的MPEG標準有:
  MPEG-1:數字電視標準,1992年正式發佈。
  MPEG-2:數字電視標準。
  MPEG-3:已於1992年7月合併到高清晰度電視(High-Definition TV,HDTV)工作組。
  MPEG-4:多媒體應用標準(1999年發佈)。
  MPEG-5:直至1998年9月還沒有見到定義。
  MPEG-6:直至1998年9月還沒有見到定義。
  MPEG-7:多媒體內容描述接口標準(正在研究)。
  MPEG-1和-2標準已經正式發佈,並且得到廣泛應用。例如,CD-交互系統,在網絡上的數字聲音廣播、數字電視廣播和影視點播等。表8-01是MPEG-1和-2的典型編碼參數。

表8-01 MPEG-1和-2典型的編碼參數

 

MPEG-1

MPEG-2 (基本型)

標準化時間

1992年

1994年(DIS)

主要應用

CD-ROM上的數字電視,VCD

數字TV,DVD

空間分辨率

CIF格式(1/4 TV),288 × 360像素

TV,576 × 720像素

時間分辨率

25 - 30 幀/秒

50-60 場/秒

位速率

1.5 Mbit/s

15 Mbit/s

質量

相當於VHS

相當於NTSC/PAL電視

壓縮率

20 ~ 30

30 ~ 40

8.1.2 MPEG文件的創建過程

  與其他ISO標準文件一樣,MPEG標準文件的創建過程分成4個階段:
  1.工作文件(Working Draft,WD):工作組(Working Group,WG)準備的工作文件
  2.委員會草案(Committee Draft,CD):從工作組WG準備好的工作文件WD提升上來的文件。這是ISO文檔的最初形式,它由ISO內部正式調查研究和投票表決。
  3.國際標準草案(Draft International Standard,DIS):投票成員國對CD的內容和說明滿意之後由委員會草案CD提升上來的文件。
  4.國際標準(International Standard,IS):由投票成員國、ISO的其他部門和其他委員會投票通過之後出版發佈的文件。

8.2 MPEG-1數字電視標準

  MPEG-1處理的是標準圖像交換格式(Standard Interchange format,SIF)或者稱爲源輸入格式(Source Input Format,SIF)的電視,即NTSC製爲352像素´ 240行/幀<´ 30幀/秒,PAL製爲352像素´ 288行/幀´ 25幀/秒,壓縮的輸出速率定義在1.5 Mbit/s以下。這個標準主要是針對當時具有這種數據傳輸率的CD-ROM和網絡而開發的,用於在CD-ROM上存儲數字影視和在網絡上傳輸數字影視。
  MPEG-1的標準號爲ISO/IEC 11172,標準名稱爲“信息技術——用於數據速率高達大約1.5 Mbit/s的數字存儲媒體的電視圖像和伴音編碼”Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s)。它已於1991年底被ISO/IEC採納,由五個部分組成:
  ① MPEG-1系統,寫成MPEG-1 Systems,規定電視圖像數據、聲音數據及其他相關數據的同步,標準名是ISO/IEC 11172-1:1993 Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s — Part 1:Systems。
  ② MPEG-1電視圖像,寫成MPEG-1 Video, 規定電視數據的編碼和解碼,標準名是ISO/IEC 11172-2:1993 Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s — Part 2:Video。
  ③ MPEG-1聲音,寫成MPEG-1 Audio, 規定聲音數據的編碼和解碼,標準名是ISO/IEC 11172-3:1993 Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s — Part 3:Audio。
  圖8-01表示了MPEG-1譯碼器的方框圖。


圖8-01 MPEG-1譯碼器方框圖

  ④ MPEG-1一致性測試,寫成MPEG-1 Conformance testing,標準名是ISO/IEC 11172-4:1995 Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s — Part 4:Conformance testing。這個標準詳細說明如何測試比特數據流(bitstreams)和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規定的要求。這些測試可由廠商和用戶實施。
  ⑤ MPEG-1軟件模擬,寫成MPEG-1 Software simulation,標準名是ISO/IEC TR 11172-5 Information technology —Coding of moving pictures and associated audio for digital storage media up to about 1.5 Mbit/s— Part 5:Software simulation。實際上,這部分的內容不是一個標準,而是一個技術報告,給出了用軟件執行MPEG-1標準前3個部分的結果。

8.3 MPEG-2數字電視標準

  MPEG-2標準從1990年開始研究,1994發佈DIS。它是一個直接與數字電視廣播有關的高質量圖像和聲音編碼標準。MPEG-2可以說是MPEG-1的擴充,因爲它們的基本編碼算法都相同。但MPEG-2增加了許多MPEG-1所沒有的功能,例如增加了隔行掃描電視的編碼,提供了位速率的可變性能(scalability)功能。MPEG-2要達到的最基本目標是:位速率爲4~9 Mbit/s,最高達15 Mbit/s。
  MPEG-2的標準號爲ISO/IEC 13818,標準名稱爲“信息技術&#0;電視圖像和伴音信息的通用編碼(Information technology — Generic coding of moving pictures and associated audio information )”。MPEG-2包含9個部分:
  ① MPEG-2系統,寫成MPEG-2 Systems,規定電視圖像數據、聲音數據及其他相關數據的同步,標準名是ISO/IEC 13818-1:1996 Information technology — Generic coding of moving pictures and associated audio information :Systems。
  MPEG-2的系統模型如圖8-02所示。這個標準主要是用來定義電視圖像數據、聲音數據和其他數據的組合,把這些數據組合成一個或者多個適合於存儲或者傳輸的基本數據流。數據流有兩種形式,一種稱爲程序數據流(Program Stream,PS),另一種稱爲傳輸數據流(Transport Stream,TS)。程序數據流是組合一個或者多個規格化的即包化基本數據流(Packetised Elementary Streams,PES)而生成的一種數據流,用在出現錯誤相對比較少的環境下,適合使用軟件處理的應用;傳輸數據流也是組合一個或者多個PES而生成的一種數據流,它用在出現錯誤相對比較多的環境下,例如在有損失或者有噪聲的傳輸系統中。


圖8-02 MPEG-2的系統模型

  ② MPEG-2電視圖像,寫成MPEG-2 Video,規定電視數據的編碼和解碼,標準名是ISO/IEC 13818-2:1996 Information technology — Generic coding of moving pictures and associated audio information :Video。
  爲了適應各種應用,這個標準定義了電視圖像的各種規格,稱爲配置(profile),如表8-02所示。表中的“X”符號表示MPEG-2支持的配置。各種配置的詳細解釋請參看10.3。

表8-02 MPEG-2電視圖像配置

配置等級

Simple

Main(基本型)

SNR scalable(信噪比可變型)

Spatial scalable(空間分辨率可變型)

High(高級型)

Multiview(多視角型)

4:2:2

High level (高級)

 

X

 

 

X

 

 

High-1440 level (高級1440)

 

X

 

X

X

 

 

Main level (基本級)

X

X

X

 

X

X

X

Low level (低級)

 

X

X

 

 

 

 

  有些人認爲使用4:2:0子採樣格式的圖像質量還不夠好,因此在1996年的標準中增加了4:2:2子採樣格式的圖像。多視角配置(Multiview Profile,MVP)是附加的配置。
  ③ MPEG-2聲音,寫成MPEG-2 Audio,規定聲音數據的編碼和解碼,是MPEG-1 Audio的擴充,支持多個聲道,標準名是ISO/IEC 13818-3:1998 Information technology — Generic coding of moving pictures and associated audio information — Part 3:Audio。
  ④ MPEG-2一致性測試,寫成MPEG-2 Conformance testing,標準名是ISO/IEC DIS 13818-4 Information technology — Generic coding of moving pictures and associated audio information — Part 4:Conformance testing。
  ⑤ MPEG-2軟件模擬,寫成MPEG-2 Software simulation,標準名是ISO/IEC TR 13818-5:1997 Information technology — Generic coding of moving pictures and associated audio information — Part 5:Software simulation。
  ⑥ MPEG-2數字存儲媒體命令和控制擴展協議,寫成MPEG-2 Extensions for DSM-CC,標準名是ISO/IEC DIS 13818-6 Information technology — Generic coding of moving pictures and associated audio information — Part 6:Extensions for DSM-CC。
  這是一個數字存儲媒體命令和控制(Digital Storage Media Command and Control,DSM-CC)擴展協議,用於管理MPEG-1和MPEG-2的數據流,使數據流既可在單機上運行,又可在異構網絡(即用類似設備構造但運行不同協議的網絡)環境下運行。在DSM-CC模型中,服務器(server)和客戶器(client)都被認爲是DSM-CC網絡的用戶(user),DSM-CC定義了一個稱爲會話和資源管理(Session and Resource Manager,SRM)的實體,用來集中管理網絡中的會話和資源,如圖8-03所示。


圖8-03 DSM-CC參考模型[3]

  ⑦MPEG-2先進聲音編碼,寫成MPEG-2 AAC,是多聲道聲音編碼算法標準。這個標準除後向兼容MPEG-1 Audio標準之外,還有非後向兼容的聲音標準。標準名是ISO/IEC 13818-7:1997 Information technology — Generic coding of moving pictures and associated audio information — Part 7:Advanced Audio Coding (AAC)。
  ⑧ MPEG-2系統解碼器實時接口擴展標準,標準名是ISO/IEC 13818-9:1996 Information technology — Generic coding of moving pictures and associated audio information — Part 9:Extension for real time interface for systems decoders。
  這是與傳輸數據流(Transport Stream)的實時接口(real-time interface,RTI)標準,它可以用來適應來自網絡的傳輸數據流,如圖8-04所示。


圖8-04 實時接口參考模型

  ⑨ MPEG-2 DSM-CC一致性擴展測試,標準名是ISO/IEC DIS 13818-10 Information technology — Generic coding of moving pictures and associated audio information — Part 10:Conformance extensions for Digital Storage Media Command and Control (DSM-CC)。
  µ MPEG-2先進聲音編碼標準修正版,標準名是Amendment 1 to ISO/IEC TR 13818-5:1997 Amendment 1 to ISO/IEC TR 13818-5:1997 Advanced Audio Coding (AAA)。
  最後要說明的是,MPEG-2的Part 8原計劃用於採樣精度爲10比特的電視圖像編碼,但由於目前工業界對此興趣不大,因此該標準已暫停開發。

8.4 MPEG-4多媒體應用標準

8.4.1 標準概要

  MPEG-4從1994年開始工作,它是爲視聽(audio-visual)數據的編碼和交互播放開發算法和工具,是一個數據速率很低的多媒體通信標準。MPEG-4的目標是要在異構網絡環境下能夠高度可靠地工作,並且具有很強的交互功能。
  爲了達到這個目標,MPEG-4引入了對象基表達(object-based representation)的概念,用來表達視聽對象(audio/visual objects,AVO);MPEG-4擴充了編碼的數據類型,由自然數據對象擴展到計算機生成的合成數據對象,採用合成對象/自然對象混合編碼(Synthetic/Natural Hybrid Coding,SNHC)算法;在實現交互功能和重用對象中引入了組合、合成和編排等重要概念。MPEG-4系統構造如圖8-05所示,接收端的構造部件如圖8-06所示。

圖8-05 MPEG-4系統示意圖


圖8-06 MPEG-4接收端的主要部件[4]

  MPEG-4中制定了一個稱爲傳輸多媒體集成框架(Delivery Multimedia Integration Framework,DMIF)的會話協議,它用來管理多媒體數據流。該協議在原則上與文件傳輸協議FTP(File Transfer Protocol)類似,其差別是:FTP返回的是數據,而DMIF返回的是指向到何處獲取數據流的指針。DMIF覆蓋了三種主要技術:廣播技術,交互網絡技術和光盤技術,如圖8-07所示。


圖8-07 DMIF覆蓋的三種主要技術
(引自ISO/IEC JTC1/SC29/WG11 N2323 July 1998/Dublin)

  MPEG-4將應用在移動通信和公用電話交換網(public switched telephone network,PSTN)上,並支持可視電話(videophone)、電視郵件(video mail)、電子報紙(electronic newspapers)和其他低數據傳輸速率場合下的應用。Image288.gifMPEG-4的標準名是Very-low bitrate audio-visual coding (甚低速率視聽編碼)。截止到1998年9月,已作爲國際標準草案(Draft International Standard,DIS)的MPEG-4文件有6個部分,它們是:Image288.gif
  ① MPEG-4系統標準,標準名是ISO/IEC DIS 14496-1 Very-low bitrateaudio-visual coding — Part 1: Systems。
  ② MPEG-4電視圖像標準,標準名是ISO/IEC DIS 14496-2 Very low bitrate audio-visual coding — Part 2: Video。
  ③ MPEG-4聲音標準,標準名是ISO/IEC DIS 14496-3 Very low bitrate audio-visual coding — Part 3: Audio。
  ④ MPEG-4一致性測試標準,標準名是ISO/IEC DIS 14496-4 Very-low bitrate audio-visual coding — Part 4: Conformance Testing。
  ⑤ MPEG-4參考軟件,標準名是ISO/IEC DIS 14496-5 Very-low bitrate audio-visual coding — Part 5:Reference software
  ⑥ MPEG-4傳輸多媒體集成框架,標準名是ISO/IEC DIS 14496-6 Very-low bitrate audio-visual coding

8.5 MPEG-7多媒體內容描述接口

  MPEG-7的工作於1996年啓動,名稱叫做多媒體內容描述接口(Multimedia Content Description Interface),目的是制定一套描述符標準,用來描述各種類型的多媒體信息及它們之間的關係,以便更快更有效地檢索信息。這些媒體材料可包括靜態圖像、圖形、3D模型、聲音、話音、電視以及在多媒體演示中它們之間的組合關係。在某些情況下,數據類型還可包括面部特性和個人特性的表達。
  與其他的MPEG標準一樣,MPEG-7是爲滿足特定需求而制定的視聽信息標準。MPEG-7標準也是建築在其他的標準之上的,例如,PCM, MPEG-1, MPEG-2和MPEG-4等等。在MPEG-7中,例如MPEG-4中使用的形狀描述符、MPEG-1和MPEG-2中使用的移動矢量(motion vector)等都可能在MPEG-7中用到。
  圖8-08表示了MPEG-7的處理鏈(processing chain),這是高度抽象的方框圖。在這個處理鏈中包含有三個方框:特徵抽取(feature extraction)、標準描述(standard description)和檢索工具(search engine)。特徵的自動分析和抽取對MPEG-7是至關重要的,抽象程度越高,自動抽取也越困難,而且不是都能夠自動抽取的,因此開發自動的和交互式半自動抽取的算法和工具都是很有用的。儘管如此,特徵抽取和檢索工具都不包含在MPEG-7標準中,而是留給大家去競爭,以便得到最好的算法和工具。


圖8-08 MPEG-7的範圍[4]

  MPEG-7的應用領域包括:數字圖書館(Digital library),例如圖像目錄、音樂詞典等;多媒體目錄服務(multimedia directory services),例如黃頁(yellow pages);廣播媒體的選擇,例如無線電頻道,TV頻道等;多媒體編輯,例如個人電子新聞服務,多媒體創作等等。潛在應用的應用領域包括:教育、娛樂、新聞、旅遊、醫療、購物等等。

練習與思考題

  • 回顧制定MPEG標準的4個階段和各階段的提交的文件類型。
  • MPEG-1, -2, -4和-7的目標是什麼?
參考文獻和站點
  • http://www.cselt.it/mpeg/standards/mpeg-4/mpeg-4.htm(瀏覽日期:1998年9月20日)
  • http://drogo.cselt.stet.it/mpeg/standards/mpeg-7/mpeg-7.htm(瀏覽日期:1998年9月20日)
  • http://drogo.cselt.stet.it/mpeg/standards/mpeg-2/mpeg-2.htm(瀏覽日期:1998年9月20日)
  • ISO/IEC JTC1/SC29/WG11 N2323 July 1998
 
發佈了12 篇原創文章 · 獲贊 2 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章