第10章 MPEG電視

 第10章 MPEG電視

  MPEG-1和-2 Video標準有許多共同之處,基本概念類似,數據壓縮編碼方法基本相同,都採用以圖像塊作爲基本單元進行變換、量化和移動補償等技術來獲得高壓縮比。MPEG-4 Video部分採用內容基編碼技術,它除與MPEG-1和-2 Video向後兼容外,還引入了電視圖像對象(VO)的概念,在某些應用場合下,對場景中的圖像分別進行編碼可以獲得很高的壓縮比而服務質量也能滿足要求。下面將簡要介紹這些標準中壓縮電視圖像數據的基本方法。

10.1 電視圖像的數據率

10.1.1 ITU-R BT.601標準數據率

  按照奈奎斯特(Nyquist)採樣理論,模擬電視信號經過採樣(把連續的時間信號變成離散的時間信號)和量化(把連續的幅度變成離散的幅度信號)之後,數字電視信號的數據量大得驚人,當前的存儲器和網絡都還沒有足夠的能力支持這種數據傳輸率,因此就要對數字電視信號進行壓縮。
  爲了在PAL、NTSC和SECAM彩色電視制之間確定一個共同的數字化參數,早在1982年國際無線電諮詢委員會(CCIR)就制定了演播室質量的數字電視編碼標準,這就是非常有名的ITU-R BT.601標準。按照這個標準,使用4:2:2的採樣格式,亮度信號Y的採樣頻率選擇爲13.5 MHz/s,而色差信號Cr和Cb的採樣頻率選擇爲6.75 MHz/s,在傳輸數字電視信號通道上的數據傳輸率就達到爲270 Mb/s(兆比特/秒)!,即
  亮度(Y):
   858樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 135兆比特/秒(NTSC)
   864樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 135兆比特/秒(PAL)
  Cr (R-Y):
   429樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 68兆比特/秒(NTSC)
   429樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 68兆比特/秒(PAL)
  Cb (B-Y):
   429樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 68兆比特/秒(NTSC)
   429樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 68兆比特/秒(PAL)
  總計: 27兆樣本/秒×10比特/樣本 = 270兆比特/秒
  實際上,在熒光屏上顯示出來的有效圖像的數據傳輸率並沒有那麼高,
   亮度(Y): 720×480×30×10 ≌ 104 Mb/s (NTSC)
        720×576×25×10 ≌ 104 Mb/s (PAL)
   色差(Cr,Cb):2×360×480×30×10 ≌ 104 Mb/s (NTSC)
          2×360×576×25×10 ≌ 104 Mb/s (PAL)
   總計: ~ 207 Mb/s
  如果每個樣本的採樣精度由10比特降爲8比特,彩色數字電視信號的數據傳輸率就降爲166 Mb/s。

10.1.2 電視圖像數據率的估算

  如果考慮使用Video-CD存儲器來存儲數字電視,由於它的數據傳輸率可達到1.4112 Mb/s,分配給電視信號的數據傳輸率爲1.15 Mb/s,這就意味MPEG電視編碼器的輸出數據率要達到1.15 Mb/s。顯而易見,如果存儲166 Mb/s的數字電視信號就需要對它進行高度壓縮,壓縮比高達166/1.15 ≌ 144:1。
  MPEG-1電視圖像壓縮技術不能達到這樣高的壓縮比。爲此首先把NTSC和PAL數字電視轉換成公用中分辨率格式CIF(Common Intermediate Format)的數字電視,這種格式相當於VHS(Video Home System)的質量,於是彩色數字電視的數據傳輸率就減小到
    352×240×30×8×1.5 ≌ 30 Mb/s (NTSC)
    352×288×25×8×1.5 ≌ 30 Mb/s (PAL)。
  把這種彩色電視信號存儲到CD盤上所需要的壓縮比爲:30/1.15 ≌ 26:1。這就是MPEG-1技術所能獲得的壓縮比。

10.1.3 電視圖像數據率的估算

  根據當前成熟的壓縮技術,電視圖像的數據率壓縮成平均爲3.5 Mb/s ~ 4.7 Mb/s時非專家難於區分電視圖像在壓縮前後的之間差別。如果使用DVD-Video存儲器來存儲數字電視,它的數據傳輸率雖然可以達到10.08 Mb/s,但一張4.7 GB的單面單層DVD盤要存放133分鐘的電視節目,按照數字電視信號的平均數據傳輸率爲4.1 Mb/s來計算,壓縮比要達到:166/4.10 ≌ 40:1。
  如果電視圖像的子採樣使用4:2:0格式,每個樣本的精度爲8比特,數字電視信號的數據傳輸率就減小到124 Mb/s,即
    720×480×30×8×1.5 ≌ 124 Mb/s (NTSC)
    720×576×25×8×1.5 ≌ 124 Mb/s (PAL)
  使用DVD-Video來存儲720×480×30或者720×576×25的數字電視圖像所需要的壓縮比爲:124/4.1 ≌ 30:1。

10.2 數據壓縮算法

10.2.1 簡介

  電視圖像數據壓縮利用的各種特性和採用的方法歸納在表10-1中。從表中可以看到,電視圖像本身在時間上和空間上都含有許多冗餘信息,圖像自身的構造也有冗餘性。此外,正如前面所介紹的,利用人的視覺特性也可對圖像進行壓縮,這叫做視覺冗餘。

表10-1 電視圖像壓縮利用的各種冗餘信息

種類

內容

目前用的主要方法

統計

空間冗餘

像素間的相關性

變換編碼,預測編碼

特性

時間冗餘

時間方向上的相關性

幀間預測,移動補償

圖像構造冗餘

圖像本身的構造

輪廓編碼,區域分割

知識冗餘

收發兩端對人物的共有認識

基於知識的編碼

視覺冗餘

人的視覺特性

非線性量化,位分配

其他

不確定性因素

 

  MPEG-Video圖像壓縮技術基本方法和方法可以歸納成兩個要點:
  ① 在空間方向上,圖像數據壓縮採用JPEG(Joint Photographic Experts Group)壓縮算法來去掉冗餘信息。
  ② 在時間方向上,圖像數據壓縮採用移動補償(motion compensation)算法來去掉冗餘信息。
  爲了在保證圖像質量基本不降低而又能夠獲得高的壓縮比,MPEG專家組定義了三種圖像:幀內圖像I(intra),預測圖像P(predicted)和雙向預測圖像B(bidirectionally interpolated ),典型的排列如圖10-01所示。這三種圖像將採用三種不同的算法進行壓縮。


圖10-01 MPEG專家組定義的三種圖像

10.2.2 幀內圖像I的壓縮編碼算法

  幀內圖像I不參照任何過去的或者將來的其他圖像幀,壓縮編碼採用類似JPEG壓縮算法,它的框圖如圖10-02所示。如果電視圖像是用RGB空間表示的,則首先把它轉換成YCrCb空間表示的圖像。每個圖像平面分成8×8的圖塊,對每個圖塊進行離散餘弦變換DCT(discrete Cosine Transform)。DCT變換後經過量化的交流分量係數按照Zig-zag的形狀排序,然後再使用無損壓縮技術進行編碼。DCT變換後經過量化的直流分量係數用差分脈衝編碼DPCM(DifferentialPulse Code Modulation),交流分量係數用行程長度編碼RLE(run-length encoding),然後再用霍夫曼(Huffman)編碼或者用算術編碼。它的編碼框圖如圖10-2所示。


圖10-02 幀內圖像I的壓縮編碼算法框圖
(引自Simon Fraser University School of Computing Science, Dr. Ze-Nian Li,
http://fas.sfu.ca/cs/undergrad/CourseMaterials/CMPT365/material/notes/contents.html)

10.2.3 預測圖像P的壓縮編碼算法

  預測圖像的編碼也是以圖像宏塊(macroblock)爲基本編碼單元,一個宏塊定義爲I×J像素的圖像塊,一般取16×16。預測圖像P使用兩種類型的參數來表示:一種參數是當前要編碼的圖像宏塊與參考圖像的宏塊之間的差值,另一種參數是宏塊的移動矢量。移動矢量的概念可用圖10-03表示。


圖10-03 移動矢量的概念

  求解差值的方法如圖10-04所示。假設編碼圖像宏塊MPI是參考圖像宏塊MRJ的最佳匹配塊,它們的差值就是這兩個宏塊中相應像素值之差。對所求得的差值進行彩色空間轉換,並作4:1:1的子採樣得到Y,Cr和Cb分量值,然後仿照JPEG壓縮算法對差值進行編碼,計算出的移動矢量也要進行霍夫曼編碼。


圖10-04 預測圖像P的壓縮編碼算法框圖

  求解移動矢量的方法定義在圖10-05中。在求兩個宏塊差值之前,需要找出編碼圖像中的預測圖像編碼宏塊MPI相對於參考圖像中的參考宏塊MRJ所移動的距離和方向,這就是移動矢量(motion vector)。


圖10-5 移動矢量的算法框圖

  要使預測圖像更精度,就要求找到與參考宏塊MRJ最佳匹配的預測圖像編碼宏塊MPI。所謂最佳匹配是指這兩個宏塊之間的差值最小。通常以絕對值AE(absolute difference)最小作爲匹配判據,
   , (ij=16)
  有些學者提出了以均方誤差MSE(mean-square error)最小作爲匹配判據,
   , (ij=16)
  也有些學者提出以平均絕對幀差MAD(mean of the absolute frame difference)最小作爲匹配判據,
   , (ij=16)
其中,dx和dy分別是參考宏塊MRJ的移動矢量d(dx,dy)在X和Y方向上的矢量。
  從以上分析可知,對預測圖像的編碼實際上就是尋找最佳匹配圖像宏塊,找到最佳宏塊之後就找到了最佳移動矢量d(dx,dy)。
  爲減少搜索次數,現在已開發出許多簡化算法用來尋找最佳宏塊,下面介紹其中的三種。
  1. 二維對數搜索法(2D-logarithmic search)
  這種方法採用的匹配判據是MSE爲最小。它的搜索策略是當沿着最小失真方向搜索。二維對數搜索方法如圖10-06所示。在搜索時,每移動一次就檢查5個搜索點。如果最小失真在中央或在邊界,就減少搜索點之間的距離。在這個例子中,步驟1,2,…,5得到的近似移動矢量d爲(i,j-2)、(i,j-4)、(i+2,j-4)、(i+2,j-5)和(i+2,j-6),最後得到的移動矢量爲d(i+2,j-6)。


圖10-06 二維對數搜索法

  2. 三步搜索法(three-step search)
  這種搜索法與二維對數搜索法很接近。不過在開始搜索時,搜索點離(i,j)這個中心點很遠,第一步就測試8個搜索點,如圖10-07所示。在這個例子中,點(i+3,j-3)作爲第一個近似的移動矢量d1;第二步,搜索點偏離(i+3,j-3)較近,找到的點假定爲(i+3,j-5);第三步給出了最後的移動矢量爲d(i+2,j-6)。本例採用MAD作爲匹配判據。


圖10-07 三步搜索法

  3. 對偶搜索法(conjugate search)
  這是一個很有效的搜索方法,該法使用MAD作爲匹配判據,示於圖10-08。在第一次搜索時,通過計算點(i-1,j)、(i,j)和(i+1,j)處的MAD值來決定i方向上的最小失真。如果計算結果表明點(i+1,j)處的MAD爲最小,就計算點(i+2,j)處的MAD,並從(i,j),(i+1,j)和(i+2,j)的MAD中找出最小值。按這種方法一直進行下去,直到在i方向上找到最小MAD值及其對應的點。
  在這個例子中,假定在i方向上找到的點爲(i+2,j)。在i方向上找到最小MAD值對應的點之後,就沿j方向去找最小MAD值對應的點,方法與i方向的搜索方法相同。最後得到的移動矢量爲d(i+2,j-6)。


圖10-08 對偶搜索法

  在整個MPEG圖像壓縮過程中,尋找最佳匹配宏塊要佔據相當多的計算時間,匹配得越好,重構的圖像質量越高。

10.2.4 雙向預測圖像B的壓縮編碼算法

  雙向預測圖像B的壓縮編碼框圖如圖10-09所示。具體計算方法與預測圖像P的算法類似,這裏不再重複。


圖10-09 雙向預測圖像B的壓縮編碼算法框圖[5]

10.2.5 電視圖像的結構

  MPEG編碼器算法允許選擇I圖像的頻率和位置。I圖像的頻率是指每秒鐘出現I圖像的次數,位置是指時間方向上幀所在的位置。一般情況下,I圖像的頻率爲2。MPEG編碼器也允許在一對I圖像或者P圖像之間選擇B圖像的數目。I圖像、P圖像和B圖像數目的選擇依據主要是根節目的內容。例如,對於快速運動的圖像,I圖像的頻率可以選擇高一些,B圖像的數目可以選擇少一點;對於滿速運動的圖像I圖像的頻率可以低一點,而B圖像的數目可以選擇多一點。此外,在實際應用中還要考慮媒體的速率。
  一個典型的I、P、B圖像安排如圖10-10所示。編碼參數爲:幀內圖像I的距離爲N=15,預測圖像(P)的距離爲M=3。


圖10-10 MPEG電視幀編排

  I、P和B圖像壓縮後的大小如表10-02所示,單位爲比特。從表中可以看到,I幀圖像的數據量最大,而B幀圖像的數據量最小。

表10-2 MPEG三種圖像的壓縮後的典型值(比特)

圖像類型

I

P

B

平均數據/幀

MPEG-1 CIF 格式(1.15 Mb/s)

150 000

50 000

20 000

38 000

MPEG-2 601 格式(4.00 Mb/s)

400 000

200 000

80 000

130 000

10.3 MPEG-2的配置和等級

  在MPEG-2標準化階段,考慮到要適應不同數據速率設備的應用,MPEG專家組定義了三種質量不同的編碼方式:信噪比可變性(Signal-to-Noise Scalability),空間分辨率可變性(Spatial Scalability)和時間分辨率可變性(Temporal Scalability)。
  信噪比可變性SNR(Signal-to-Noise scalability)是指圖像質量的折中,對於數據率比較低的解碼器使用比較低的信噪比,而對數據率比較高的解碼器則使用比較高的信噪比;空間分辨率可變性(Spatial scalability)是指圖像的空間分辨率的折中,對於低速率的接受器使用比較低的圖像分辨率,而對於數據率比較高的接受器使用比較高的圖像分辨率;時間分辨率可變性(Temporal Scalability)是指圖像在時間方向上分辨率的折中,與空間分辨率類似。
  MPEG-2爲此引入了“配置(Profiles)”和參數“等級(Levels)”的概念。每種配置定義一套新的算法,而每一個等級指定一套參數範圍(如圖像大小、幀速率和位速率)。MPEG-2規定的配置規格如表10-03所示,等級規格如表10-04所示。

表10-03 MPEG-2的配置

配置(Profile)

算法(Algorithms)

High(高檔)

 ●支持由空間分辨率可變配置(Spatial Scalable Profile)提供的所有功能和其他規定功能
 ●子採樣格式:YUV 4:2:2 用於進一步提高圖像質量

Spatial scalable(空間分辨率可變)

 ●支持信噪比可變配置(SNR Scalable Profile)提供的所有功能和空間分辨率可變(Spatial scalable coding)算法(2層)
 ●子採樣格式:YUV:4:2:0

SNR scalable
(信噪比可變)

 ●支持基本配置(Main Profile)提供的所有功能和信噪比可變編碼(SNR scalable coding)算法(2層)
 ●子採樣格式:YUV:4:2:0

Main(基本)

 ●非可變速率編碼算法支持隨機存取,B圖像預測方式
 ●子採樣格式:YUV:4:2:0

Simple(簡化)

 ●除不支持基本配置(Main Profile)提供的B圖像預測功能外,基本配置的其他所有功能都支持
 ●子採樣格式:YUV:4:2:0

表10-04 MPEG-2的等級

等級(Level)

參數(Parameters)

說明

HIGH
(高級)

1920 samples/line

1920 樣本/行

1152 lines/frame

1152 行/幀

60 frames/s

60 幀/秒

80 Mb/s

80 兆比特/秒

HIGH 1440
(高級1440)

1440 samples/line

1440 樣本/行

1152 lines/frame

1152 行/幀

60 frames/s

60 幀/秒

60 Mb/s

60 兆比特/秒

MAIN
(基本級)

720 samples/line

720 樣本/行

576 lines/frame

576 行/幀

30 frames/s

30 幀/秒

15 Mb/s

15 兆比特/秒

LOW
(低級)

352 samples/line

352 樣本/行

288 lines/frame

288 行/幀

30 frames/s

30 幀/秒

4 Mb/s

4 兆比特/秒

  由配置(profile)和參數等級(level)組合起來的MPEG-2所支持的各種電視規格如表10-05所示。前者定義質量的可變性(scalability)和彩色空間分辨率的句法子集,後者定義圖像分辨率和每種配置的最大位速率的參數集。例如,當前使用得最普遍的描述符是MP@ML (Main Profile, Main Level),可譯成“基本配置@基本級電視”或者“基本句法子集@基本參數級”,它指的是具有這種特性的電視:幀速率爲30幀/秒,分辨率爲720×576×30,子採樣格式爲4:2:0,位速率達15 Mb/s。MPEG-2標準期待大多數MPEG-2設備都能夠支持這種電視。又如,MP@HL (Main Profile, High Level)描述符指的是幀速率爲30幀/秒、分辨率爲1920×1152×60、子採樣格式爲4:2:0、位速率達80 Mb/s的HDTV制電視。

表10-05 MPEG-2配置等級和參數級

Level\Profile
(等級\配置)

Simple
(簡化型)

Main(基本型)

SRN Scalability
(信噪比可變型)

Spatial Scalability(空間分辨率可變型)

High(高檔型)

High(高級)

 

4:2:0
1920×1152×60
80 Mb/s
I, P, B

   

4:2:0, 4:2:2
1920×1152×60
80 Mb/s
I, P, B

High-1440(高級1440)

 

4:2:0
1440×1152×60
60 Mb/s
I, P, B

 

4:2:0
1440×1152×60
60 Mb/s
I, P, B

4:2:0, 4:2:2
1440×1152×60
60 Mb/s
I, P, B

Main(基本級)

4:2:0
720×576×30
15 Mb/s
I, P

4:2:0
720×576×30
15 Mb/s
I, P, B

4:2:0
720×576×30
15 Mb/s
I, P, B

 

4:2:0
720×576×30
20 Mb/s
I, P, B

Low(低級)

 

4:2:0
352×288×30
4 Mb/s
I, P, B

4:2:0
352×288×30
4 Mb/s
I, P, B

   

10.4 MPEG-4電視圖像編碼

  MPEG Video專家組建立了一個用來開發圖像和電視圖像編碼技術的模型,叫做“試驗模型(Test Model)”或者叫做“驗證模型(VM—Verification Model)”。這個模型描述了一個核心的編碼算法平臺,包括編碼器、解碼器以及位流(bitstream)的語法和語義。本節就電視圖像的編碼和解碼的基本方法作一個簡單介紹,其他內容請看本章所附的參考文獻和站點。

10.4.1 電視圖像對象區的概念

  MPEG-4 Video編碼算法支持由MPEG-1和MPEG-2提供的所有功能,包括對各種輸入格式下的標準矩形圖像、幀速率、位速率和隔行掃描圖像源的支持。MPEG-4 Video算法的核心是支持內容基(content-based)的編碼和解碼功能,也就是對場景中使用分割算法抽取的單獨的物理對象進行編碼和解碼。MPEG-4 Video還提供管理這些電視內容的最基本方法。
  爲了實現預想的內容基交互等功能,MPEG-4 Video驗證模型引進了一個叫做“電視圖像對象區(Video Object Plane,VOP)”的概念。如圖10-11所示,上圖表示支持MPEG-1和MPEG-2的普通的MPEG-4編碼器,下圖表示MPEG-4的甚低速率電視圖像(Very Low Bitrate Video,VLVB)的核心編碼器。MPEG-4 Video驗證模型不像MPEG-1/-2 Video那樣把電視圖像都認爲是一個矩形區,而是假設每幀圖像被分割成許多任意形狀的圖像區,每個區都有可能覆蓋描述場景中感興趣的物理對象或者內容,這種區被定義爲圖像對象區VOP。


圖10-11 普通MPEG-4編碼器和MPEG-4 VLBV核心編碼器[6]

  編碼器輸入的是任意形狀的圖像區,圖像區的形狀和位置也可隨幀的變化而改變。屬於相同物理對象的連續的電視圖像對象區(VOP)組成電視圖像對象(Video Objects,VO)。例如,一個沒有背景圖像的正在演講的人,如圖10-11所示。MPEG-4可單獨對屬於相同電視圖像對象(VO)的電視圖像區(VOP)的形狀、移動(motion)和紋理(texture)信息進編碼和傳送,或者把它們編碼成一個單獨的電視圖像對象層(Video Object Layer,VOL)。此外,需要標識每個電視圖像對象層(VOL)的信息也包含在編碼後的位流(bitstream)中,這些信息包括各種電視圖像對象層(VOL)的電視圖像在接收端應該如何進行組合,以便重構完整的原始圖像序列。這樣就可以對每個電視圖像對象區(VOP)進行單獨解碼,提供了管理電視圖像序列的靈活性。

10.4.2 電視圖像編碼方案

  MPEG-4 Video驗證模型對每個電視圖像對象(VO)的形狀、移動和紋理信息進行編碼形成單獨的VOL層,以便能夠單獨對電視圖像對象(VO)進行解碼。如果輸入圖像序列只包含標準的矩形圖像,就不需要形狀編碼,在這種情況下,MPEG-4 Video使用的編碼算法結構也就與MPEG-1和MPEG-2使用的算法結構相同。
  MPEG-4 Video驗證模型對每個電視圖像對象區(VOP)進行編碼使用的壓縮算法是在MPEG-1和MPEG-2 Video標準的基礎上開發的,它也是以圖像塊爲基礎的混合DPCM和變換編碼技術(hybrid DPCM/Transform coding)。MPEG-4編碼算法也定義了幀內電視圖像對象區(Intra-Frame VOP,I-VOP)編碼方式和幀間電視圖像對象區預測(Inter-frame VOP prediction,簡寫爲P-VOP)編碼方式,它也支持雙向預測電視圖像對象區(B-directionally predicted VOP,B-VOP)方式。在對電視圖像對象區(VOP)的形狀編碼之後,顏色圖像序列分割成宏塊進行編碼,如圖10-12所示。圖中的Y1、Y2、Y3和Y4表示亮度宏塊,U、V分別表示紅色差和藍色差宏塊。


圖10-12 電視圖像序列中的I-VOP和P-VOP編碼方式和宏塊結構

  圖10-13描繪了MPEG-4 Video的編碼算法,用來對矩形和任意形狀的輸入圖像序列進行編碼。這個基本編碼算法結構圖包含了移動矢量(motion vector)的編碼,以及以離散餘弦變換爲基礎的紋理編碼。


圖10-13 MPEG-4 Video編碼器的算法方框圖[6]

  MPEG-4採用內容基編碼方法的一個重要優點是,使用合適的和專門的對象基移動預測工具(object-based motion prediction tools)可以明顯提高場景中某些電視圖像對象的壓縮效率。
  圖10-14表示MPEG-4對電視圖像序列進行編碼的一個實際例子。左上角的圖是背景全景圖。右上角的圖是一個沒有背景的子圖像全景圖,可以把網球運動員當作是一個電視圖像對象(VO),經常把這種可以獨立移動的小圖像稱爲子圖像(sprite)。下面的圖是接收端合成的全景圖。在編碼之前這個子圖像全景圖從背景全背景圖序列中抽出來,然後分別對它們進行編碼、傳送和解碼,最後再合成。


圖10-14 MPEG-4電視序列編碼舉例[6]

10.4.3 電視圖像分辨率可變編碼

  “電視圖像分辨率”是指電視圖像空間分辨率(spatial resolution)和時間分辨率(temporal resolution)。空間分辨率是指一幀圖像包含的行數與每行顯示的像素數之乘積,而時間分辨率是指每秒種顯示或者傳輸的圖像幀數。設置電視圖像分辨率可變編碼功能的一個重要目的是爲了能夠靈活支持性能不同(例如不同帶寬)的各種電視接收或顯示設備,或者支持要求瀏覽電視數據庫等方面的應用。另一個目的是提供分層次的電視圖像數據位流,這樣可按應用所要求的先後次序進行傳輸。
  MPEG-2也有電視圖像分辨率可變編碼功能,但它是以圖像的幀爲基礎進行編碼。而MPEG-4電視圖像分辨率可變編碼是以任意形狀的電視圖像對象區(VOP)爲基礎進行編碼。對那些沒有能力或者不願意接收高分辨率圖像的接收器,它可以接收分辨率比較低的電視圖像,降低空間分辨率或者時間分辨率意味降低圖像的質量。
  空間分辨率可變性(Spatial Scalability)和時間分辨率可變性(Temporal Scalability)的實現方法類似。圖10-15描述了多種分辨率電視圖像編碼(multiscale video coding)方案。該方案提供三個層次的編碼/解碼,每一層都支持在不同空間分辨率下進行編碼/解碼。從圖中可以看到,多種空間分辨率的實現是通過降低輸入電視信號的採樣率來獲得的。


圖10-15 VOP空間分辨率可變編碼方法[3]

10.5 HDTV格式

  現在我們使用的電視格式再加上新制定的電視格式歸納在圖10-16中。圖中,K=1024。px表示像素(pixel)。美國把1280×720格式稱爲高級電視ATV(advanced television),把1920×1035稱爲高清晰度電視HDTV(high definition television)。


圖10-16 數字電視格式

  1995年11月28日美國高級電視委員會(Advanced Television Systems Committee,ATSC)向FCC諮詢委員會(FCC Advisory Committee)提交了數字電視標準(Digital Television Standard),並推薦作爲高級電視廣播標準。該標準的電視掃描格式如表10-06所示。

表10-06 電視掃描格式

垂直方向行數

水平方向像素

長寬比

圖像速率

1035

1920

16:9

60I* 30P* 24P*

720

1280

16:9

60P 30P 24P

480

704

16:9和4:3

60I 60P 30P 24P

480

640

4:3

60I 60P 30P 24P

  * I表示隔行掃描;P表示非隔行掃描
  ** HDTV的長寬比爲16:9; NTSC, PAL和SECAM爲4:3
  *** 支持整數和非整數幀速率(60.00, 59.94;30.00, 29.97;24.00, 23.98)
  電視圖像壓縮以MPEG-2 Video標準爲基礎,採樣基本型配置(Main Profile),等級從基本級(Main Level)到高級(High Level)。聲音壓縮以AC-3系統爲基礎,採樣頻率爲48 kHz,支持5個環繞聲和1個超低頻聲道。該規格是1996年介紹的,由於近年來MPEG電視和聲音標準的研究已有新的進展,因此該規格有可能在實行過程中會作修改。

練習與思考題

  • 電視圖像數據壓縮的依據是什麼?
  • MPEG-1編碼器輸出的電視圖像的數據率大約是多少?
  • MPEG專家組在制定MPEG-1/-2 Video標準時定義了哪幾種圖像?哪種圖像的壓縮率最高?哪種圖像的壓縮率最低?
  • 有人認爲“圖像壓縮比越高越好”。你對這種說法有何看法?
  • 有人說“MPEG-1編碼器的壓縮比大約是200:1”。這種說法對不對?爲什麼?
  • 說明電視規格MP@ML和HP@HL各自的含義。
  • 電視圖像的空間分辨率和時間分辨率是什麼意思?
參考文獻和站點
  1. http://ee.mokwon.ac.kr/~music/tutorials/mmbook/node31.html (瀏覽日期:1998年11月)
  2. http://www.rahul.net/jfm/avi.html (瀏覽日期:1998年11月)
  3. http://wwwam.hhi.de/mpeg-video/standards/ (瀏覽日期:1998年11月)
  4. http://www.c-cube.com/technology/mpeg.html (瀏覽日期:1998年11月)
  5. http://fas.sfu.ca/cs/undergrad/CourseMaterials/CMPT365/material/notes/contents.html(瀏覽日期1998年3月)
  6. ISO/IEC JTC1/SC29/WG11 N2459. MPEG-4 Overview - (Atlantic City Version). October 1998/Atlantic City
  7. Ming Liou. Overview of the p×64 Kbps Video Coding Standard. Communication of the ACM,Vol.34,No.4,Apr.1991
  8. ISO/IEC. CD 11172,Coding of Moving Pictures and Associated Audio For Digital Storage Media at up to about 1.5 M b/s. 12/6/1991
  9. Didier Le Gall. MPEG: A Video Compression Standard for Multimedia Applications. Communications of the ACM,Vol.34,No.4,Apr.1991
  10. CCITT Recommendation. H.261,Video Codec for Audiovisual Service at p×64 b/s. Aug.1990
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章