圖像壓縮編碼和解碼原理——闡述了DCT變換的實質

轉自:http://blog.csdn.net/wishfly/article/details/52066859

本節介紹圖像壓縮編碼的基本原理,圖像數據壓縮和解壓縮電路的基本結構。它們是看影碟機電路圖的基礎知識。

  一、圖像壓縮的基本途徑

  圖像的數據量極大,必須對其數據總量大大壓縮,才能夠存儲在直徑12cm的光盤上。在實用技術上,可通過以下途徑來壓縮圖像數據的總量。

  1、採用亮度(Y)、色度(C)取樣方式

  實用彩色電視技術沒有傳輸、處理紅、藍、綠三基色信號,而傳輸、處理亮度信號Y和色度信號C。這種處理方法有利於實現彩色電視和黑白電視的兼容,也利於限制彩色電視信號的頻帶寬度。在數字圖像處理技術中,仍然採用傳輸、處理亮度信號Y和色度信號C的方法。由於人眼晴對亮度信息敏感,對彩色信息不夠敏感,因而對Y信號以較高清晰度傳送,對C信號以較低清晰度傳送。實際作法是這樣的:對每個亮度Y像素都進行傳送;而將色度C分解爲U、V兩個色差信號(或寫爲Cb、Cr、B-Y、R-Y),分別進行傳送;對亮度Y實行逐點取樣,而對色度C則取樣較少。即對應於4個亮度取樣點,僅對色度信號取樣1個點,即對U、V像素的取樣較低,各取1個取樣點,這種取樣格式稱爲YUV411格式。

  採用YUV411取樣格式後,它的數據總量將比三基色取樣量格式時減少一半。若採用三種基色取樣方式時,各基色應與亮度信號取樣方式一樣,即對每個紅、綠、藍色採取逐點取樣的方法。採用Y、C傳輸方式時,取樣次數減少一半,傳輸數碼也減少一半。人眼睛對色度的敏感程度較低,利用人眼睛這一生理視覺特性,人們在主觀感覺上並沒有感到圖像清晰度下降。顯然,這是壓縮圖像數據碼率的一個得力措施。

  2、將整幅圖像分割爲小區域進行分割處理

  對圖像進行數據處理時,對每幀圖像進行分割處理。首先圖像橫向切成若干條,每一條稱爲一片,將每一片再縱向切成若干塊,稱宏塊,宏塊是圖像壓縮的基本單位。每個宏塊的彩色圖像可用1個亮度信號Y和兩個色差信號Cb、Cr(即U、V)來表示,或者說,每個宏塊分爲三層,一層亮度Y,兩層色度(各爲Cb、Cr),統稱爲一個宏塊。

  由於人眼睛對亮度、色度的主觀敏感程度不同,通常把亮度宏塊再平均分成4塊,每一小塊稱爲像塊或區塊,詳見示意圖2.2.1。每個區塊可以進一步分割,稱爲像素或像點,像素是構成圖像的最小單位。對於數字圖像來說,每一個像素作爲一個取樣點,有一個對應的取樣數值。可以看出,圖像分割越細,像素數越多,取樣點越多,圖像清晰度越高;反之,像素數越少,圖像清晰度越低。實際上,對圖像壓縮處理,就是對圖像區塊的數據、像素的數據進行壓縮處理。

  彩電制式不同,分割圖像的具體數據將有所變化。例如PAL制,大多數爲625行掃描標準,那麼每幀圖像被切爲18片,每片再切成22個宏塊,即每幀圖像分成396個宏塊;而525行的NTSC制,每幀圖像被切爲15片,每片再切成22個宏塊,即每幀圖像分成330個宏塊。對亮度信號來說,每個宏塊又分爲4個區塊,每個區塊含有8×8=64個像素,則每個宏塊含有256個像素。但對兩個色差信號來說,宏塊像素數等於區塊像素數,即像素數是8×8=64個,是亮度像素的1/4。儘管兩色差信號的像素較少,清晰度低,但不影響人眼睛的主觀感覺。在進行數字圖像處理時,按照圖中各個8×8方塊( 共64塊) 編成次序,再按照編號順序依次處理。也就是說,以8×8像素的方塊作基本操作單元,依次處理每個像素(即取樣點)的取樣數值。

  3、採用幀間和幀內數據壓縮技術。

  實用電視每秒鐘傳送25-30幀畫面,使畫面變化具有連續感,電視活動圖像是由各幀畫面差別很小的一系列畫面組成的。各幀畫面的微小變化主要表現於畫面主體部分,畫面的背景差別很小。圖像是由亮度、色度信息來描述的,在各相鄰幀圖像內,若分別比較同一相對位置的亮度、色度信號,通常其差別較小。經大量統計發現,在各個像素當中僅有10%以下的像素點的亮度差值變化超過去時2%,而色度差值變化在0.1%以下。在各幀圖像中具有大量重複內容,這些重複內容的數據屬於多餘(冗餘)信息,於是,可以通過減少時域冗餘信息的方法,即運作幀間數據壓縮技術,來減少圖像傳輸的數碼率。

  經分析發現,在同一幀畫面內也存在相當多的冗餘信息。對圖像主體部分和眼睛最敏感的部分,應當準確、詳細地處理,需要對每個像素點進行精細傳輸;但對於圖像非主體部分和眼睛不敏感的部分,則可以進行粗略地處理,即進行信息數據的壓縮處理。於是,可以根據一幀圖像內容的具體分佈情況,對不同位置可採用不同的數據量來傳送,減少傳送圖像的數據量,使圖像數據得到壓縮。這種壓縮數據的方法,是在同一幀圖像的不同空間部位進行數據壓縮,稱爲空間域冗餘壓縮。例如,有一幅人像畫面,其面部和頭部的線條清晰度可以不相同,尤其是眼睛、嘴脣部位表情豐富,線條比較精細複雜,是觀衆最注意的部位,應當用高清晰度傳送;而頭頂部位和麪頰側面,輪廓變化較少,灰度層次變化較小,觀衆不太注意這些部位。顯然,圖像的主要部位,灰度層次變化較大的部位,人眼睛敏感的部位,應當以較大數據量進行精細傳送;而那些圖像的次要部位,灰度層次變化較小的部位,人眼睛不注意的部位,則可用較少數據量進行粗略傳送,甚至於僅僅傳送它們的平均亮度信息。

  以下具體討論數字圖像的數據壓縮原理。先討論靜止圖像的數據壓縮技術,即幀內數據壓縮技術;然後討論活動圖像的數據壓縮技術,即幀間數據壓縮技術。

  二、幀內數據壓縮技術

  首先對整幅圖像進行分割處理,經分割取得最小操作單元。下面按8×8=64個像素組成的區塊來計論。每一個像素值都可以按一定規律取樣,例如可對亮度各個像素的亮度值取樣,若每個像素按8bit量化,則每個區塊的總數據量爲8bit×64(像素點),即512bit。可見,對全畫面各像素量化處理後數據量十分龐大,需要進行數據壓縮。通常,經過離散餘弦變換,Z字型掃描,可變長度編碼等處理過程,可將數據總量進行大量壓縮。

  1、離散餘弦變換(DCT)編碼

  (1) 功能簡述

  離散餘弦變換簡稱爲DCT(是英Discrete Cosine Transform的縮寫詞),是一種數字處理方法,經常用於數據處理。DCT是多種數字變換方法的一種,它是把空間域圖像變換到頻率域進行分析的方法。由於DCT的變換核構成的基向量與圖像內容無關,而且變換核是可以分離的,既二維DCT可以用兩次一維DCT來完成,使得數學運算難度大大簡化,再配以已經發現的其它快速算法,使得DCT編碼得到了廣泛的應用。將DCT應用於圖像數據壓縮,可以減少代表圖像亮度(或色度)層次數碼信息,達到數據壓縮的目的。利用DCT不僅可將圖像編碼,還可以在編碼變換過程發現圖像細節的位置,以便刪去或略去對視覺不敏感的部分,而更加突出視覺的敏感部分,通過選擇主要數據來傳輸、重視圖像。

  利用DCT壓縮圖像數據,主要是根據圖像信號在頻率域的統計特性。在空間域看來,圖像內容千差萬別;但在頻率域上,經過對大量圖像的統計分析發現,圖像經過DCT變換後,其頻率係數的主要成分集中於比較小的範圍,且主要位於低頻部分。利用DCT變換揭示出這種規律後,可以再採取一些措施把頻譜中能量較小的部分捨棄,儘量保留傳輸頻譜中主要的頻率分量,就能夠達到圖像數據壓縮目的。

  (2)規律和特點

  ①時間域信號的頻譜

  對於一個隨時間變化的波形來說,它是隨時間變化的週期信號,它是以一定幅度值爲波形的直流平均值,其波形可看成是基波與無數次諧波疊加而成。其基波振幅最大,然後各次諧波振幅逐漸減小。各次諧波疊加次數越高,則合成波形越接近於理想矩形波。此分析方法就是應用日益廣泛的頻譜分析方法。其中各次正弦波諧波的振幅值經常稱爲頻譜系數,將頻譜系數排列起來,可以組成一個係數列。上述事實說明,週期性矩形波可以由時間域 (反映幅度-時間關係)來描述,也可以由頻率域(幅度-頻率關係)來描述。兩者有互相對應的關係。實際上,各種時間域信號都可以由頻率域的規律來描述,兩種描述方法存在內在的聯繫,可以互相轉換。

  ②空間域信號的頻譜系數

  對於各種空間域分佈的信號,也可以進行類似的頻率變換,即將空間域信號轉變爲頻率域信號。DCT就是其中一種頻率分析方法。可參閱圖2.2.2來說明DCT變換過程。

  由圖像內取出一個區塊,分成8×8個像素的64格陣列,即由圖(a)轉變爲圖(b)。經過對逐個像素的亮度(或討論色度)數值取樣,並將像素的亮度數值列成矩陣形表格,見圖(C)。然後利用離散餘弦變換(DCT)可將各空間取樣值轉變爲頻率域的數值,這裏稱爲DCT係數。

  對於上述64點陣列來說,可得到64個DCT係數,轉換爲圖(d)矩形陣列表格。它已經將64個點的圖像採樣值組成的陣列,變爲一個直流平均值和63個不同頻率餘弦波幅值組成的64個點陣列,並稱爲DCT係數陣列。經過上述變換後,已將空間座標的數據轉換爲頻率座標的數據,即DCT頻率係數。原有8×8區塊的各個像素的數值取樣量化後,轉變爲頻率域圖像信號的頻譜系數,即可用64個頻率係數來表述,稱它們爲64個“正交基信號”,每個基信號對應於64個獨立二維空間頻率中的一個。這些空間頻率是由輸入信號的“頻譜”組成。所得64個變換系數當中,第一項代表直流分量,即64個空間圖像採樣值的平均值,其餘63個係數代表各基信號的幅度。

  觀察圖2.3.2(d)數據可發現規律,矩陣左上角的數值較大,而右下角的數值較小,且趨近於零值。於是,可以按照Z字形掃描順序,將各基信號的DCT係數列成一個表格。Z字形掃描的具體軌跡,如圖2.3.2(e)所示。按照此規律將DCT係數排列成數據系列,成爲DCT係數編碼順序。經過上述處理後,已將二維數據量轉換爲一維數據量,該數列第一項是該區塊的平均亮度值,後面各項係數的分佈和大小可以反映亮度起伏變化的劇烈程度。若係數較大,說明亮度起伏較大,該區域圖像輪廓較細緻;若數值較小,則說明該區內亮度變化較平緩;若數值爲零,表示數列中高頻分量數值爲零,亮度電平無變化。在實際數據處理過程中,排在後面的係數值基本上都有是零值,或者趨於零值。由63個係數集合及變化情況,可反映出該區塊內圖像細節情況,即圖像清晰度狀況。

  圖(d)矩陣數值非常具有實用價值。左上角數值較大,它們代表了圖像信息的直流成分和低頻分量,它是圖像信息的主體部分,也是區塊內信息的主要部分;而右下角數值較小,它們代表了圖像信息的高頻分量,其幅值原本就比較小,它主要反映圖像的細節部分。人眼睛對圖像的亮度信息有較高的相對靈敏度,對圖像的彩色信息不夠敏感;還有,人眼睛對圖像信息的低頻分量具有較高的視覺靈敏度。經Z字形字掃描後所形成的數據系列,恰好與人眼睛對圖像信息的敏感程度形成良好的對應關係。根據視覺生理的上述規律,可對圖像數據進行壓縮。

  2、DCT係數的再量化處理

  經過上述DCT處理的頻率數據可以進行再處理,進一步壓縮數據量。人眼睛對各種頻率的敏感程度不同,並可取得統計性靈敏度數值。由此可對每種頻率分量設定不同的折算值,將前述經轉換得到的DCT係數再次進行折算,以便進一步突出視覺效果影響大的成分,而消弱或忽略視覺效果影響小的成分。這種處理方法稱爲量化處理,簡稱Q處理。對於64點陣列的64個係數來說,對應了64種不同頻率,可使用64個不同的折算值。通常稱這64個折算值爲量化表,每個折算值稱爲量化步長,或稱量化值。在64點陣列中,左上角的數據量化值較小,右下角的數據量化值較大。對DCT係數的再量化處理,可利用量化器電路來實現。該電路可將區塊的64個係數分別除以量化表中對應位置量化步長,再進行四捨五入取整後,即可得到經過再量化處理的64個數據值。

  經過量化處理後,量化值大的係數值所得商值較小,也就是數據壓縮比較大,原圖像相應部分的忽略內容較多;量化值小的係數所得商數值較大,也就是數據壓縮比較小,原圖像相應部分不予忽略或極小忽略。於是,經過量化處理後的DCT係數矩陣,可出現許多零值。一般左上角位置的數據的商數是非0,在右下角位置的數據的商數很小,經四捨五入取整值後可簡寫爲0。在係數矩陣上出現了許多0值,則大大減少了數據量。一方面保留了圖像信息的主體部分,另一方面大大壓縮了像數據。

  3.可變長度編碼(VLC)

  經量化處理的係數矩陣出現了許多0值,若進行Z字形掃描時,後面的係數將也出現連續0的狀況。此時,數據傳輸總量已經明顯減少,但碼位並未減少,仍爲64個係數位。爲了進一步壓縮數據總量,可採用可變長度編碼,並簡稱VLC(Variable Length Coding)。

  通常,採用兩種方法進行可變長度編碼。第一種,是根據數據出現的頻率,分配以不同長度的碼字來代替,對於頻繁出現的數據,分配以較短的碼字,那些不經常出現的數據,則賦予較長的碼字,這樣處理後可減少傳輸的總碼率。第二種方法,雖然Z字形掃描使係數列尾部出現多個0個值,但不需要逐位地傳輸0值,僅需傳送表0的“個數”碼,待重放時再按規定恢復爲0位,以便填滿矩陣的64位。例如00000,則可表示爲50,在解碼時恢復爲00000。

  總之,對於靜止畫面來說,採用離散餘弦變換,Z字形掃描、量化處理和可變長度編碼等方法,可使圖像數據量大大壓縮。在數據解碼時,先經過可變長度解碼,恢復爲數據的固定長度;再對係數進行反量化,恢復爲原來的DCT頻率係數;再經過反向離散餘弦變換,恢復爲圖像的空間座標數值,即原來圖像的數據。

  三、幀間數據壓縮技術

  對於活動圖像來說,相鄰幀的圖像具有強烈的相關性。在保存和記錄動態圖像時,不需要將每一幀圖像的全部信息都記錄和保存下來,可以將前面第一幀圖像全部數據都記錄下來,把它看成是靜態圖像,可用靜態圖像數據壓縮方法來處理。而後面諸幀圖像,可以僅記錄與前面幀圖像有差異的信息。於是,在重放時,利用前面幀圖像的數據和後面幀的差異數據,即可恢復出後面幀的圖像。這種處理方法省去許多數據。

  1、三種畫面

  按照MPEG-1標準,傳送的活動畫面可分爲3種類型。第1種,是場景更換後的第1幀畫面,它是一種獨立的畫面,這種畫面採用較高清晰度的逐點取樣法進行傳送,此畫面稱爲I畫面(內碼幀,或稱幀內編碼幀)。該畫面信息是由自身畫面決定,不必參考其它畫面。該畫面的數據代表了活動圖像的主體內容和背景內容,它是電視畫面的基礎。第2種,是與I畫面相隔一定時間、活動圖像主體位置在同一背景上已發生明顯變化的畫面,此畫面稱P畫面(預測幀,或稱前向預測編碼幀)。該畫面用前面的I畫面作爲參考畫面,該畫面不傳送背景等重複性信息,僅傳送主體變化的差值,這就省略了一部分細節信息,而在重放時依靠幀存儲器將I畫面的主要部分和P畫面的差值進行運算,即可得出新畫面的完整內容,它是既有背景又有現時運動主體狀態的實際畫面。第3種,其情況與P畫面相似,用來傳送在I、P畫面之間的畫面,稱B畫面(雙向預測幀,或稱雙向預測內插編碼幀)。該畫面僅反映在I、P畫面之間的運動主體變化情況,並用位移矢量(或稱運動矢量等)表示畫面主體移動情況。其信息量更小些。因爲在重放它時,既可參考I畫面內容,也要參考P畫面內容,所以稱爲雙向預測幀。

  將一串連續相關的畫面分爲I、P、B型後,傳輸信息量明顯減少。在P、B畫面當中,幾乎不傳送反映實物的象素,僅傳送其主體移動的差值,其具體的處理方法是採用了區塊對比的方法,在兩個變化的畫面當中,將區塊或宏塊作爲處理單元,將一個畫面的宏、區塊與參與 畫面中鄰近範圍內的宏、區塊進行數值運算對比,尋找與該塊最相近、誤差最小的區塊,找到近似的該區塊後,記錄該區塊在兩個畫面中的位移值,即爲位移矢量以及反映兩畫面的差值量。若位移矢量座標變化爲0,說明該塊沒有移動,例如相同的背景景物;若位移矢量值有變化,而區塊差值爲0,則說明景物有移動,而形狀沒有變化,例如飛行中的球類和奔馳的車輛等。可見,位移矢量和區塊差值可在重放時依靠參考畫面得出新畫面的完整場景,而傳送時卻省略了背景和主體內容,只傳送代表位移矢量和差值的少量數據,使圖像得到大量壓縮。

  2、三種畫面的連接

  通常,更換場景後的第一幀就是I幀,I幀應當全幀傳送。從壓縮的程度來看,I畫面的壓縮量最少;P畫面次之,它是以I畫面爲基礎;B畫面壓縮最多。爲了加大壓縮比,通常在I幀後面相隔2幀(最多3幀)設置1個P幀,在I、P幀之間都是B幀,在兩個P幀之間也是設置2~3幀B幀。B幀傳送它與I幀或P幀之間的差值信息,或者P幀與後面P幀或I幀之間的差值信息,或者它與前後I、P幀或P、P幀平均值之間的差值信息。當主體內容變化愈大時,兩個I畫面之間的幀數值越小;當主體內容變化小時,I面畫的間隔可以適當大一些。或者說,B幀、P幀所佔比例越大,圖像壓縮比越高。一般兩個I畫面相隔13~15幀,相隔幀數不宜再多。

  下面以15幀爲例,說明VCD圖像幀的排列順序。I、P、B三種畫面的典型設置方式,對NTSC制共約需半秒時間。節目輸入順序是按實際出現順序排列的,即I、B、B、P、B、B、P、B、B……I、B、B、P……;但爲了解碼時便於從I、P畫面插補得到B畫面,在編碼錄製節目時,將順序改變了,即按照I、P、B、B……順序,即改爲按原來0、3、1、2、*、5、9、7、8…的畫面順序。解碼時先解出0幀、3幀,再由其插補預測計算得出1幀、2幀等等。爲此,須在解碼器內設置動態存儲器,將I、P幀先解碼並存儲,再計算出各個B幀。不過最後輸出時,還是應當按照實際播放順序重組讀出,按正確順序輸出。

  VCD採用的幀間壓縮技術標準,對圖像編碼順序和各幀間隔是有具體規定的。採用幀壓縮技術後,各幀之間的信息冗餘量大大減少,圖像碼率進一步壓縮,壓縮比可達3-20餘倍。

  四、圖像壓縮編碼過程和解壓縮過程

  1、編碼過程

  這裏談談VCD所採用MPEG-1標準的編碼過程。因爲相鄰幀畫面相同或基本相同,將這種畫面羣的第1幅畫面作爲I畫面,將它送入編碼器。編碼器首先將它割裂爲許多片、宏塊、區塊等,將各區塊分割爲8×8=64點陣列,再進行Z字形描述和DCT變換,將64個亮度(或色度)取樣數值變換爲64個DCT係數,再對64個係數值分別進行相應的量化,經量化處理後再進行VLC處理,即得到了代表一個區塊數據的最短的數碼,至此,完成了該畫面羣第1幀的第1列圖像中第1宏塊的編碼。依次類推,可得到第1幀畫面的全部壓縮數據編碼。原爲二維空間的一幀圖像信息已經轉變爲一維空間的串行數據,這些數據被全部存儲起來,成爲繼續進行數據處理的基礎。至此,I畫面數據處理完畢。

  完成第1幀圖像壓縮編碼後,接着輸入第2幀圖像。編碼器按照相同的方法步驟對第2幀進行壓縮編碼,得到第2幀數據。此時,編碼器不再將第2幀數據進行完整的存儲和傳送,而是將它與第1幀數據進行比較運算。若運算中發現,兩幀間數據差別很小時,說明兩幀圖像差別不大,僅將其差值存入存儲器,而舍掉其大部分重複數據。按照此方法再進行第3、第4幀編碼,並進行比較運算,直到找到某一幀,差別較大且超過規定值時,再將此幀數據中與第1幀的差別(包括位移矢量和差值)部分存儲起來,並將此幀數據排在第1幀(I幀)後面傳送出去,該幀就是P畫面。當傳送I、P畫面後,再傳送3、4幀的差別數據,這些畫面都是B畫面。它們之間的差別不大,是處於I、P之間的畫面。按照此程序和方法,可再選出許多組P和B畫面。通常,每隔13~15幀後,再設置一個I畫面,作爲後續畫面的參考基準。如遇到較新的場景,將出現一幅不相同的新畫面,這幅新出現的畫面也作爲I畫面。

  圖2.2.3是MPEG-1圖像壓縮編碼器方框圖。代表亮度Y和色度分量CB、CR的二進制數碼化信號,首先進入幀改組器(或稱幀重排電路),將畫面分割爲片、宏塊、區塊。區塊經過比較

  運算電路再進入DCT電路、量化器、VLC電路,取得已壓縮數據。再將數據送到多路混合器和傳輸緩衝器。傳輸緩衝器用於暫存壓縮數據,並按照控制指令的先後按時序輸出數據。該緩衝器通過調整器(又稱爲量化自適應器)與量化器相連接。調整器可用來檢測緩衝器的緩衝區的數據暫存程度,並根據暫存數據量自動調整量化步長。在編碼器內設置有反饋通路,它主要包括反量化器(Q-1)、離散餘弦逆變換(IDCT)、相加器以及IPB畫面幀存儲器等。反饋迴路用於預測圖像產生,進行畫面分類處理(計算、區分並處理IPB畫面),主要用於幀間數據壓縮編碼處理。還有,運動預測和補償電路可用於運動補償。

  2、圖像解壓縮電路方框圖

  圖像解壓縮電路簡稱爲解壓電路、解碼電路。VCD視盤機內,經過數字信號解調電路(CD-DSP)處理後,輸出壓縮編碼視頻數據流,需要經過視頻解壓縮電路進行數據解壓縮,恢復爲未壓縮的視頻信號。解碼過程是編碼的逆過程,圖2.2.4是MPEG-1視頻解壓縮電路方框圖,其電路結構比編碼器稍簡單一些。

圖2.2.4 MPEG-1視頻解壓縮電路方框圖

  來自CD-DSP電路的壓縮編碼信號送到輸入緩衝器,然後進入去混合電路,將圖像的編碼模式標誌,運動向量(位移矢量)和圖像數據分離開,分別送往幀存儲器和解壓縮主通道電路。

  主通道要處理I、P、B幀數據,這些數據已經按照圖像編碼系列的規定,以數據封包頭標指出,這些數據分別暫存在緩衝存儲器的存儲區內,根據數據量大小暫存在容量不同的存儲器區中。在微處理器控制下,先將I畫面數據按序取出,送到VLC(可變長度碼解調器),按照ROM存放的可變長度碼對照表,逐一將編碼時壓縮的碼位恢復爲壓縮前的DCT量化值,再將各區塊分爲64個數據的量化值逐位乘以反量化參數,這些參數位於ROM中存放的64位視覺心理模式量化表的相對位置,重新恢復爲DCT頻率係數,完成反量化過程。

  經過反量化的數據,再送入IDCT(離散餘弦逆變換)電路。這是另一次逆變換,也是通過查表法,將反量化值所代表的各頻率餘弦分量的幅值進行逆變換,重新恢復爲DCT變換前的圖像(Y、CB、CR)取樣數據,從而取得代表圖像壓縮前的區塊信息。4個區塊的信息組成一個宏區塊,若干個宏區塊組成片,再由若干片組成完整畫面的總數據,這就是I幀畫面。這些繁重的相加工作都需要在加法器中進行。

  恢復出來的I幀畫面數據存入幀存儲器。I畫面與後續輸入的P畫面數據相加,可恢復出P畫面,P畫面也存入幀存儲器。然後根據運動矢量和運動後圖像差值(即B畫面數據),與I、P畫面存儲數據在加法器中相加,並受編碼模式信號的控制,以便決定I、P圖像的成分多少,從而恢復出不同前後的B幀畫面。經以上處理所得I、P、B各種畫面數據都需要存入緩衝存儲器,還要根據編碼模式的指示及輸出制式的幀頻要求,按照I、B、B、P、B、B、P、B、B…B、I、B、B、P、B…的正常順序進行重新編排,按照一定的速度從幀重排電路輸出。輸出的解壓縮數據送到D/A轉換器,轉變爲R、G、B三基色模擬信號。

  通常,在解壓縮電路還要輔設視頻編碼器和調製器。視頻編碼器可將三基色信號編碼爲NTSC/PAL制彩色電視信號,並加入同步、消隱、色同步和彩色副載波信號等,以視頻模擬全電視信號形式輸出。這種輸出形式的信號需要輸送到電視接收機的AV輸入端口。但是,有些老式電視機沒有設置AV輸入端口,爲了適應這種現象,輸出的視頻全電視信號需要再一次進行高頻調製,利用調製器以某個特定頻道的RF調幅形式輸出電視信號。此時,VCD機需要設置RF輸出端口,其輸出信號可直接送到電視機的天線輸入端口。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章