變換編碼(DCT)基本理解

圖像變換編碼是指將以空間域中像素形式描述的圖像轉換至變換域,以變換系數的形式加以表示。

大部分圖像是平坦區域和內容變換緩慢的區域,即大部分是直流和低頻,高頻比較少,所以適當的變換可以使圖像能量在空間域的分散分佈轉換爲在變換域的相對集中分佈,以達到去除冗餘的目的,結合量化,“z”掃描和熵編碼等其他編碼技術,可以獲得對圖像信息的有效壓縮。

DCT變換的基本思路是將圖像分解爲8×8的子塊或16×16的子塊,並對每一個子塊進行單獨的DCT變換,然後對變換結果進行量化、編碼。隨着子塊尺寸的增加,算法的複雜度急劇上升,因此,實用中通常採用8×8的子塊進行變換,但採用較大的子塊可以明顯減少圖像分塊效應。

目前DCT是構成主流緩和編碼框架的一項基本技術,因爲DCT變換形式與輸入信號無關且存在快速實現算法,HEVC沿用了H264的整數DCT,並進行了不同尺寸變換形式推廣,此外,爲適應不同預測方式下殘差的分佈情況,HEVC還引入了DST離散正弦變換。

傅里葉變換表明,任何信號都能表示爲多個不同振幅和頻率的正弦波和餘弦波信號的疊加,如果採用的是餘弦就是餘弦變換,若輸入信號是離散的就是離散餘弦變換。

下圖給出了二維8*8DCT基圖像,其中左上角小圖像表示水平和垂直空間頻率均爲0時的基圖像,在任一方向都木有灰度值的變化;其餘小圖像分別對應於不同水平和垂直空間頻率的基圖像,如基圖像右下角小圖像對應於最高的水平和垂直頻率,這裏像素灰度在水平和垂直方向發生連續變化,因此離散餘弦變換可以解釋爲:將任一8*8像素塊表示爲下圖的64個基圖像中子像素塊的加權和,其權值即爲對應位置的DCT係數

HEVC使用了4種不同尺寸的整數DCT,分別爲4*4、8*8、16*16、32*32

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章