白話文理解DCT離散餘弦變換

DCT全稱爲Discrete Cosine Transform,即離散餘弦變換。DCT變換屬於傅里葉變換的一種,常用於對信號和圖像(包括圖片和視頻)進行數據壓縮的基礎。

在視頻壓縮歷史上重要的發明之一就是DCT。沒有DCT,後面的H.26X, JPEG等一系列壓縮標準將無從談起。

DCT有比較複雜的數學公式,我們這裏僅做簡單理解:

如下圖,下圖是個一張圖中的一部分(3*3的像素塊)

0
對這個像素矩陣做DCT,相當於將矩陣的能量壓縮到第一個元素中,被稱爲直流(DC)係數。其餘的係數被稱爲交流(AC)係數。這意味着輸出的二維DCT的左上角被稱爲DC係數。它是DCT最重要的輸出,包含了很多關於原始圖像的信息。其餘的係數被稱爲交流係數(AC coefficients)。如果你使用DCT對圖像進行轉換,AC係數包含了圖像的更多細節。同時,如果把這些DCT係數應用於反向的2D-DCT,將得到原始係數。DCT本身並不會壓縮數據,它爲隨後的量化之類的操作,提供了一個良好的基礎。
相當於把除了第一個格的部分信息(特徵)都抽取了一部分到第一個格

第一個格的像素值就是這個圖像塊的低頻信息,其餘格的就是圖像的高頻信息
低頻信息表示的是一張圖的總體樣貌。一般低頻係數的值也比較大。而高頻信息主要表示的是圖像中人物或物體細節。高頻係數的數量多,做完了 DCT 變換之後,低頻和高頻信息就分離開來了。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章