YUV詳解

YUV主要用於優化彩色視頻信號的傳輸,使其向後相容老式黑白電視。與RGB視頻信號傳輸相比,它最大的優點在於只需佔用極少的頻寬(RGB要求三個獨立的視頻信號同時傳輸)。其中“Y”表示明亮度(Luminance或Luma),也就是灰階值;而“U”和“V” 表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用於指定像素的顏色。“亮度”是透過RGB輸入信號來建立的,方法是將RGB信號的特定部分疊加到一起。“色度”則定義了顏色的兩個方面─色調與飽和度,分別用Cr和CB來表示。其中,Cr反映了RGB輸入信號紅色部分與RGB信號亮度值之間的差異。而Cb反映的是RGB輸入信號藍色部分與RGB信號亮度值之同的差異。

  採用YUV色彩空間的重要性是它的亮度信號Y和色度信號U、V是分離的。如果只有Y信號分量而沒有U、V分量,那麼這樣表示的圖像就是黑白灰度圖像。彩色電視採用YUV空間正是爲了用亮度信號Y解決彩色電視機與黑白電視機的兼容問題,使黑白電視機也能接收彩色電視信號。

  對於數字視頻,定義了從 RGB 到兩個主要 YUV 的轉換。這兩個轉換都基於稱爲 ITU-R Recommendation BT.709 的規範。第一個轉換是 BT.709 中定義用於 50-Hz 的較早的 YUV 格式。它與在 ITU-R Recommendation BT.601 中指定的關係相同, ITU-R Recommendation BT.601 也被稱爲它的舊名稱 CCIR 601。這種格式應該被視爲用於標準定義 TV 分辨率 (720 x 576) 和更低分辨率視頻的首選 YUV 格式。它的特徵由下面兩個常量 Kr 和 Kb 的值來定義:

  Kr = 0.299Kb = 0.114第二個轉換爲 BT.709 中定義用於 60-Hz 的較新 YUV 格式,應該被視爲用於高於 SDTV 的視頻分辨率的首選格式。它的特徵由下面兩個不同的常量值來定義:

  Kr = 0.2126Kb = 0.0722從 RGB 到 YUV 轉換的定義以下列內容開始:

  L = Kr * R + Kb * B + (1 – Kr – Kb) * G然後,按照下列方式獲得 YUV 值:

  Y = floor(2^(M-8) * (219*(L–Z)/S + 16) + 0.5)U = clip3(0, 2^M-1, floor(2^(M-8) * (112*(B-L) / ((1-Kb)*S) + 128) + 0.5))V = clip3(0, 2^M-1, floor(2^(M-8) * (112*(R-L) / ((1-Kr)*S) + 128) + 0.5))其中

  M 爲每個 YUV 樣例的位數 (M >= 8)。

  Z 爲黑電平變量。對於計算機 RGB,Z 等於 0。對於 studio 視頻 RGB,Z 等於 16*2,其中 N 爲每個 RGB 樣例的位數 (N >= 8)。

  S 爲縮放變量。對於計算機 RGB,S 等於 255。對於 studio 視頻 RGB,S 等於 219*2。

  函數 floor(x) 返回大於或等於 x 的最大整數。函數 clip3(x, y, z) 的定義如下所示:

  clip3(x, y, z) = ((z < x) ? x : ((z > y) ? y : z))Y 樣例表示亮度,U 和 V 樣例分別表示偏向藍色和紅色的顏色偏差。Y 的標稱範圍爲 16*2 到 235*2 。黑色表示爲 16*2 ,白色表示爲 235*2 。U 和 V 的標稱範圍爲 16*2 到 240*2 ,值 128*2 表示中性色度。但是,實際的值可能不在這些範圍之內。

  對於 studio 視頻 RGB 形式的輸入數據,要使得 U 和 V 值保持在 0 到 2M-1 範圍之內,必需進行剪輯操作。如果輸入爲計算機 RGB,則不需要剪輯操作,這是因爲轉換公式不會生成超出此範圍的值。

  這些都是精確的公式,沒有近似值。

  在DirectShow中,常見的RGB格式有RGB1、RGB4、RGB8、RGB565、RGB555、RGB24、RGB32、ARGB32等;常見的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。

 

 

主要的採樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用,其含義爲:每個點保存一個 8bit 的亮度值(也就是Y值),每 2x2 個點保存一個 Cr 和Cb 值, 圖像在肉眼中的感覺不會起太大的變化。所以, 原來用 RGB(R,G,B 都是 8bit unsigned) 模型, 1個點需要 8x3=24 bits(如下圖第一個圖),(全採樣後,YUV仍各佔8bit)。按4:1:1採樣後,而現在平均僅需要 8+(8/4)+(8/4)=12bits(4個點,8*4(Y)+8(U)+8(V)=48bits), 平均每個點佔12bits(如下圖第二個圖)。這樣就把圖像的數據壓縮了一半。

  上邊僅給出了理論上的示例,在實際數據存儲中是有可能是不同的,下面給出幾種具體的存儲形式:

  (1) YUV 4:4:4

  YUV三個信道的抽樣率相同,因此在生成的圖像裏,每個象素的三個分量信息完整(每個分量通常8比特),經過8比特量化之後,未經壓縮的每個像素佔用3個字節。

  下面的四個像素爲: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流爲: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

  (2) YUV 4:2:2

  每個色差信道的抽樣率是亮度信道的一半,所以水平方向的色度抽樣率只是4:4:4的一半。對非壓縮的8比特量化的圖像來說,每個由兩個水平方向相鄰的像素組成的宏像素需要佔用4字節內存。

  下面的四個像素爲:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流爲:Y0 U0 Y1 V1 Y2 U2 Y3 V3

  映射出像素點爲:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

  (3) YUV 4:1:1

  4:1:1的色度抽樣,是在水平方向上對色度進行4:1抽樣。對於低端用戶和消費類產品這仍然是可以接受的。對非壓縮的8比特量化的視頻來說,每個由4個水平方向相鄰的像素組成的宏像素需要佔用6字節內存。

  下面的四個像素爲: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流爲: Y0 U0 Y1 Y2 V2 Y3

  映射出像素點爲:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

  (4)YUV4:2:0

  4:2:0並不意味着只有Y,Cb而沒有Cr分量。它指得是對每行掃描線來說,只有一種色度分量以2:1的抽樣率存儲。相鄰的掃描行存儲不同的色度分量,也就是說,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0...以此類推。對每個色度分量來說,水平方向和豎直方向的抽樣率都是2:1,所以可以說色度的抽樣率是4:1。對非壓縮的8比特量化的視頻來說,每個由2x2個2行2列相鄰的像素組成的宏像素需要佔用6字節內存。

  下面八個像素爲:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  [Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

  存放的碼流爲:Y0 U0 Y1 Y2 U2 Y3

  Y5 V5 Y6 Y7 V7 Y8

  映射出的像素點爲:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

  [Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章