H264--語法及結構--2

---------------

前言

-------------

H264結構中,一個視頻圖像編碼後的數據叫做一幀,一幀由一個片(slice)或多個片組成,一個片由一個或多個宏塊(MB)組成,一個宏塊由16x16的yuv數據組成。宏塊作爲H264編碼的基本單位。

-------------------------

名詞解釋
-------------------------
場和幀 : 視頻的一場或一幀可用來產生一個編碼圖像。在電視中,爲減少大面積閃爍現象,把一幀分成兩個隔行的場。
宏塊 :一個編碼圖像通常劃分成若干宏塊組成,一個宏塊由一個16×16亮度像素和附加的一個8×8 Cb和一個8×8 Cr彩色像素塊組成。
:每個圖象中,若干宏塊被排列成片的形式。片分爲I片、B片、P片和其他一些片。
-- I片只包含I宏塊,P片可包含P和I宏塊,而B片可包含B和I宏塊。
-- I宏塊利用從當前片中已解碼的像素作爲參考進行幀內預測。
-- P宏塊利用前面已編碼圖象作爲參考圖象進行幀內預測。
-- B宏塊則利用雙向的參考圖象(前一幀和後一幀)進行幀內預測。
Ø片的目的是爲了限制誤碼的擴散和傳輸,使編碼片相互間是獨立的。某片的預測不能以其它片中的宏塊爲參考圖像,這樣某一片中的預測誤差纔不會傳播到其它片中去。

-----------------------------------------------

H264/AVC 的分層結構

-----------------------------------------------

H.264的主要目標是:

1
.高的視頻壓縮比;

2
.良好的網絡親和性;

爲了完成這些目標H264的解決方案是:

1.VCL video coding layer
視頻編碼層;

2.NAL network abstraction layer
網絡提取層;

其中,VCL層是對核心算法引擎,塊,宏塊及片的語法級別的定義,他最終輸出編碼完的數據 SODB;

NAL層定義
片級以上的語法級別(如序列參數集和圖像參數集,針對網絡傳輸),同時支持以下功能:獨立片解碼,起始碼唯一保證,SEI以及流格式編碼數據傳送,NAL層將SODB打包成RBSP然後加上NAL頭,組成一個NALU(NAL單元);

---------------------------------------------

H264網絡傳輸的結構

---------------------------------------------

H264在網絡傳輸的是NALU,NALU的結構是:NAL頭+RBSP,實際傳輸中的數據流如圖所示:


264句法元素的分層結構

從前面的分析我們知道,VCL層出來的是編碼完的視頻幀數據,這些幀可能是I、B、P幀,而且這些幀可能屬於不同的序列,再者同一個序列還有相對應的一套序列參數集和圖片參數集等等,所以要完成視頻的解碼,不僅需要傳輸VCL層編碼出來的視頻幀數據,還需要傳輸序列參數集、圖像參數集等數據。

NALU頭用來標識後面的RBSP是什麼類型的數據,他是否會被其他幀參考以及網絡傳輸是否有錯誤。

RBSP用來存放下表中的一種:

RBSP類型 所寫 描述
參數集 PS 序列的全局信息,如圖像尺寸,視頻格式等
增強信息 SEI 視頻序列解碼的增強信息
圖像界定符 PD 視頻圖像的邊界
編碼片 SLICE 編碼片的頭信息和數據
數據分割   DP片層的數據,用於錯誤恢復解碼
序列結束符   表明一個序列的結束,下一個圖像爲IDR圖像
流結束符   表明該流中已沒有圖像
填充數據   亞元數據,用於填充字節

其中,

參數集:包括序列參數集 SPS圖像參數集 PPS
SPS
包含的是針對一連續編碼視頻序列的參數,如標識符 seq_parameter_set_id、幀數及 POC 的約束、參考幀數目、解碼圖像尺寸和幀場編碼模式選擇標識等等。
PPS對應的是一個序列中某一幅圖像或者某幾幅圖像,其參數如標識符 pic_parameter_set_id、可選的 seq_parameter_set_id、熵編碼模式選擇標識、片組數目、初始量化參數和去方塊濾波係數調整標識等等。


數據分割:組成片的編碼數據存放在 3 個獨立的 DP(數據分割,A、B、C)中,各自包含一個編碼片的子集。分割A包含片頭和片中每個宏塊頭數據。分割B包含幀內和 SI 片宏塊的編碼殘差數據。分割 C包含幀間宏塊的編碼殘差數據。每個分割可放在獨立的 NAL 單元並獨立傳輸。


-----------------------------------------

NALU頭結構

----------------------------------------
NALU頭結構:nal_unit_type(5bit)+nal_reference_bit(2bit)+forbidden_bit(1bit)

1.nal_unit_type:NALU
類型取值如下表所示。

nal_unit_type

NAL類型

C

0

未使用

1

非IDR圖像中不採用數據劃分的片段

2,3,4

2

非IDR圖像中A類數據劃分片段

2

3

非IDR圖像中B類數據劃分片段

3

4

非IDR圖像中C類數據劃分片段

4

5

IDR圖像的片

2,3

6

補充增強信息單元(SEI)

5

7

序列參數集

0

8

圖像參數集

1

9

分界符

6

10

序列結束

7

11

碼流結束

8

12

填充

9

13..23

保留

24..31

不保留



2.nal_reference_bit:nal重要性指示,標誌該NAL單元的重要性,值越大,越重要,解碼器在解碼處理不過來的時候,可以丟掉重要性爲0的NALU。不同類型的NALU的重要性指示如下表所示。

nal_unit_type

NAL類型

nal_reference_bit

0

未使用

0

1

非IDR的片

此片屬於參考幀,則不等於0,

不屬於參考幀,則等與0

2

片數據A分區

同上

3

片數據B分區

同上

4

片數據C分區

同上

5

IDR圖像的片

5

6

補充增強信息單元(SEI)

0

7

序列參數集

非0

8

圖像參數集

非0

9

分界符

0

10

序列結束

0

11

碼流結束

0

12

填充

0

13..23

保留

0

24..31

不保留

0

所謂參考幀,就是在其他幀解碼時需要參照的幀。比如一個I幀可能被一個或多個B幀參考,一個B幀可能被某個P幀參考。

從這個表我們也可以看出來,DIR的I幀是非常重要的,他一丟,那麼這個序列的所有幀都沒辦法解碼了;然後序列參數集和圖像參數集也很重要,沒有序列參數集,這個序列的幀就沒法解;沒有圖像參數集,那用到這個圖像參數集的幀都沒法解。

3.forbidden_bit:禁止位,初始爲0,當網絡發現NAL單元有比特錯誤時可設置該比特爲1,以便接收方糾錯或丟掉該單元。


-------------------------------------
NAL的開始和結束

-------------------------------

編碼器將每個NAL各自獨立、完整地放入一個分組,因爲分組都有頭部,解碼器可以方便地檢測出NAL的分界,並依次取出NAL進行解碼。每個NAL前有一個起始碼 0x00 00 01(或者0x00 00 00 01),解碼器檢測每個起始碼,作爲一個NAL的起始標識,當檢測到下一個起始碼時,當前NAL結束。同時H.264規定,當檢測到0x000000時,也可以表徵當前NAL的結束。那麼NAL中數據出現0x000001或0x000000時怎麼辦?H.264引入了防止競爭機制,如果編碼器檢測到NAL數據存在0x000001或0x000000時,編碼器會在最後個字節前插入一個新的字節0x03,這樣:
0x000000->0x00000300
0x000001->0x00000301
0x000002->0x00000302
0x000003->0x00000303
解碼器檢測到0x000003時,把03拋棄,恢復原始數據。解碼器在解碼時,首先逐個字節讀取NAL的數據,統計NAL的長度,然後再開始解碼。

--------------------------------------

NALU的順序要求

--------------------------------------

H.264/AVC標準對送到解碼器的NAL單元順序是有嚴格要求的,如果NAL單元的順序是混亂的,必須將其重新依照規範組織後送入解碼器,否則解碼器不能夠正確解碼。
1.序列參數集NAL單元 必須在傳送所有以此參數集爲參考的其他NAL單元之前傳送,不過允許這些NAL單元中間出現重複的序列參數集NAL單元。

所謂重複的詳細解釋爲:序列參數集NAL單元都有其專門的標識,如果兩個序列參數集NAL單元的標識相同,就可以認爲後一個只不過是前一個的拷貝,而非新的序列參數集。
2.圖像參數集NAL單元 必須在所有以此參數集爲參考的其他NAL單元之前傳送,不過允許這些NAL單元中間出現重複的圖像參數集NAL單元,這一點與上述的序列參數集NAL單元是相同的。
3.不同基本編碼圖像中的片段(slice)單元和數據劃分片段(data partition)單元在順序上不可以相互交叉,即不允許屬於某一基本編碼圖像的一系列片段(slice)單元和數據劃分片段(data partition)單元中忽然出現另一個基本編碼圖像的片段(slice)單元片段和數據劃分片段(data partition)單元。
4.參考圖像的影響:如果一幅圖像以另一幅圖像爲參考,則屬於前者的所有片段(slice)單元和數據劃分片段(data partition)單元必須在屬於後者的片段和數據劃分片段之後,無論是基本編碼圖像還是冗餘編碼圖像都必須遵守這個規則。
5.基本編碼圖像的所有片段(slice)單元和數據劃分片段(data partition)單元必須在屬於相應冗餘編碼圖像的片段(slice)單元和數據劃分片段(data partition)單元之前。
6.如果數據流中出現了連續的無參考基本編碼圖像,則圖像序號小的在前面。
7.如果arbitrary_slice_order_allowed_flag置爲1,一個基本編碼圖像中的片段(slice)單元和數據劃分片段(data partition)單元的順序是任意的,如果arbitrary_slice_order_allowed_flag置爲零,則要按照片段中第一個宏塊的位置來確定片段的順序,若使用數據劃分,則A類數據劃分片段在B類數據劃分片段之前,B類數據劃分片段在C類數據劃分片段之前,而且對應不同片段的數據劃分片段不能相互交叉,也不能與沒有數據劃分的片段相互交叉。
8.如果存在SEI(補充增強信息)單元的話,它必須在它所對應的基本編碼圖像的片段(slice)單元和數據劃分片段(data partition)單元之前,並同時必須緊接在上一個基本編碼圖像的所有片段(slice)單元和數據劃分片段(data partition)單元后邊。假如SEI屬於多個基本編碼圖像,其順序僅以第一個基本編碼圖像爲參照。
9.如果存在圖像分割符的話,它必須在所有SEI 單元、基本編碼圖像的所有片段slice)單元和數據劃分片段(data partition)單元之前,並且緊接着上一個基本編碼圖像那些NAL單元。
10.如果存在序列結束符,且序列結束符後還有圖像,則該圖像必須是IDR(即時解碼器刷新)圖像。序列結束符的位置應當在屬於這個IDR圖像的分割符、SEI 單元等數據之前,且緊接着前面那些圖像的NAL單元。如果序列結束符後沒有圖像了,那麼它的就在比特流中所有圖像數據之後。
11.流結束符在比特流中的最後。

發佈了3 篇原創文章 · 獲贊 0 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章