H264中提取sps和pps

牛逼的視頻會議網站:http://wmnmtm.blog.163.com/blog/#m=0

++++++++++++++++++++++++++++++++++++++++++++++++++++

http://wmnmtm.blog.163.com/blog/static/38245714201192491746701/

使用RTP傳輸H264的時候,需要用到sdp協議描述,其中有兩項:Sequence Parameter Sets (SPS) 和Picture Parameter Set (PPS)需要用到,那麼這兩項從哪裏獲取呢?答案是從H264碼流中獲取.在H264碼流中,都是以"0x00 0x00 0x01"或者"0x00 0x00 0x00 0x01"爲開始碼的,找到開始碼之後,使用開始碼之後的第一個字節的低5位判斷是否爲7(sps)或者8(pps), 及data[4] & 0x1f == 7 || data[4] & 0x1f == 8.然後對獲取的nal去掉開始碼之後進行base64編碼,得到的信息就可以用於sdp.sps和pps需要用逗號分隔開來.

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

如何解析SDP中包含的H.264的SPS和PPS串

http://www.pernet.tv.sixxs.org/thread-109-1-1.html

SDP中的H.264的SPS和PPS串,包含了初始化H.264解碼器所需要的信息參數,包括編碼所用的profile,level,圖像的寬和高,deblock濾波器等。
由於SDP中的SPS和PPS都是BASE64編碼形式的,不容易理解,附件有一個工具軟件可以對SDP中的SPS和PPS進行解析。
用法是在命令行中輸入:
spsparser sps.txt pps.txt output.txt

例如sps.txt中的內容爲:
Z0LgFNoFglE=
pps.txt中的內容爲:
aM4wpIA=

最終解析的到的結果爲:

Start dumping SPS:
  profile_idc = 66
  constrained_set0_flag = 1
  constrained_set1_flag = 1
  constrained_set2_flag = 1
  constrained_set3_flag = 0
  level_idc = 20
  seq_parameter_set_id = 0
  chroma_format_idc = 1
  bit_depth_luma_minus8 = 0
  bit_depth_chroma_minus8 = 0
  seq_scaling_matrix_present_flag = 0
  log2_max_frame_num_minus4 = 0
  pic_order_cnt_type = 2
  log2_max_pic_order_cnt_lsb_minus4 = 0
  delta_pic_order_always_zero_flag = 0
  offset_for_non_ref_pic = 0
  offset_for_top_to_bottom_field = 0
  num_ref_frames_in_pic_order_cnt_cycle = 0
  num_ref_frames = 1
  gaps_in_frame_num_value_allowed_flag = 0
  pic_width_in_mbs_minus1 = 21
  pic_height_in_mbs_minus1 = 17
  frame_mbs_only_flag = 1
  mb_adaptive_frame_field_flag = 0
  direct_8x8_interence_flag = 0
  frame_cropping_flag = 0
  frame_cropping_rect_left_offset = 0
  frame_cropping_rect_right_offset = 0
  frame_cropping_rect_top_offset = 0
  frame_cropping_rect_bottom_offset = 0
  vui_parameters_present_flag = 0

Start dumping PPS:
  pic_parameter_set_id = 0
  seq_parameter_set_id = 0
  entropy_coding_mode_flag = 0
  pic_order_present_flag = 0
  num_slice_groups_minus1 = 0
  slice_group_map_type = 0
  num_ref_idx_l0_active_minus1 = 0
  num_ref_idx_l1_active_minus1 = 0
  weighted_pref_flag = 0
  weighted_bipred_idc = 0
  pic_init_qp_minus26 = 0
  pic_init_qs_minus26 = 0
  chroma_qp_index_offset = 10
  deblocking_filter_control_present_flag = 1
  constrained_intra_pred_flag = 0
  redundant_pic_cnt_present_flag = 0
  transform_8x8_mode_flag = 0
  pic_scaling_matrix_present_flag = 0
  second_chroma_qp_index_offset = 10

/////////////////////////////////////////////////////////////////////////////////////////////////
這裏需要特別提一下這兩個參數
pic_width_in_mbs_minus1 = 21
  pic_height_in_mbs_minus1 = 17
分別表示圖像的寬和高,以宏塊(16x16)爲單位的值減1
因此,實際的寬爲 (21+1)*16 = 352
 spsparser.rar

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

http://krdai.info.sixxs.org/blog/mp4-sps-pps-data.html

最近在做跟 h264 encode/decode 相關的研究,目標是希望可以從 Android 的 MediaRecorder 當中取出 h264 的資訊。目前問題是在於 SPS 以及 PPS 到底要怎樣得到。由於 MediaRecorder 是寫入 mp4 檔案中,所以不得已只好來去分析一下 mp4 的檔案格式,發現沒有想像中的困難. 主要是參照 ISO/IEC 14496-15 這部份. 在 mp4 的檔案之中, 找到 avcC 這個字串, 之後就是接上 AVCDecoderConfigurationRecord. AVCDecoderConfigurationRecord 的 format 如下:

  1. aligned(8) class AVCDecoderConfigurationRecord {  
  2.    unsigned int(8) configurationVersion = 1;  
  3.    unsigned int(8) AVCProfileIndication;  
  4.    unsigned int(8) profile_compatibility;  
  5.    unsigned int(8) AVCLevelIndication;  
  6.   
  7. bit(6) reserved = '111111'b;  
  8.    unsigned int(2) lengthSizeMinusOne;  
  9.   
  10. bit(3) reserved = '111'b;  
  11.    unsigned int(5) numOfSequenceParameterSets;  
  12.   
  13. for (i=0; i< numOfSequenceParameterSets; i++) {  
  14.       unsigned int(16) sequenceParameterSetLength ;  
  15.       bit(8*sequenceParameterSetLength) sequenceParameterSetNALUnit;  
  16.    }  
  17.    unsigned int(8) numOfPictureParameterSets;  
  18.    for (i=0; i< numOfPictureParameterSets; i++) {  
  19.       unsigned int(16) pictureParameterSetLength;  
  20.       bit(8*pictureParameterSetLength) pictureParameterSetNALUnit;  
  21.    }  
  22. }  

對照一下這樣就可以找到 SPS 和 PPS


+++++++++++++++++++++++++++++++++++++++++++++

vlc沒有收到pps和sps
2010-10-08 16:16
問題 packetizer_h264 packetizer warning: waiting for SPS/PPS

是因爲解碼器只是在第一次執行編碼的時候,才編碼出 SPS、PPS、和I_Frame; 
h264 packetizer has set so, that it sends sps/pps only first keyframe,
 I'm trying to figure what breaks if that is changed so sps/pps is written in every keyframe. 
[出自| http://trac.videolan.org/vlc/ticket/1384]

解決辦法:

1、編碼器編碼出每個關鍵幀都加上SPS、PPS ,據說通常情況編碼器編出的 SPS、PPS是一樣的,所以這種方法耗費資源。

2、在服務器接收到客戶端請求時,發送第一個package 加上 SPS、PPS。

具體如下:

  • 1、在 VideoOpenFileSource 添加一個變量 isFirstFrame;

  • 2、構造時初始化 isFirstFrame = true;
  • 3、在int VideoOpenFileSource::readFromBufferChain() 修改如下:

  •    1         if(isFirstFrame == true)
       2         {
       3                 memcpy(fTo, h264_header, sizeof(h264_header)); /* h264_header = pps +sps*/
       4                 offset = sizeof(h264_header);
       5                 framesize = BufferChain_get(fInput.video_bufs, fTo + offset);
       6                 offset += framesize;
       7                 isFirstFrame = false;
       8                 printf("this is the first fime\n");
       9                 sleep(1);
      10         }
      11         else
      12         {
      13                 framesize = BufferChain_get(fInput.video_bufs, fTo + offset);
      14                 offset += framesize;
      15         }
      1
[http://topic.csdn.net/u/20100801/17/ef35e664-92ff-4144-a35f-3984dcf11da3.html| 參考] 


========================================================================
sdp 關於pps和sps的疑問:
packetization-mode 主要是定義包的模式,單一 NALU單元模式(0);非交錯(non-interleaved)封包模式(1);交錯(interleaved)封包模式(2)
sprop-parameter-sets 等於H.264 的序列參數集和圖像參數 NAL單元,base64轉換;(即= sps+pps)
profile-level-id 這個參數用於指示 H.264 流的 profile 類型和級別。這知道這個是啥東東

參考 黑暗長老 www.cppblog.com/czanyou/
ffmpeg decode 關於pps sps問題:
stackoverflow.com/questions/3493742/problem-to-decode-h264-video-over-rtp-with-ffmpeg-libavcodec/3500432#3500432


如何用C語言取出H.264ES文件裏的nal(sps,pps)信息。比如width, height, profile等等

請高手指點指點。。。 http://www.oschina.net/question/225813_35707

解析sps,pps的代碼在ffmpeg裏面就有, 抄出來就行了, 我以前也自己寫過...
ffmpeg的libavcodec/h264_parser.c,
h264_ps.c
函數
ff_h264_decode_seq_parameter_set
ff_h264_decode_picture_parameter_set
自己可以看代碼.


H264參數語法文檔: SPS、PPS、IDR http://blog.csdn.net/heanyu/article/details/6205390

H.264碼流第一個 NALU 是 SPS(序列參數集Sequence Parameter Set)
對應H264標準文檔 7.3.2.1 序列參數集的語法進行解析


關於H264通過RTP傳輸的打包方式  


|字號 訂閱

Q:現在小弟初次嘗試H264的編碼通過RTP方式傳輸,具體實驗環境的問題如下:
環境:
服務器端,H264的幀數據(可能超過64k),分成N個1460字節的包,然後加上RTP頭髮送。
客戶端,VLC播放器,通過RTSP協議建立連接,然後接收數據解碼播放。
結果:
VLC不能解碼接收到的數據,解碼出錯,VLC的信息中顯示不能解碼幀數據。
我已經閱讀了一遍rfc3984的文檔,對裏面的如何進行打包和用rtp傳輸不是非常理解,希望各位大蝦能夠幫小弟一把,告訴小弟這些和H264的幀該如何發送,該如何分包,該如何加頭信息等等。
(其中看到FUs的方式好像適合分包發送,因爲小弟的數據幀可能超過64k,所以忘大蝦們能夠仔細解釋一下對於小弟這種情況下的RTP傳輸)

A:我覺得所有的問題在 RFC3984 裏面都已經說得很清楚了。不知道你有哪點不懂,請具體提出來。

Q:斑竹好,我這邊是用VLC和服務器端進行通訊的,他們是用RTSP協議建立 開始時的連接的,服務器返回DISCRIBERS請求的SDP和下面描述的相同,我使用的packetization-mode=1,即FU-As方式打 包,因爲我這邊上來的數據幀可能超過64k數據。能否麻煩斑竹看看我這邊的SDP寫的是否正確。
SDP:
v=0
o=- 1 1 IN IP4 127.0.0.1
s=VStream Live
a=type:broadcast
t=0 0
c=IN   IP4 0.0.0.0
m=video 49170 RTP/AVP 99
a=rtpmap:99 H264/90000
a=fmtp:99 profile-level-id=42A01E; packetization-mode=1; sprop-parameter-ets=Z0IACpZTBYmI, aMljiA==
a=control:trackID=0

還有就是在RTP發送時,我打好包的數據方式如下面所示:
上來的幀數據爲:NALU頭+EBSP數據
因爲幀數據大於1460字節,所以我把數據分爲N個不大於1460字節的包,每個包前面加上RTP頭髮出去。
其 中NALU頭的數值I幀爲0x65,參數集爲0x67和0x68,這個值是不是有點錯誤,我看RFC3984上面說的好像和我現在的有點不 同,RFC3984上面說FU-As方式打包類型值爲28,我不知道這個是否十進制的,如果按照RFC3984上說的NALU頭應該是多少?還是用FU- As方式的FU indicator代替原來的NALU頭。
還有這個FU-As方式的頭好像是有兩個值,一個是FU indicator,另外一個是FU header,這兩個值我應該填寫什麼?

按照我現在填寫的內容,VLC會出現解不出碼的情況,希望斑竹可以幫我回答的細緻一點。謝謝了。

A:我覺得 RFC3984 上面說得非常清楚啊。
首先你把一個 NALU 的 EBSP 根據需求拆分爲多個包,例如 3 個,則:

第一個 FU-A 包的 FU indicator 應該是:F = NALU 頭中的 F;NRI = NALU 頭中的 NRI;Type = 28。FU header 應該是:S = 1;E = 0;R = 0;Type = NALU 頭中的 Type。

第二個 FU-A 包的 FU indicator 應該是:F = NALU 頭中的 F;NRI = NALU 頭中的 NRI;Type = 28。FU header 應該是:S = 0;E = 0;R = 0;Type = NALU 頭中的 Type。

第三個 FU-A 包的 FU indicator 應該是:F = NALU 頭中的 F;NRI = NALU 頭中的 NRI;Type = 28。FU header 應該是:S = 0;E = 1;R = 0;Type = NALU 頭中的 Type。

Q:版主,我按照你的方式分好包發送了,發現VLC不會出現不能解幀的情況了, 但是,還是出不來圖像。我想可能是因爲發送序列參數集和圖像參數集的方法不對,他們兩個的長度都很小,只要一個包就可以了,我現在將他們按照singal NALU的方式發送,就是直接在NALU包前加一個RTP的頭,然後發出去。
是不是我這樣發參數集存在着問題,反正我這邊VLC是解不了這個參數集,因爲參數集解不了,所以下面的幀肯定解不了,所以出不了圖像。
麻煩版主再解釋一下如何發參數集。

A:今天剛接受了流媒體的相關培訓。懂得看你的   SDP 了。

對 於你的問題,不知道 SPS、PPS 打包是否有問題。按照 RFC3984,而且感覺你打單一包的方式也是錯的。我希望你能通過自己學習的方式去把這個問題弄清楚,因爲 RFC3984 裏面說得很清楚,請你自己學習學習 RFC3984 吧。既然你在做這個工作,還是應該仔細學習一下 RFC3984。

另外, SDP 中的 sprop-parameter-ets=Z0IACpZTBYmI 實際就是 SPS 和 PPS 的 BASE64 轉碼,你不用在碼流中再傳輸 SPS/PPS,直接從 SDP 就可以得到。

A2:1.SDP中已經包括SPS&PPS,碼流中完全可以不用傳輸SPS&PPS
2. profile-level-id=42A01E,這是SPS的開頭幾個字節,剩下的在sprop-parameter- ets=Z0IACpZTBYmI, aMljiA==中,BASE64編碼,把“Z0IACpZTBYmI, aMljiA==”反BASE64轉換回去,應該剛好是SPS&PPS的內容
3. 打包注意,要求H.264碼流不是byte stream格式的,即沒有0x000001分隔,也沒有插入0x03,具體如何生成,檢查你的編碼器選項。
4. packetization-mode=1模式下,要求每個RTP中只有一個NAL單元,或者一個FU,不分段的NAL不做任何修改,直接作爲RTP負 載;分段的NAL注意,NAL頭不傳輸,有效負載從NAL頭之後開始,根據NAL頭的信息生成FU的頭兩個字節(相當於NAL頭拆爲兩部分),具體生成方 式版主已經講得很清楚。
5. RTP的payload type要與SDP中一致,不然解的出纔怪

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章