live555中關於mpeg4的處理

原創

2020-02-22 08:54

轉載地址：http://blog.csdn.net/gavinr/article/details/7162369

live555支持mpeg4的ES(Elemental Stream)流，相關類爲MPEGVideoStreamFramer、MPEG4ESVideoRTPSink。我想擴展其對avi格式的支持，將avi中的MPEG4數據包解析出來後，交給MPEGVideoStreamFramer進行處理。後來發現，這樣根本不行。問題在於，MPEGVideoStreamFramer處理的是嚴格的MPEG4 ES流。

先簡單的說明一下MPEG4的ES流：

MPEG4 Elemental stream 組成如下：
VOS->VO->VOL->GOV(可選)->VOP
VOS 視覺對像序列
VO 視覺對像
VOL 視覺對對象層
GOV 視覺對象平面組(VOP組)
VOP 視覺對象平面

緊跟着VOP開始的，有一個2bit 的標誌，用來表示這個Frame到底是一個 I Frame，P Frame，B Frame抑或是S Frame（GMS-VOP）
標誌如下：
00: I Frame
01: P Frame
10: B Frame
11: S Frame

起始符及結束符定義如下:

[cpp] view plain copy print ?

#define VISUAL_OBJECT_SEQUENCE_START_CODE 0x000001B0
#define VISUAL_OBJECT_SEQUENCE_END_CODE 0x000001B1
#define GROUP_VOP_START_CODE 0x000001B3
#define VISUAL_OBJECT_START_CODE 0x000001B5
#define VOP_START_CODE 0x000001B6

用二進制方式打開avi文件，發現只存在vop開始符，說明只存在VOP層次，而不是嚴格的ES流。可以認爲一個VOP對應着一個幀。

後來發現，live555中實現了另一個類，MPEG4VideoStreamDiscreteFramer，繼承自MPEG4VideoStreamFramer。它可以處理VOS，也可以處理一個個的BOV及VOP，正好可以滿足需求。
看一下MPEG4VideoStreamDiscreteFramer對MPEG4數據的處理

[cpp] view plain copy print ?

void MPEG4VideoStreamDiscreteFramer
::afterGettingFrame1(unsigned frameSize, unsigned numTruncatedBytes,
struct timeval presentationTime,
unsigned durationInMicroseconds) {
// Check that the first 4 bytes are a system code:
if (frameSize >= 4 && fTo[0] == 0 && fTo[1] == 0 && fTo[2] == 1) {
fPictureEndMarker = True; // Assume that we have a complete 'picture' here
unsigned i = 3;
//
//視覺對象序列，按照完整的MPEG4 Elemental Stream進行解析
//
if (fTo[i] == 0xB0) { // VISUAL_OBJECT_SEQUENCE_START_CODE
// The next byte is the "profile_and_level_indication":
if (frameSize >= 5) fProfileAndLevelIndication = fTo[4];
// The start of this frame - up to the first GROUP_VOP_START_CODE
// or VOP_START_CODE - is stream configuration information. Save this:
for (i = 7; i < frameSize; ++i) {
if ((fTo[i] == 0xB3 /*GROUP_VOP_START_CODE*/ ||
fTo[i] == 0xB6 /*VOP_START_CODE*/)
&& fTo[i-1] == 1 && fTo[i-2] == 0 && fTo[i-3] == 0) {
break; // The configuration information ends here
}
}
fNumConfigBytes = i < frameSize ? i-3 : frameSize;
delete[] fConfigBytes; fConfigBytes = new unsigned char[fNumConfigBytes];
for (unsigned j = 0; j < fNumConfigBytes; ++j) fConfigBytes[j] = fTo[j];
// This information (should) also contain a VOL header, which we need
// to analyze, to get "vop_time_increment_resolution" (which we need
// - along with "vop_time_increment" - in order to generate accurate
// presentation times for "B" frames).
analyzeVOLHeader();
}
if (i < frameSize) {
u_int8_t nextCode = fTo[i];
//
//VOP組
//
if (nextCode == 0xB3 /*GROUP_VOP_START_CODE*/) {
// Skip to the following VOP_START_CODE (if any):
for (i += 4; i < frameSize; ++i) {
if (fTo[i] == 0xB6 /*VOP_START_CODE*/
&& fTo[i-1] == 1 && fTo[i-2] == 0 && fTo[i-3] == 0) {
nextCode = fTo[i];
break;
}
}
}
//
//視覺對象平面
//
if (nextCode == 0xB6 /*VOP_START_CODE*/ && i+5 < frameSize) {
++i;
// Get the "vop_coding_type" from the next byte:
u_int8_t nextByte = fTo[i++];
u_int8_t vop_coding_type = nextByte>>6; //VOP開始符後的2bit，表示幀類型I/P/B/S
// Next, get the "modulo_time_base" by counting the '1' bits that
// follow. We look at the next 32-bits only.
// This should be enough in most cases.
u_int32_t next4Bytes
= (fTo[i]<<24)|(fTo[i+1]<<16)|(fTo[i+2]<<8)|fTo[i+3];
i += 4;
u_int32_t timeInfo = (nextByte<<(32-6))|(next4Bytes>>6);
unsigned modulo_time_base = 0;
u_int32_t mask = 0x80000000;
while ((timeInfo&mask) != 0) {
++modulo_time_base;
mask >>= 1;
}
mask >>= 2;
// Then, get the "vop_time_increment".
unsigned vop_time_increment = 0;
// First, make sure we have enough bits left for this:
if ((mask>>(fNumVTIRBits-1)) != 0) {
for (unsigned i = 0; i < fNumVTIRBits; ++i) {
vop_time_increment |= timeInfo&mask;
mask >>= 1;
}
while (mask != 0) {
vop_time_increment >>= 1;
mask >>= 1;
}
}
//
//若是"B"frame, 需要修正時間時間戳
//
// If this is a "B" frame, then we have to tweak "presentationTime":
if (vop_coding_type == 2/*B*/
&& (fLastNonBFramePresentationTime.tv_usec > 0 ||
fLastNonBFramePresentationTime.tv_sec > 0)) {
int timeIncrement
= fLastNonBFrameVop_time_increment - vop_time_increment;
if (timeIncrement<0) timeIncrement += vop_time_increment_resolution;
unsigned const MILLION = 1000000;
double usIncrement = vop_time_increment_resolution == 0 ? 0.0
: ((double)timeIncrement*MILLION)/vop_time_increment_resolution;
unsigned secondsToSubtract = (unsigned)(usIncrement/MILLION);
unsigned uSecondsToSubtract = ((unsigned)usIncrement)%MILLION;
presentationTime = fLastNonBFramePresentationTime;
if ((unsigned)presentationTime.tv_usec < uSecondsToSubtract) {
presentationTime.tv_usec += MILLION;
if (presentationTime.tv_sec > 0) --presentationTime.tv_sec;
}
presentationTime.tv_usec -= uSecondsToSubtract;
if ((unsigned)presentationTime.tv_sec > secondsToSubtract) {
presentationTime.tv_sec -= secondsToSubtract;
} else {
presentationTime.tv_sec = presentationTime.tv_usec = 0;
}
} else {
fLastNonBFramePresentationTime = presentationTime;
fLastNonBFrameVop_time_increment = vop_time_increment;
}
}
}
}
// Complete delivery to the client:
fFrameSize = frameSize;
fNumTruncatedBytes = numTruncatedBytes;
fPresentationTime = presentationTime;
fDurationInMicroseconds = durationInMicroseconds;
afterGetting(this);
}

上面的代碼，其實只完成一個功能，就是噹噹前VOP爲B幀時，調整時間戳。

最後關注一下，MPEG4 ES流時間戳的處理。在處理MPEG4 的ES流時，使用MPEG4VideoStreamFramer，作爲source。使用分析器MPEG4VideoStreamParser，對完整的MPEG4 Elemental Stream進行分析，主要是解析出其中的時間信息。

[cpp] view plain copy print ?

void MPEGVideoStreamFramer::continueReadProcessing() {
unsigned acquiredFrameSize = fParser->parse();
if (acquiredFrameSize > 0) {
// We were able to acquire a frame from the input.
// It has already been copied to the reader's space.
fFrameSize = acquiredFrameSize;
fNumTruncatedBytes = fParser->numTruncatedBytes();
// "fPresentationTime" should have already been computed.
//
//根據幀計數及幀率計算幀的持續時間
//
// Compute "fDurationInMicroseconds" now:
fDurationInMicroseconds
= (fFrameRate == 0.0 || ((int)fPictureCount) < 0) ? 0
: (unsigned)((fPictureCount*1000000)/fFrameRate);
fPictureCount = 0;
// Call our own 'after getting' function. Because we're not a 'leaf'
// source, we can call this directly, without risking infinite recursion.
afterGetting(this);
} else {
// We were unable to parse a complete frame from the input, because:
// - we had to read more data from the source stream, or
// - the source stream has ended.
}
}

計算fDurationInMicroseconds需要frame rate參數fFrameRate, 它是通過分析VOL頭確定的

[cpp] view plain copy print ?

void MPEG4VideoStreamParser::analyzeVOLHeader() {
//
//從VOL中解析出時間信息
//
// Extract timing information (in particular,
// "vop_time_increment_resolution") from the VOL Header:
...
do {
...
// Use "vop_time_increment_resolution" as the 'frame rate'
// (really, 'tick rate'):
usingSource()->fFrameRate = (double)vop_time_increment_resolution; //幀率
return;
} while (0);
...
}

發佈了0 篇原創文章 · 獲贊 9 · 訪問量 8萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

關於VOIP電話中的SIP信令返回碼的詳細解釋

1 臨時應答1xx 臨時應答，也就是消息性質的應答，標誌了對方服務器正在處理請求，並且還沒有決定最後的應答。如果服務器處理請求需要花200ms以上才能產生終結應答的時候，它應當發送一個1xx應答。注意1xx應答並不是可靠傳輸的。他們不

2020-07-07 13:24:54

有關H264視頻卡的情況如何解決

1.首先確定採用的何種RTP荷載格式有三種：單NAL 單元包聚合包分片單元丟此不太清楚的可以看http://blog.csdn.net/luowenlong860502/article/details/7788617 說白了就是

2020-07-07 13:24:51

YUV格式詳細解析

文詳解YUV420數據格式 YUV格式有兩大類：planar和packed。對於planar的YUV格式，先連續存儲所有像素點的Y，緊接着存儲所有像素點的U，隨後是所有像素點的V。對於packed的YUV格式，每個像素點的Y

2020-07-07 13:24:51

Android 調用系統相機、獲取圖片適配方案及常見問題彙總

背景：在維護公司移動辦公平臺APP 時，由於項目太過老舊，在兼容到最新版本時，出現了拍照、選擇圖片等問題，在此記錄一下遇到的問題及解決的方案。調用系統相機拍照方案：Tips：記得申請權限和做運行時權限處理 btn.setOnClick

2020-07-07 06:05:24

H.264視頻編碼傳輸的QoS特性分析（三）

四、H.264的網絡提取層的錯誤恢復 NAL支持衆多基於包的有線/無線通信網絡，諸如 H.320、MPEG-2和RTP/IP等。但目前，絕大部分的視頻應用所採用的網絡協議層次是RTP/UDP/IP，因此在下面的描述中主要基於

2020-07-06 05:39:14

智能客服客戶端程序開發

這個國慶節作死，答應別人在七天內做2個項目。智能客服項目是其中一個，當時是答應給隔壁兄弟團隊做的。他們說實在搞不定了，節後要上線，我就因爲隨口說了一句：“這有什麼難的”，結果禍從口出，這事情就落我頭上了。錄音識別是智能客服大項目計劃裏面

2020-07-05 20:39:36

Android0915（多媒體、SoundPool、MediaRecorder、SurfaceView,簡單地使用攝像頭）

SoundPool SoundPool類管理和播放音頻資源的應用。因爲MediaPlayer在播放音樂時會資源佔用量較高、延遲時間較長、不支持多個音頻同時播放等。，但有時一些系統提示音很小，就沒有必要用MediaPlayer去播

2020-07-05 17:26:08

基礎知識：視頻文件格式綜述

http://bbs.chinavideo.org/redirect.php?tid=1795&goto=lastpost Multimedia Files----------------Many multimedia files

2020-07-04 21:36:32

Compile FFmpeg on CentOS 6.0

This guide is based on a minimal CentOS installation and will installFFmpeg with several external encoding libraries. N

2020-07-04 10:04:42

Android內容提供器讀取手機中的音樂文件信息

1.加權限： <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE" /> 2.讀取資源： /** * 拿到本地音樂資源

2020-07-04 08:52:10

關於媒體掃描器耗電問題或者android圖庫掃描到不該看的東西預防尷尬

媒體服務器應該是4.4以上版本出現的，其作用是不斷掃描存儲內容，分類加載到多媒體裏，比如圖庫。所以android的圖庫裏經常分爲很多文件夾並且掃描了存儲內的全部多媒體文件（你存的亂七八糟的東西都能在圖庫裏看得到）。那麼在存儲內多媒體文件

胖子程序员

2020-07-04 05:58:49

html embed用法（網站中視頻、音頻的添加）

網站中添加視頻： <embed src="http://player.video.qiyi.com/390cf6c74450e4c70b7bd2d883169914/0/0/w_19rsjdrsil.swf -

2020-07-03 12:44:38

librtmp windows 下編譯 vs2015

最近要搞一個直播推流的東西，用到了librtmp ，但是看到的有的編譯的很那啥。要麼是win32的，要麼是各種問題。下面我總結了幾個帖子自己也搞了一下。 1.編譯zlib 下載地址：http://www.zlib.net 我下載

2020-07-03 01:36:37

第三部分和絃鈴聲格式

第三部分和絃鈴聲格式與音樂不同的是，和絃鈴聲都是製作出來的。播放的時候，只需要合成（或解碼）就可以輸出 PCM格式的數據，然後 PCM格式的數據可以通 I2S接口傳輸，然後經過數 -模轉換輸出。 1、

2020-07-02 21:19:47

PELCO（派爾高）協議解析及下載（轉載）

PELCO（派爾高）協議解析及下載

2020-07-02 21:19:36

24小時熱門文章

最新文章

最新評論文章