安卓直播推流專欄博客總結
0 . 資源和源碼地址 :
- 資源下載地址 : 資源下載地址 , 服務器搭建 , x264 , faac , RTMPDump , 源碼及交叉編譯庫 , 本專欄 Android 直播推流源碼 ;
- GitHub 源碼地址 : han1202012 / RTMP_Pusher
1. 搭建 RTMP 服務器 : 下面的博客中講解了如何在 VMWare 虛擬機中搭建 RTMP 直播推流服務器 ;
2. 準備視頻編碼的 x264 編碼器開源庫 , 和 RTMP 數據包封裝開源庫 :
-
【Android RTMP】RTMPDumb 源碼導入 Android Studio ( 交叉編譯 | 配置 CMakeList.txt 構建腳本 )
-
【Android RTMP】Android Studio 集成 x264 開源庫 ( Ubuntu 交叉編譯 | Android Studio 導入函數庫 )
3. 講解 RTMP 數據包封裝格式 :
4. 圖像數據採集 : 從 Camera 攝像頭中採集 NV21 格式的圖像數據 , 並預覽該數據 ;
-
【Android RTMP】Android Camera 視頻數據採集預覽 ( 視頻採集相關概念 | 攝像頭預覽參數設置 | 攝像頭預覽數據回調接口 )
-
【Android RTMP】Android Camera 視頻數據採集預覽 ( NV21 圖像格式 | I420 圖像格式 | NV21 與 I420 格式對比 | NV21 轉 I420 算法 )
-
【Android RTMP】Android Camera 視頻數據採集預覽 ( 圖像傳感器方向設置 | Camera 使用流程 | 動態權限申請 )
5. NV21 格式的圖像數據編碼成 H.264 格式的視頻數據 :
-
【Android RTMP】x264 編碼器初始化及設置 ( 獲取 x264 編碼參數 | 編碼規格 | 碼率 | 幀率 | B幀個數 | 關鍵幀間隔 | 關鍵幀解碼數據 SPS PPS )
-
【Android RTMP】x264 圖像數據編碼 ( Camera 圖像數據採集 | NV21 圖像數據傳到 Native 處理 | JNI 傳輸字節數組 | 局部引用變量處理 | 線程互斥 )
-
【Android RTMP】x264 圖像數據編碼 ( NV21 格式中的 YUV 數據排列 | Y 灰度數據拷貝 | U 色彩值數據拷貝 | V 飽和度數據拷貝 | 圖像編碼操作 )
6. 將 H.264 格式的視頻數據封裝到 RTMP 數據包中 :
-
【Android RTMP】RTMPDump 封裝 RTMPPacket 數據包 ( 封裝 SPS / PPS 數據包 )
-
【Android RTMP】RTMPDump 封裝 RTMPPacket 數據包 ( 關鍵幀數據格式 | 非關鍵幀數據格式 | x264 編碼後的數據處理 | 封裝 H.264 視頻數據幀 )
-
【Android RTMP】RTMPDump 推流過程 ( 獨立線程推流 | 創建推流器 | 初始化操作 | 設置推流地址 | 啓用寫出 | 連接 RTMP 服務器 | 發送 RTMP 數據包 )
7. 階段總結 : 阿里雲服務器中搭建 RTMP 服務器 , 並使用電腦軟件推流和觀看直播內容 ;
-
【Android RTMP】RTMP 直播推流 ( 阿里雲服務器購買 | 遠程服務器控制 | 搭建 RTMP 服務器 | 服務器配置 | 推流軟件配置 | 直播軟件配置 | 推流直播效果展示 )
-
【Android RTMP】RTMP 直播推流階段總結 ( 服務器端搭建 | Android 手機端編碼推流 | 電腦端觀看直播 | 服務器狀態查看 )
8. 處理 Camera 圖像傳感器導致的 NV21 格式圖像旋轉問題 :
-
【Android RTMP】NV21 圖像旋轉處理 ( 問題描述 | 圖像順時針旋轉 90 度方案 | YUV 圖像旋轉細節 | 手機屏幕旋轉方向 )
-
【Android RTMP】NV21 圖像旋轉處理 ( 圖像旋轉算法 | 後置攝像頭順時針旋轉 90 度 | 前置攝像頭順時針旋轉 90 度 )
9. 下面這篇博客比較重要 , 裏面有一個快速搭建 RTMP 服務器的腳本 , 強烈建議使用 ;
10. 編碼 AAC 音頻數據的開源庫 FAAC 交叉編譯與 Android Studio 環境搭建 :
-
【Android RTMP】音頻數據採集編碼 ( 音頻數據採集編碼 | AAC 高級音頻編碼 | FAAC 編碼器 | Ubuntu 交叉編譯 FAAC 編碼器 )
-
【Android RTMP】音頻數據採集編碼 ( FAAC 頭文件與靜態庫拷貝到 AS | CMakeList.txt 配置 FAAC | AudioRecord 音頻採樣 PCM 格式 )
11. 解析 AAC 音頻格式 :
12 . 將麥克風採集的 PCM 音頻採樣編碼成 AAC 格式音頻 , 並封裝到 RTMP 包中 , 推流到客戶端 :
-
【Android RTMP】音頻數據採集編碼 ( FAAC 音頻編碼參數設置 | FAAC 編碼器創建 | 獲取編碼器參數 | 設置 AAC 編碼規格 | 設置編碼器輸入輸出參數 )
-
【Android RTMP】音頻數據採集編碼 ( FAAC 編碼器編碼 AAC 音頻解碼信息 | 封裝 RTMP 音頻數據頭 | 設置 AAC 音頻數據類型 | 封裝 RTMP 數據包 )
-
【Android RTMP】音頻數據採集編碼 ( FAAC 編碼器編碼 AAC 音頻採樣數據 | 封裝 RTMP 音頻數據頭 | 設置 AAC 音頻數據類型 | 封裝 RTMP 數據包 )
Android 直播推流流程 : 手機採集視頻 / 音頻數據 , 視頻數據使用 H.264 編碼 , 音頻數據使用 AAC 編碼 , 最後將音視頻數據都打包到 RTMP 數據包中 , 使用 RTMP 協議上傳到 RTMP 服務器中 ;
本篇博客會詳細分析 , 音視頻數據是如何打包成 RTMP 數據的 , 以及 RTMP 數據格式 ;
一、 RTMP 格式解析
RTMP 視頻數據包格式與 flv 視頻格式類似 , 使用二進制分析工具分析 flv 視頻文件 , 相關工具都在博客資源中 ;
分析 flv 文件格式 :
① flv 視頻文件構成 : flv 視頻由一個文件頭 Header 與若干標籤 Tag 組成 ;
② 使用二進制查看器 , 打開 flv 視頻文件 , 如下圖所示 :
③ 使用 flvAnalyser 工具打開 flv 視頻文件 :
二、 文件頭 Header 分析
文件頭 Header 分析 :
① flv 視頻文件文件頭 : 46 4C 56 ( 16 進制格式 ) , 這是 FLV 字母的 ASCII 碼 ; 只要是 flv 格式的文件 , 前三個字節必定是這三個值 ;
② 文件版本 : 第 個字節時 FLV 格式的版本 , 這裏是 01 ; ( 參考上圖 )
三、 標籤 Tag 分析
flv 標籤數據結構 :
① 標籤類型 ( tag type ) : 字節 , 索引區間 , 0x08 代表音頻 , 0x09 代表視頻 , 0x12 代表腳本信息 ;
② 標籤數據大小 ( data size ) : 字節 , 索引區間 , 除了包頭之外的數據大小 , 包頭一般是 字節, 整個標籤大小是該 標籤數據大小 ( data size ) + 11 ;
③ 時間戳 ( time stamp ) : 字節 , 索引區間 , 表示從開始播放到當前時刻的播放時間 , 單位毫秒 , 也就是當前標籤的時間與第一個標籤時間的差值 ;
④ 時間戳擴展位 ( time stamp ext ) : 字節 , 索引區間 , 如果時間戳較大 , 位裝不下 , 擴展一位 ;
⑤ 流編號 ( stream id ) : 字節 , 索引區間 , 一般都是 0 ;
上述 字節時包頭信息 , 下面就是實際的數據信息 , 有 標籤數據大小 ( data size ) 個字節的數據 ;
⑥ 數據區 ( data ) : 標籤數據大小 字節 , 索引區間 , 標籤數據大小 ( data size ) 個字節的數據 ;
視頻標籤 與 音頻標籤 : 在 flvAnalyser 中可以清晰的看到文件頭 Header 與 標籤 Tag 的結構 , 其中 紅色的框表示 視頻數據標籤 , 綠色的框表示 音頻數據標籤 ;
四、 視頻標籤 Tag 數據分析
1 . 打開視頻標籤數據 : 在 flvAnalyser 工具中 , 雙擊 1 號標籤 , 該標籤是 h264 視頻標籤 , 彈出如下對話框 , 開始分析該視頻標籤中的數據 ;
2 . 視頻標籤數據詳情 :
0x00000182 : 09 00 00 2E 00 00 00 00
0x0000018a : 00 00 00 17 00 00 00 00
0x00000192 : 01 64 00 32 FF E1 00 19
0x0000019a : 67 64 00 32 AC D9 80 78
0x000001a2 : 02 27 E5 84 00 00 03 00
0x000001aa : 04 00 00 1F 40 3C 60 C6
0x000001b2 : 68 01 00 05 68 E9 7B 2C
0x000001ba : 8B 00 00 00 39
3 . flv 視頻標籤數據分析 : 以下所有的數據都是十六進制數據 , 這裏省略 0x 前綴 ;
① 標籤類型 ( tag type ) : 字節 , 索引區間 , 此處是 09 表示音頻數據
② 標籤數據大小 ( data size ) : 字節 , 索引區間 , 00 00 2E , 46 字節 , 視頻數據有 46 字節 , 該標籤的總數據是 46 + 11 = 57 字節 ;
③ 時間戳 ( time stamp ) : 字節 , 索引區間 , 00 00 00 , 當前時間戳是 0 , 這是第 1 個標籤 , 與其本身差值自然是 0 ;
④ 時間戳擴展位 ( time stamp ext ) : 字節 , 索引區間 , 00 , 該位也是 0 ;
⑤ 流編號 ( stream id ) : 字節 , 索引區間 , 00 00 00 , 這個值一般都是 0 ;
上述 字節時包頭信息 , 下面就是實際的數據信息 , 有 標籤數據大小 ( data size ) 個字節的數據 ;
⑥ 數據區 ( data ) : 標籤數據大小 字節 , 索引區間 , 後面有 46 字節的視頻數據 ;
下面開始分析這 46 字節的視頻數據 ;