Android視頻開發進階(part2-MP4文件的解析)

上一期文章我分享了一些視頻播放裏面的術語和基本概念。這一篇文章我會主要介紹容器(container format file)格式文件的細節,以最常見的MP4文件入手。然後會簡短的介紹一個標準的播放器的啓動,解析,播放流程。本篇還是以基礎知識爲主,雖然很枯燥,但是對視頻開發的學習有非常大的好處,我自己個人的感受就是,如果在很多專有名字,概念都不熟悉的情況下,想要去閱讀播放器源碼會是相當困難的事情。比如Exoplayer,谷歌的分包策略就是根據播放器的組件來分包。如果不熟悉播放器的基礎構建的話,連哪個部分的代碼在哪個包都不知道。希望大家如果真的想進階的話還是耐心的理解好每個基礎概念。

  1. Mp4格式文件的構成
  2. Mp4頭文件的構成
  3. 標準播放器的啓動流程
  4. 在線視頻播放的技術基礎(online video streaming)

1. Mp4格式文件的構成

在上期我們大概介紹了Mp4文件的結構

但是這樣抽象的介紹可能還是比較難理解,我們深入一些。

1.1 MP4到底是個啥?

通俗的說,MP4其實是一種格式的規範,這個規範是被ISO機構認證的,也就是說,只要你通過Codec生成了一個mp4文件,那麼這個文件的格式必須是按照ISO機構的規矩來。。。。既然是規範,那麼我們看看到底ISO對mp4做了什麼規範:

請大家打開鏈接->ISO的mp4文件規範

大家可能會有點懵逼,看不懂。其實這個規範很好理解,它定義了一個MP4文件裏面,哪些數據應該放在什麼位置(以字節爲單位),哪些數據的長度是多少。我截取了一段:

大家看,上面這一段規範定義了ftyp這個頭文件header所在的位置和長度(以字節爲單位)。
至於這些頭文件是有什麼用,我在上一篇文章大概提到過,他們屬於meta data的一部分。在本章我會更詳細的介紹。

所以說,任何容器,包括mp4都是類似的結構化文件,只不過不同的格式文件ISO對其有嚴格的要求,數據的擺放順序,排列等等不同而已。有興趣的同學可以對比一下rmvb,mp4,mkv這些格式的要求有什麼不同,優劣勢各是什麼。

2.Mp4頭文件的構成

關於mp4文件的頭文件格式(meta data),蘋果官網對其進行了詳細的描述(這個介紹是基於QuickTime播放器支持的mp4文件來介紹的,quciktime播放器對mp4的要求有些許不同,但是差別不大,我們可以忽略):

Movie Atom

我們不追究太多細節,有興趣的同學可以自己查看,我們專注於一些基礎的信息。

首先,在Meta Data裏面,每一個Header,頭文件,我們都叫他們Atom Header(不知道咋翻譯)。Atom Header分爲Leaf Atom 和 Container Atom。前者代表一個連接着字符串信息的頭文件,後者是一個包含了若干個子Atom的頭文件,他們互相之間是有層級關係的(參考上圖)。每次播放器獲取了movie atom之後(moov),會根據層級關係,向下,或者向下讀取相關的其他信息。每一個頭文件都會對它的子頭文件保存位置的引用,所以只要根據mp4文件的規範獲取了最頂級的頭文件moov,就可以順勢往下讀取其他頭文件了。

我們來看看mp4的頭文件結構

看起來很複雜,但是對於一個播放器來說,很多信息都不是必須。我們需要知道的最重要的信息是採樣索引表(Sample Table Atoms).對應圖中“**stbl **”這個atom header。這個索引表保存了mp4文件所有的採樣(sample)與視頻時間的對應關係(一般以微秒爲單位),還有包括每個採樣的大小,在mp4文件中的起始位置(以自己爲單位)。

3.標準播放器的啓動流程

那麼既然我們已經知道一個容器文件的格式規範了,播放器就可以通過解析容器的頭文件來控制播放(playback)了。

3.1 播放器

通常播放器由三個部分構成

  1. 讀取器(Extractor)
  2. 渲染器(TrackRenderer)
  3. 加載控制器(Load Controller)
  4. 數據源(Source)

讀取器負責從source文件讀取數據,加載控制器負責控制讀取數據的策略(比如說在線視頻播放的時候緩衝策略),渲染器負責接收讀取器讀取的數據,並渲染到屏幕上。

3.2 播放器的播放過程

在播放器可以把數據提交給渲染器之前,播放器需要把必需的頭文件全部解析並存入內存,比如之前說的採樣索引表。一般播放器在解析完畢後,會構建三個個表,一個存放時間對應採樣索引,一個存放採樣索引對應在mp4文件中的起始位置(以字節爲單位),一個存放採樣索引對應大小(以字節爲單位)。以下圖爲例

假設播放器需要從第1微秒開始播放,那麼需要把第1微秒的數據放入渲染器。所以會查找下面這三個表。

通過表1,我們知道該微秒對應第1個採樣(sample),從第一個和第二個表我們知道,第1個採樣的數據範圍(在mp4文件內)是從第0字節到300(0+300)字節,那麼播放器就會去讀取這個範圍的數據並且放入渲染器中進行渲染。

同時,加載器會基於當前已經緩存的數據,決定是否還需要不停的讀取數據進入內存。一般來說每個播放器都有默認的緩存值,也會有一個基準線,只有當緩存足夠數據才能放進渲染器進行渲染。

最後同理,當我們拖動滑動控制器(SeekBar)想快進的時候,我們和第一步一樣,通過我們想滑動的時間獲取採樣的索引,再重新開始讀取數據。

綜上所述,播放器在正式播放視頻文件之前,必須要把頭文件全部讀取並解析(這會是一段非常耗時的程序),這也是在線視頻播放的等待時間的瓶頸。在接下來的章節我會介紹自適應視頻播放(Adaptive Streaming),這個技術的發明使得了分段式mp4文件(Fragmented Mp4)技術得以誕生,大大的減少了在線視頻播放的等待時間。

4.在線視頻播放的技術基礎(online video streaming)

在線視頻的播放其實和播放本地視頻的局別就是Extractor讀取的Source,數據源不一樣,在線播放需要下載數據到內存,再交由Extractor讀取分析。但是既然是在線視頻播放,我們肯定不能把整個容器文件下載到內存或者硬盤再開始解析播放。我們希望能控制下載的進度,比如我當前在看第10s的視頻內容,所以我只想緩存/下載視頻內容到第20s的位置。

我們俗稱的漸進式下載(Progressive Downloading)就解決了這一難題。

說的好像是很嚇人的黑科技啊!!!!

其實就是HTTP1.1協議支持的分段式下載而已。。。。。

在HTTP請求裏面假如一個叫RANGE的header,放入起始字節和結束字節,就可以只下載對應部分的數據,這一header的支持也是各種下載軟件實現斷點下載的基礎。每次斷網的時候記錄下來已經下載的數據的字節數,下次再下載的時候從字節數+1處重新下載並且寫入原有文件就可以了。


分割線

所以這次分享就結束啦,下一期分享我會開始進入正題,在安卓平臺裏面,對視頻播放的支持,像api啊等等,以及其變遷歷史。



作者:qing的世界
鏈接:https://www.jianshu.com/p/2b85c9bc3a12
來源:簡書
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章