音視頻基礎知識-常用名詞概念列表:
-
1.視頻播放參數
視頻碼率 kb/s
視頻幀率 fps
視頻分辨率 -
2.I P B幀
I幀:獨立成像,GOP的基礎幀一組只有一個I幀,可指定出現頻率
P幀:根據前幀來解碼
B幀:前後參考所得 -
3.壓縮算法
MPEG2
H264
H265
AVS -
4.音頻
波形,模擬轉數字
採樣頻率:44100
採樣深度:16bit
單雙通道
4分鐘採樣大小:44100 * 16 * 2 * 4 * 60 = 338688000bit/8/1024/1024 = 40M -
5.音頻概念擴展
採樣頻率:每秒鐘採樣點的個數
22000 (22kHz):無線廣播
44100 (44kHz):CD音質
48000 (48kHz):數字電視,DVD
96000 (96kHz) :藍光,高清採樣精度:每個樣本點的大小,8bit 16bit 24bit
通道數:單聲道、雙聲道、四聲道、5.1聲道
搜索:變聲不變調算法
音頻的幀:其實音頻沒有幀的概念,
這裏假定,每幀持續時間 = 每幀採樣數 / 採樣頻率
交錯模式:左右聲道樣本交互記錄
非交錯模式:先記錄一個週期內所有左聲道樣本 -
6.視音頻的封裝格式
也叫容器:將以編碼壓縮好的視頻流、音頻流、字幕流按照一定的方案放到一個文件中,便於播放軟件播放
常見容器格式有:MP4, FLV, RMVB, AVI, MPEG -
7.音視頻同步
這裏有很多實現,以後討論 -
8.視音頻相關常見的開源項目
ffmpeg, ijkplayer, QMPlay2
後面詳細討論介紹FFmpeg
下面是一些視頻編碼相關的概念:
-
9.視頻編碼標準
ITU-T ISO
H.265/HEVC -
10.編碼形式類別
基於波形的編碼:MPEG-1, MPEG-2, H.264, H.265
基於內容的編碼:MPEG-4
-
11.信源編碼器概念
幀內編碼/幀間編碼
幀間編碼/運動估計
幀內編碼
環路濾波器 -
H.264架構
每一幀被分爲一個或多個條帶(slice)進行編碼;每一個條帶包含多個宏塊
宏塊是H.264基本的編碼單元,包含一個16×16亮度塊 + 兩個8×8色度塊 + 其他一些宏塊頭 信息;H.264編解碼器:JM ,X264
H.264碼流結構:NAL單元,NAL Unit 格式
-
熵編碼
哈夫曼編碼:
建立哈夫曼二叉樹,構造碼錶H.264中的熵編碼:指數哥倫布編碼
編碼算法:CAVLC,CABAC
封裝格式與編碼格式:H261,塊結構混合編碼
-
常用視音頻分析工具
文件總體信息:MediaInfo
封裝格式信息:Elecard Format Analyzer
H.264碼流分析信息:Elecard Stream Eye
YUV視頻像素數據:YUV Player
PCM音頻採樣數據:Audition