視音頻基礎概念學習小結

音視頻基礎知識-常用名詞概念列表:

  • 1.視頻播放參數

    視頻碼率 kb/s
    視頻幀率 fps
    視頻分辨率

  • 2.I P B幀

    I幀:獨立成像,GOP的基礎幀一組只有一個I幀,可指定出現頻率
    P幀:根據前幀來解碼
    B幀:前後參考所得

  • 3.壓縮算法

    MPEG2
    H264
    H265
    AVS

  • 4.音頻

    波形,模擬轉數字
    採樣頻率:44100
    採樣深度:16bit
    單雙通道
    4分鐘採樣大小:44100 * 16 * 2 * 4 * 60 = 338688000bit/8/1024/1024 = 40M

  • 5.音頻概念擴展

    採樣頻率:每秒鐘採樣點的個數
    22000 (22kHz):無線廣播
    44100 (44kHz):CD音質
    48000 (48kHz):數字電視,DVD
    96000 (96kHz) :藍光,高清

    採樣精度:每個樣本點的大小,8bit 16bit 24bit

    通道數:單聲道、雙聲道、四聲道、5.1聲道

    搜索:變聲不變調算法

    音頻的幀:其實音頻沒有幀的概念,
    這裏假定,每幀持續時間 = 每幀採樣數 / 採樣頻率
    交錯模式:左右聲道樣本交互記錄
    非交錯模式:先記錄一個週期內所有左聲道樣本

  • 6.視音頻的封裝格式

    也叫容器:將以編碼壓縮好的視頻流、音頻流、字幕流按照一定的方案放到一個文件中,便於播放軟件播放
    常見容器格式有:MP4, FLV, RMVB, AVI, MPEG

  • 7.音視頻同步
    這裏有很多實現,以後討論

  • 8.視音頻相關常見的開源項目
    ffmpeg, ijkplayer, QMPlay2
    後面詳細討論介紹FFmpeg

下面是一些視頻編碼相關的概念:

  • 9.視頻編碼標準

    ITU-T ISO
    H.265/HEVC

  • 10.編碼形式類別

    基於波形的編碼:MPEG-1, MPEG-2, H.264, H.265

    基於內容的編碼:MPEG-4

  • 11.信源編碼器概念

    幀內編碼/幀間編碼
    幀間編碼/運動估計
    幀內編碼
    環路濾波器

  • H.264架構

    每一幀被分爲一個或多個條帶(slice)進行編碼;每一個條帶包含多個宏塊
    宏塊是H.264基本的編碼單元,包含一個16×16亮度塊 + 兩個8×8色度塊 + 其他一些宏塊頭 信息;

    H.264編解碼器:JM ,X264

    H.264碼流結構:NAL單元,NAL Unit 格式

  • 熵編碼

    哈夫曼編碼:
    建立哈夫曼二叉樹,構造碼錶

    H.264中的熵編碼:指數哥倫布編碼

    編碼算法:CAVLC,CABAC

    封裝格式與編碼格式:H261,塊結構混合編碼

  • 常用視音頻分析工具
    文件總體信息:MediaInfo
    封裝格式信息:Elecard Format Analyzer
    H.264碼流分析信息:Elecard Stream Eye
    YUV視頻像素數據:YUV Player
    PCM音頻採樣數據:Audition

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章