音視頻編解碼學習之編解碼框架

原創

Linux高级开发

2020-06-29 20:52

1. 壓縮碼流

語法：碼流中各個元素的位置關係01001001…圖像編碼類型(01)，宏塊類型(00)，編碼係數1001等
語義：每個語法元素所表達的意義。例如：圖像編碼類型

2. 編碼層次

序列（Sequence）
圖像組（Group of Pictures，GOP）
圖像（Picture）
條帶（Slice）
宏塊（Macroblock，MB）
塊(Block)

3. 碼流結構

4. PB幀編碼

5. 序列編碼對象

（1）IBBP序列

序列：一段連續編碼的並具有相同參數的視頻圖像。
序列起始碼：專有的一段比特串，標識一個序列的壓縮數據的開始MPEG-2的序列起始碼爲十六進制數000001(B3)。
序列頭：記錄序列信息檔次（Profile），級別（Level），寬度，高度，是否是逐行序列，幀率等。
序列結束碼：專有的一段比特串，標識該序列的壓縮數據的結束MPEG-2的序列結束碼爲十六進制數000001(B7)。

（2）圖像組編碼對象

6. 圖像編碼結構

圖像：
圖像起始碼：專有的一段比特串，標識一個圖像的壓縮數據的開始MPEG-2的圖像起始碼爲十六進制數000001(00)。
圖像頭：記錄圖像信息圖像編碼類型，圖像距離，圖像編碼結構，圖像是否爲逐行掃描。

7. 圖像分塊編碼

8. 條帶編碼結構

條帶：多個宏塊的組合。
條帶起始碼：專有的一段比特串，標識一個條帶的壓縮數據的開始MPEG-2的條帶起始碼爲十六進制數000001(0~AF)。
條帶頭：記錄當前圖像的相關信息條帶位置，條帶量化參數，宏塊編碼技術標識等。

9. 條帶編碼對象

10. 宏塊編碼結構

宏塊：16x16的像素塊（對亮度而言）。
宏塊內容：宏塊編碼類型，編碼模式，參考幀索引，運動矢量信息，宏塊編碼係數等。

11. 宏塊編碼對象

12. 塊編碼結構

8x8或4x4塊的變換量化係數的熵編碼數據。
CBP (Coded Block Patten)：用來指示塊的變換量化係數是否全爲零。對於YUV(4:2:0)編碼，CBP通常6比特長，每個比特對應一個塊，當某一塊的變換量化係數全爲零時，其對應比特位值爲0，否則爲1。
每個塊的變換量化係數的最後用一個EOB (End of Block)符號來標識。

13. 視頻編解碼關鍵技術

預測：通過幀內預測和幀間預測降低視頻圖像的空間冗餘和時間冗餘。
變換：通過從時域到頻域的變換，去除相鄰數據之間的相關性，即去除空間冗餘。
量化：通過用更粗糙的數據表示精細的數據來降低編碼的數據量，或者通過去除人眼不敏感的信息來降低編碼數據量。
掃描：將二維變換量化數據重新組織成一維的數據序列。
熵編碼：根據待編碼數據的概率特性減少編碼冗餘。

14. 預測

空間預測：利用圖像空間相鄰像素的相關性來預測的方法。幀內預測技術：利用當前編碼塊周圍已經重構出來的像素預測當前塊Intra圖像編碼（I幀）
時間預測：利用時間上相鄰圖像的相關性來預測的方法。幀間預測：運動估計（Motion Estimation，ME），運動補償（Motion Compensation，MC）Inter圖像編碼：前向預測編碼圖像（P幀），雙向預測編碼圖像（B幀）

15. 幀內預測

I幀圖像的每個宏塊都採用幀內（Intra）預測編碼模式。
宏塊分成8x8或者4x4塊，對每個塊採用幀內預測編碼，稱作Intra8x8或者Intra4x4。
幀內預測有多個預測方向：水平，垂直，左下，右上。
幀內預測還有直流（DC）預測。
色度塊預測還有平面預測。

16. 幀間預測

塊基運動估計：爲待預測塊在參考幀上找到最佳的預測塊，並記錄預測塊在參考幀上的相對位置。
運動矢量（MV）：參考幀上的預測塊與當前幀上的的待預測塊的相對位置。MV有兩個分量：（x，y）
分像素運動估計最佳的預測塊不在整像素位置，而在分像素位置；1/2，1/4，1/8像素插值得到分像素值。
幀間預測流程：
運動補償：給定MV和參考幀，爲待解碼塊從參考幀上獲取預測塊。
運動矢量編碼MV預測：用當前塊的周圍可得到鄰塊的運動矢量來預測當前塊的運動矢量運動矢量差（MV difference，MVD）：實際運動矢量與預測運動矢量的差，即：運動矢量差採用變長編碼。

17. 預測殘差

18. 變換編碼

變換編碼：通過變換將空域信號轉換爲頻域信號來去除空間信號的冗餘信息，減少編碼數據。
二維離散餘弦變換4x4變換，8x8變換

二維離散餘弦變換

例：

變換系數：直流（DC）係數，交流（AC）係數

19. 量化

量化原理：將含有大量的數據集合映射到含有少量的數據集合中。

一般情況下量化後高頻部分包含大量的零係數

量化對主觀質量的影響

20. 掃描

掃描：將二維數據轉換爲一維的數據序列。

21. 熵編碼

熵編碼：根據符號出現的概率，對經常出現的符號分配較短的碼字，對不常出現的符號分配較長的碼字。
Level-Run編碼：用數據中非零值和其前面非零值之間出現零值的個數重新描述量化係數序列爲（Level，Run）二元組序列

變長編碼將Level-Run編碼後的（level，run）變長編碼成最終的比特串。

22. 碼率控制

受到緩衝區，帶寬的限制，編碼碼率不能無限制的增長，因此需要通過碼率控制來將編碼碼流控制在目標碼率範圍內。
一般通過調整量化參數的手段控制碼率幀級控制條帶級控制宏塊級控制
碼率控制考慮的問題防止碼流有較大的波動，導致緩衝區發生溢出，同時保持緩衝區儘可能的充滿，讓圖像質量儘可能的好而且穩定
CBR（Constant Bit Rate）比特率穩定，但圖像質量變化大
VBR（Variable Bit Rate）比特率波動大，但圖像質量穩定
碼率控制算法碼率分配碼率控制
碼率控制屬於非標準技術編碼端有，解碼端沒有

第5章預測

1. 預測技術

目的：去除空間冗餘和時間冗餘。
視頻存在大量的空間冗餘和時間冗餘空間冗餘：用幀內預測編碼去除基於塊的幀內預測時間冗餘：用幀間預測編碼去除基於塊匹配（Block Matching）的幀間預測
預測後得到去除大部分空間或時間冗餘的殘差

2. 空間冗餘

圖像空間相鄰像素具有很強的相關性。
幀內預測技術去除空間冗餘

另外關於c++ Linux後臺服務器開發的一些知識點分享：Linux，Nginx，MySQL，Redis，P2P，K8S，Docker，TCP/IP，協程，DPDK，webrtc，音視頻等等視頻。

可以加入到羣裏一起探討技術交流

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

十年編程經驗一朝面試被刷，技術面試如何提升表現？

又是一年金三銀四，不同以往的是，當前的職場環境已經不再是那個雙向奔赴的美好時代了。求職者在變多，HC 在變少，崗位要求還更高了，面對這樣的困境，技術人員應該如何突圍？騰訊雲開發者社區特邀前貝殼金服小微企業生態 CTO、騰訊雲 TVP

2024-05-08 23:17:58

程序員不存在了……嗎？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

眼看他搭中臺，眼看他又拆了

曾幾何時，中臺一度被當做“變革靈藥”，嫁接在“前臺作戰單元”和“後臺資源部門”之間，實現企業各業務線的“打通”和全域業務能力集成，提高開發和服務效率。但在中臺如火如荼之際，我們可以發現各大企業又在反其道而行，紛紛不斷進行“拆中臺”，那

2024-05-08 11:12:05

企業IT架構治理之道| 京東雲技術團隊

一、什麼是架構和治理 1.1 架構的起源開篇還是要說說大家理解的架構，何爲架構，架構跟我們的工作和生活有什麼關係。英文Architecture本源來自於拉丁語，最早起源於建築領域，建築是文明社會一個重要的標誌，同時也是人類社會最早形

2024-05-07 23:17:13

賦能開發者，騰訊雲與你共探AI提升十倍生產力之路

引言 AI 技術發展迅速，對於開發者而言，AI 既可能是提高生產力的神兵利器，也可能成爲職業生涯潛在的“威脅”。開發者如何與 AI 協同進化，提升個人能力和價值；如何利用提高 AI 生產力，推動企業創新，實現降本提效

2024-04-28 11:11:17

從零開始學架構V2-架構設計流程-2

一、架構設計流程架構的設計的是爲了降低整體的複雜性，那麼架構設計的第一步就是熟悉業務，識別其中的核心訴求，僅考慮技術的話就是識別複雜度。 1.1 識別複雜度架構的複雜度主要來源於第一節中介紹的“高性能”“高可用”“可擴展”等幾個方面，實

2024-04-25 23:56:26

從零開始學架構V2-初識架構設計-1

一、架構設計的主要目的爲了解決軟件系統複雜度帶來的問題二、複雜性來源軟件的架構設計是一個非常複雜的過程；基於業務&技術現狀、公司成本、團隊規模、團隊技術能力、近三年業務發展規模預測、技術發展趨勢等條件篩選出合適的技術、編寫多種架構設計

2024-04-25 23:56:25

流水線運行出錯排查難？AI 來幫你

“我的企業有幾千條流水線，每次流水線運行出錯，都要投入不少的技術人員進去排查，需要花費不少的時間。” 遇到這種情況，怎麼解決。在 AI 爆火的今天，AI 如何助力 DevOps 效率提升？雲效與阿里雲通義大模型合作，推出了流水線智能排查能

2024-04-24 21:12:07

【微電平臺】-高併發實戰經驗-奇葩問題解決及流程優化之旅

微電平臺微電平臺是集電銷、企業微信等於一體的綜合智能SCRM SAAS化系統，涵蓋多渠道管理、全客戶生命週期管理、私域營銷運營等主要功能，承接了京東各業務線服務，專注於爲業務提供職場外包式的一站式客戶管理及一體化私域運營服務。

2024-04-23 23:16:01

入職3年-我如何做一名AI產品經理

引言從2021年校招加入京東開始，我一直從事AI產品經理的工作，有幸見證了AI行業的熱情從一臺臺服務器燒到了全世界各個角落，也見證了京東AI中臺團隊的影響力如何一步步的擴大。從21年的迷茫到24年的堅定，很慶幸我正走在適合自己的道路上，

2024-04-22 11:16:31

寫給職場新人｜從迷茫到屢獲殊榮的技術人成長之路

在這個時代，技術的每一次飛躍都在重塑我們的工作方式。借Up技術人專欄活動寫了這篇文章，回望一下我和計算機打交道的這幾年，希望能給學生或職場新人們一些幫助。 1.錨定方向：學生生涯的一次探險如果用一個詞語概括我的本科階段，那大概就

2024-04-19 23:17:23

Create 2024 分論壇：百度大模型安全解決方案護航開發者一起創造未來

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

2024-04-19 21:33:25

京東內部研效架構師訓練營，首次對外公開課，不可錯過的研效之旅！

五月繁花似錦，讓我們帶你走進京東，開啓研效實戰之旅！四大單位聯合發起本次活動由“全國雲計算技術行業產教融合共同體”發起，聯合工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會、京東雲共同主辦，重磅推出“卓越研效架構師”

京東雲開發者

2024-04-19 11:16:30

Milvus 老友匯｜RAG 場景、電商平臺、AI 平臺……如何用向量數據庫構建業務方案？

近日，Milvus 老友匯·Arch Meetup 在深圳圓滿落幕。本次 Meetup 由 Milvus 社區攜手 Shopee 共同舉辦，同時還邀請到來自 AWS、點石科技的技術專家，分享電商行業、RAG 場景、AI 平臺等如何基

2024-04-17 21:20:23

DDD落地指南-架構師眼中的餐廳

在去年、我整理了一篇名爲《如何做架構設計？》的文章，主要探討了架構設計的目標和過程，然而、那是一篇概括性的文章，用於啓發思路，並不是具體的實踐指南，因此、我一直期望給出具體參考案例。我幾乎忘了這件事，如今回顧、我發現並沒有合適的案例可供參

2024-04-16 11:16:34

24小時熱門文章

最新文章

最新評論文章