【經驗分享】RTC 技術系列之視頻編解碼

原創

2021-06-15 15:43

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"要了解什麼是視頻編解碼，首先我們需要了解什麼是視頻","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"視頻歸根結底是一系列連續的圖像幀，當這些圖像以一定速率播放時，人眼就會判斷其是連續活動的，這樣就構成了視頻。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"那爲什麼要進行視頻編解碼呢，因爲視頻信號數字化後數據量巨大，如果以這樣的數據量進行網絡傳輸或者存儲時，會佔用大量的帶寬和存儲空間，造成浪費。已當前主流的1080P分辨率，一秒30幀的視頻舉例","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"1080P圖像的高和寬分別爲1080和1920，每個像素用三原色RGB表示(即每個像素三個字節)，因此每幀圖像的數據量爲1080*1920*3*8=49766400，每秒30幀，則需要乘以30，49766400*30 = 1,492,992,000bps。因此視頻編解碼技術因此而誕生。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"爲什麼視頻可以壓縮呢，我們分兩個方面看這個問題","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"1 在一副圖像中，往往有相近的顏色區域，這樣就蘊含了大量的冗餘信息，可以基於","attrs":{}},{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"變化編碼和量化編碼進行冗餘信息處理，達到壓縮的可能。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"2 兩幅圖像之間，肯定也存在大量相同以及相似的部分，因此產生了運動補償及運動估計來描述運動矢量來進行圖像間冗餘信息壓縮的可能。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"基於圖像內預測編碼和圖像間預測編碼原理，誕生了衆多的視頻編解碼","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https://static001.geekbang.org/infoq/bf/bfeeefe21e63d537b79238804a7a33e6.jpeg","alt":null,"title":null,"style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":null,"fromPaste":true,"pastePass":true}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"H.26X系列，從H.261,H.263,到當前主流的H.264,及H.265,當前最新制定標準的H.266；H.26X系列的發展宗旨爲使用技術優化壓縮數據量不能夠達到更好的視頻質量；像","attrs":{}},{"type":"text","text":"H.265旨僅需原先的一半帶寬即可播放相同質量的視頻。它與H.264有着相類似的算法架構，並同時對一些相關技術加以改進而大幅提高視頻質量。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"Mpeg系列，Mpeg1,Mpeg2,Mpeg4(Mpeg4之後與H.264融合)","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"VP系列，VP8,VP9；VP系列是Google自研並開源的編解碼系列，Google創建VP系列編解碼的原因也是H.264需要專利費用，即如果WebRTC使用H.264，則需要按瀏覽器支付相關的專利費用(當然由於H.264廣泛支持性，主要原因還是cisco開源了OpenH64)，VP8即對標H.264，除了在WebRTC領域，其知名度和支持度則相對有限；","attrs":{}},{"type":"text","text":"VP9則對標H.265，VP9的目標之一是在保證相同質量的情況下相對於VP8可以減少50%左右的碼率，換句話說，相同的碼率，VP9能比VP8畫質有非常明顯的提高。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"國產系列，AVS標準，AVS1.0,AVS2.0；","attrs":{}},{"type":"text","text":"AVS是我國具備自主知識產權的第二代信源編碼標準。AVS2.0，屬於與H.265和VP9同級的新一代標準；雖然AVS的使用和知名度貌似不高，但說明我國已經注意到這個領域併發力。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"SVAC標準，我國一個應用於視頻監控領域的編解碼，特點在於加密認證高安全：規定了加密和認證接口及數據格式，保證數據的安全性、完整性、非否認性；感興趣區域（ROI）編碼：圖像分爲若干個感興趣區域和一個背景區域，在重點監控區域保證實時視頻信息，幀率較高，節省非感興趣區域的開銷; 視頻信息嵌入，可將聲音識別特徵參數、特殊事件、時間等信息都可嵌入編碼裏，在不解開視頻的前提下，可針對性的提取、快速檢索、分類查詢;可伸縮性視頻解碼（SVC）：對視頻數據分層編碼，滿足不同傳輸網絡寬帶和數據存儲環境的需求，普通編碼程序傳輸有主碼流、子碼流，佔用帶寬較大，SVAC傳輸只有一類碼流，對碼流分層就可獲得不同分辨率的圖片信息。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"WebRTC最初由Google提出，主要是基於瀏覽器的RTC通訊，故此叫做WebRTC；初期幾大瀏覽器在WebRTC及其視頻編解碼支持的力度上也是不一的，像Mozilla陣營的Chrome，FireFox，Opera初期也不一樣，Chrome初期只支持VP系列，原因上面介紹過，後續逐漸延伸到H.264，由於原有的RTC通訊領域大都使用H.264編解碼，因此H.264的支持對於跨領域RTC互通提供了很大便利，我覺得也一定程度上加速了WebRTC的發展，比如瀏覽器和手機同時加入到視頻會議；或者瀏覽器跟當前的SIP終端點點通話，由於H.264的支持，大大減少了轉碼的要求，做視頻的轉碼是非常消耗性能的，或者使用專用硬件實現。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https://static001.geekbang.org/infoq/d2/d242b8a3e7fd7d5acd394cd09ffdde12.jpeg","alt":null,"title":null,"style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":null,"fromPaste":true,"pastePass":true}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當然後續越來越多廠家加入了WebRTC領域，像Agora聲網的RTC系統，已經超過了WebRTC，像他的各種硬件芯片平臺的SDK適配，SD-RTN系統(優先路徑選擇確保高的傳輸質量，畢竟通訊不是純終端側的功能，網絡對通訊質量，視頻或者音頻的影響也是juda)，優異的弱網對抗算法，可以抵禦70%的視頻丟包確保通話流暢。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當前隨着物聯網的發展，除了人們的通話通訊，音視頻會議之外，RTC越來越廣泛的應用各個領域；像安防監控，智能硬件終端，視頻處理所處的硬件設備越來越小型甚至微型化，原有的基於軟件進行編解碼，無論從內存，CPU，性能等資源佔用方面，都顯示出很大劣勢；衆多廠家也意識到這個情況，因此越來越多的專業芯片幹專業事情的趨勢越發明顯。像監控領域，華爲海思ARM+專業視頻處理單元，佔據了國內視頻70%以上的市場；NVIDIA推出了Jeston系列芯片，應對邊緣計算場景，ARM+GPU的處理方式更通用，同時由於ARM的低功耗，可以使得邊緣側設備具備視頻處理，機器視覺處理，AI分析能力，大大豐富了智能物聯網的應用。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"由於這兩年的疫情，在線教育，直播的發展，Web實時通訊帶來了非常大的發展機會，其商業化成功也爲技術發展持續注入了活力；伴隨着5G的火熱，VR/AR、自動駕駛等新應用場景的出現，必將爲WebRTC技術帶來新的動力，催動着基於互聯網的實時音視頻通信技術的發展。","attrs":{}}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Java中的Semaphore和CountDownLatch這兩個工具類的使用方法和實際應用場景

在現代的多線程編程中，Semaphore和CountDownLatch是兩個非常常見和重要的工具類，它們都可以用來實現多線程間的同步和互斥，提高程序的併發性能和效率。本文將詳細介紹Java中的Semaphore和CountDownLatch

2024-04-20 00:54:00

MySQL 創建表後神祕消失？揭祕零寬字符陷阱

三招教你解決零寬字符陷阱，讓你的數據庫不再”鬧鬼“。作者：秦福朗，愛可生 DBA 團隊成員，負責項目日常問題處理及公司平臺問題排查。熱愛互聯網，會攝影、懂廚藝，不會廚藝的 DBA 不是好司機，didi~ 愛可生開源社區出品，原創內容未經

2024-04-19 23:21:06

手動給docusaurus添加一個搜索

新版博客用docusaurus重構已經有些日子了，根據docusaurus的文檔上也申請了Algolia,想一勞永逸的解決博客的搜索問題。但是流水有意，落花無情。 algolia總是不給我回復，我只能對着algolia的申請頁面仰天長嘆。

2024-04-19 21:30:54

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

AI安全啓示錄：銀行最常遇到的五類AI攻擊手段

根據麥肯錫研究所的數據，基於AI的身份欺詐已成爲美國增長最快的金融犯罪類型，並且在全球範圍內呈上升趨勢。英國GDG的研究表明，英國有超過860萬人使用虛假或他人的身份來獲取商品、服務或信貸。美國財政部近日發佈在一份題爲《金融服務業中特定於

2024-04-18 23:33:14

庫存領域核心能力--庫存預佔建設實踐

前言本文總結庫存領域建設庫存預佔能力時遇到的問題以及解決方案。感謝【金鵬】、【孫靜】、【陳瑞】同學在本文撰寫中提供的內容及幫助！ 1、庫存預佔業務概述消費者拍下商品訂單後，庫存系統先爲該訂單預留庫存，這個預留庫存的動作被稱爲庫存預佔

2024-04-18 23:17:21

微服務架構下如何通過弱依賴原則保障系統高可用

前言當我初次接觸高可用這個概念的時候，對高可用的【少依賴原則】和【弱依賴原則】的邊界感模糊，甚至有些“傻傻分不清楚”。這兩個原則都關注降低模塊之間的依賴關係，但它們之間的確存在某些差異。那麼，「少依賴原則」和「弱依賴原則」它們之間本質

2024-04-18 23:17:20

O2OA(翱途)開發平臺新手上路-信息管理和信息欄目開發

本篇主要使用實例開發的方式講述如何在O2OA(翱途)開發平臺中開發一個簡單的通知公告，包括欄目創建，分類設置，表單設計以及如何驗證表單開發成果。一、先決條件： 1、O2Server服務器正常運行 2、以擁有管理員權限的用戶賬號登錄O

2024-04-18 22:25:54

勞動節H5好難做？那是你沒看到這些模板！

隨着勞動節的步伐越來越近各大門店開始爭相公佈各自的促銷活動了各類社交媒體上的節日宣傳海報也陸續多了起來線下線上到處洋溢着濃郁的營銷氣息衆所周知，營銷宜早不宜遲再不出手，就要出局啦這個時候，我猜大家一定都缺這樣一波勞動

2024-04-18 22:24:40

New！界面控件DevExpress WinForms v24.1預覽版搶先體驗

DevExpress WinForm擁有180+組件和UI庫，能爲Windows Forms平臺創建具有影響力的業務解決方案。DevExpress WinForms能完美構建流暢、美觀且易於使用的應用程序，無論是Office風格的界面，還是

2024-04-18 11:35:17

文心大模型ERNIE-Tiny：輕量化技術的全面解讀

隨着人工智能技術的日益成熟，大模型成爲了衆多領域的研究熱點。大模型通過龐大的數據量和複雜的網絡結構，實現了對數據的深度挖掘和高效處理。然而，大模型的龐大體積和高計算成本也限制了其在一些實際場景中的應用。爲了解決這一問題，文心大模型ERNIE

2024-04-18 11:29:53

Open WebUI大模型對話平臺：適配Ollama的實踐與探索

隨着人工智能技術的飛速發展，大模型對話平臺成爲了衆多領域中的熱門話題。Open WebUI大模型對話平臺作爲一款功能強大的工具，爲我們提供了一種無縫集成文檔交互、輕鬆訪問Web內容、訓練模型以及實現多模態交互的方式。在本文中，我們將深入探討

2024-04-18 11:29:51

Qt/C++音視頻開發70-無感切換通道/無縫切換播放視頻/多通道流暢切換/不同視頻打開無縫切換

一、前言之前就寫過這個方案，當時做的是ffmpeg內核版本，由於ffmpeg內核解析都是代碼實現，所以無縫切換非常完美，看不到絲毫的中間切換過程，看起來就像是在一個通道畫面中。其實這種切換隻能說是取巧辦法，最佳的辦法應該是公用一個open

2024-04-18 10:40:53

架構設計｜基於 raft-listener 實現實時同步的主備集羣

背景以及需求線上業務對數據庫可用性可靠性要求較高，要求需要有雙 AZ 的主備容災機制。主備集羣要求數據和 schema 信息實時同步，數據同步平均時延要求在 1s 之內，p99 要求在 2s 之內。主備集羣數據要求一致要求能夠在主

2024-04-18 01:07:18

一款國產的開發輔助AI插件！

@[toc] 昨天百度舉行了 Create 2024 百度 AI 開發者大會，松哥得以近距離了解了百度的 AI 產品，以前就瞭解文心一言，其他的都用的少。昨天在會場上李彥宏介紹了百度的一個 AI 輔助工具 Comate，晚上回來趕緊體驗了一

2024-04-18 00:15:13

24小時熱門文章

最新文章

最新評論文章