1　MPEG-2技術

MPEG-2的初衷是爲廣播級電視質量（CCIR601格式）的視音頻信號定義的壓縮編碼標準，但最終結果是成爲了一個通用的標準，能在很大範圍內對不同分辨率和不同輸出比特率的圖像信號進行有效編碼。

MPEG-2的編碼技術主要基於兩個概念：即時間相關性與空間相關性。所謂時間相關性指的是物體前後運動的連續性，例如，一扇門的開啓不可能是開關兩個狀態，而一定是關、微開、開等一系列的連續動作，因此利用前一次的動作可以預測下一次的動作；空間相關性指的是空間內相鄰物體的色彩和亮度是一個漸變過程，而非一個突變過程。有一點美術常識的人都很容易明白，即白黑的過渡是漸進的，而非突變。如果將空間每一點及時間上每一幀進行獨立編碼，雖然能夠表達所有的信息，但是帶寬非常大，幾乎沒有一樣載體可以經濟地傳送這種信號；另一方面從信息學的角度來看，也包含着大量的冗餘信息。數據壓縮正是基於這樣的角度，採用相應的編碼方式將大量的冗餘信息去除，保留有用的信息，有效節省帶寬。

MPEG－2技術綜合採用了3大基本編碼技術，即預測編碼、變換編碼和統計編碼。壓縮技術採用多種編碼手段消除系統的冗餘信息，歸納起來將有以下四個方面。
①利用二維DCT減少圖像的空間冗餘度；
②利用運動補償預測減少圖像的時間域冗餘度；
③利用視覺加權量化減少圖像的“灰度域”冗餘度；
④利用熵編碼來減少圖像“頻率域”上統計特性方面的冗餘度；

此外，MPEG－2在MPEG－1的基礎之上擴充了“可伸縮性”和“可分級性”兩個概念，

所謂“可伸縮性”指的是對碼流的一部分進行編碼和對碼流的全部解碼獲得的圖像分辨率（或信噪比等）要低。MPEG－2所支持的可伸縮的視頻編碼方式共有時間、空間、信噪比及數據分割等四種。

“可分級性”則是指在 MPEG－2中用範疇（Profile）以及層次兩個定義來描述不同的編碼參數集。每個範疇是前一個的合集（Profile），層次則規定了空間和時間分辨率的上限。

MPEG－2標準的第3部分詳細地描述音頻部分的壓縮，並在MPEG－1的基礎之上，增加了AC－3編碼方式。對音頻部分信號採用3種壓縮模式，稱爲層次1、2和3。隨着層次的增加，複雜度相應增加，層次具有向下兼容性，即層次3的解碼器可以對層次2或層次1編碼的碼流進行解碼。

層次2與MUSICAM（Masking Pattern Adapted Universal Subband Integrated Coding and Mul－tiplexing）壓縮方法相同。對於頻率在20kHz以下的音樂信號，以48kHz（或44．1kHz）採用並用16（或18）比特量化，採用上述的方法可以將雙聲道立體聲的一個聲道壓縮成96或128kb／s。層次1是層次2的簡化形式，它將單聲道壓縮到192或256kb／s。層次3即我們通常說的MP3，採用了MUSICAM和ASPEC（Adaptive Spectual Perceptual Entropy Coding）兩種算法的結合，壓縮後的比特率爲每聲道64kb／s。

AC-3則是對6個聲道的音頻進行壓縮的標準，這6個聲道分別爲左、中、右、左環繞、右環繞和低頻增強，其中前5個聲道的帶寬爲3Hz20kHz，最後一個聲道限制在120Hz。所有聲道的採樣率均爲48kHz，每個取樣值量化到1622b，並採用TDAC分析儀將音頻信號劃分成子帶，然後根據人的聽覺心理－生理特徵對不同子帶信號採取不同的量化以實現數據的壓縮。多個聲道的總數據率最後壓縮成320kb／s。

2　MPEG－4技術

從技術角度來看，MPEG－4標準與MPEG－2標準的基點大相徑庭，MPEG－4不再將圖像看成是一個矩形像素陣列的序列，把音頻看成是一個多聲道或單聲道的聲音，而是深入到組成一個場景的視頻、音頻對象的語義中去，對不同的主體採用不同的編碼方式，例如把一幅圖像中活潑的白貓和毛線團以及背景中的房間分別進行編碼。各種視、音頻源不限於自然界，也可以是合成源，最終在解碼端進行組合。因此MPEG－4是完全基於對象的一種編碼方式。當然 MPEG－4採用了比MPEG－2更爲先進的壓縮方式，因此簡單說，基於內容的壓縮、更高的壓縮比和時空可伸縮性是MPEG－4的3個最重要的特點。

MPEG－4幾乎涵蓋了MPEG－2的所有功能，並支持基於內容的獨立編碼和解碼。此項功能又成爲基於內容的可分級性，這一機制爲壓縮域中對圖像或視頻內容的交互提供了最基本機制，而無須在接收機做進一步的分割或代碼轉換。

MPEG－4自制定之日起，就受到了密切關注，從1993年開始着手製定，到預定完成時間（1997年）似乎仍很不成熟，因而轉向全面支持目前標準尚未全面支持的應用。例如，移動通信中的聲像業務、與其它多媒體數據（如計算機產生的圖形、圖像）的集成和交互式多媒體服務等。MPEG－4發展的艱難歷程可以從兩個方面加以說明。

（1）MPEG－4標準在制定時想適用於所有的應用和環境，並想採用第二代壓縮算法。但是實際由於當時第二代算法中的很多算法都很不成熟，因此結果使得MPEG－4的壓縮技術變的難度很高，使得其不得不中途變節，加長了應用的時間、喪失了佔據市場的先機；

（2）由於時間上的延遲，本希望應用於各種場合，結果反變成沒有適用的場合。從低信息量的視訊電話、視訊會議、到儲存媒體的VCD、DVD，到最高品質的HDTV，各種標準已經確定，各相關產品也已經陸續上市。而廠商受限於研發及銷售成本和時間的考慮，不太可能爲了新的標準而重新開發產品。

MPEG-4標準

現代移動通訊和個人通訊業務要求從普通話音擴展到多媒體業務，即提供聲音、文字、數據、圖形和視頻等信息媒體，使用戶在移動通訊網中進行生動、豐富和有效的多媒體信息交流，其實現的關鍵技術是甚低速音頻視頻壓縮。

MPEG-4目標
專門用於64Kbps以下甚低速率的音視編碼
適用於移動通訊、個人通訊、固定公用通訊網和電視電話
適用於窄帶多媒體通訊等廣泛應用
實現基於內容的壓縮編碼，具有良好兼容性、伸縮性和可靠性

MPEG-4主要功能
基於內容的多媒體數據存取工具
基於內容的管理和數碼流的編輯
自然的與合成的景物混合編碼
時間域的隨機存取
改進編碼效率
多路並存的數碼流編碼
通用存取差錯環境中的堅韌性
基於內容的可分級性

MPEG-4的顯著特點是"基於內容的"，編碼時，應考慮不同視頻內容，如：文字、繪圖與計算機生成的景象，畫面各部分活動情況等；視頻格式應包括以下參數：空間亮度分辨率，空間色度分辨率，時間分辨率，像素寬高比，取樣量化，Y、Cb、Cr樣值比特率，色度空間、逐行或隔行掃描，平面或立體等。 MPEG-4制定了一個稱爲傳輸多媒體集成框架（DMIF）的會話協議，用來管理多媒體數據流。

從模式上看，校園網的組播應用主要分爲點到多點（包括信息推送、管理通知、節目播放等應用）、多點到多點（包括視頻會議、協同工作、平行處理、網絡遊戲等應用）、多點到點（包括數據採集、資源查找等應用）三種類型的應用，通過對校園網應用的瞭解，前兩者需求較大。從應用的內容和服務質量要求看，多媒體相關的應用如視頻/音頻會議會佔到很大的帶寬，對網絡的質量要求較高。

3　結論

通過以上的介紹不難看出，MPEG-2與MPEG-4之間最根本的區別在於編碼的出發點的不同，前者是基於矩陣相素圖像的壓縮，後種是基於圖像中不同物體的壓縮；前者發展的比較成熟，並已經成爲廣播電視行業的標準，後者主要針對於低碼率場合應用，適用相對範圍寬。從發展趨勢上看，MPEG－2將會在有線電視網上進一步發展，而MPEG-7則是MPEG-4的進一步發展，主要適用於基於對象的查詢。

===================

MPEG2與MPEG4在視頻編碼的簡單比較

MPEG2 制定於1994年，是建立在MPEG1之上，設計目標是高級工業標準的圖像質量以及更高的傳輸率。它主要應用在沒有色度畸變要求場合的高質量視頻，數據速率在1.1Mbps到20Mbps之間。MPEG2能夠提供廣播級的視像和CD級的音質。MPEG2不僅能錄製電視節目，而且還是爲錄製高清晰度的高質量動態圖像而開發的，能夠存儲比MPEG1清晰度更高的動態圖像。除了作爲DVD的指定標準外，MPEG2還可用於爲數字有線電視分配、通過ATM的網絡數據庫業務、數字VTR應用以及衛星和地面數字廣播分配等提供廣播級的數字視頻。除此之外，在最近迅速增加的擁有電視錄像功能的PC，及外置的視頻捕獲裝置中也使用了MPEG2。

從本質上說，MPEG2可以視爲是一組MPEG1的最高級編碼標準，並設計能向後兼容MPEG1，即每一個MPEG2兼容解碼器能對有效的 MPEG1比特流進行解碼。爲了滿足多種不同應用的需求，MPEG2將許多視頻編碼算法綜合於單個句法之中；爲獲得足夠的性能和質量，MPEG2還增添了許多新的編碼特性。MPEG2具備兩種編碼模式，一是非可分等級的編碼模式，二是可分等級的編碼模式。

在非可分等級的編碼中，與MPEG1一樣，MPEG2是以通用的混合DCT和DPCM編碼爲基礎，加入了宏塊結構、運動補償和幀間預測的編碼方式。 MPEG2引進了一些新的運動補償場預測模式，以便有效地對場圖像和幀圖像加以編碼，如,爲了支持隔行視頻的場圖像的場間預測、幀圖像的場間預測、用於P 幀的雙基預測和用於場圖像的16x8預測等針對隔行掃描圖像的更有效預測編碼模式。另外，MPEG2還引入了更高的色信號取樣模式。MPEG1中使用 4:1:1模式，即色信號的取樣無論在水平方向，還是在垂直方向上都是亮度信號樣點數的1/2。MPEG2除了4:2:0外，還支持4:2:2和 4:4:4模式，前者色信號的樣點數在垂直方向上與亮度信號相同，只在水平方向上是亮度信號的1/2；後者的色信號的樣點數和亮度信號則完全相同。

除了非可分等級的編碼模式外，MPEG2已經對可分級性方法進行了標準化。可分級編碼在不同業務之間能提供互操作性，能滿足傳輸頻道或存儲媒體對帶寬的特殊需求，能較靈活地支持具有不同顯示功能的各種接收機。有的接收機既沒有能力或者也不要求再現視頻的全部清晰度，那麼就可以只對分層比特流的子集進行解碼，以較低的空間或時間清晰度，或者較低的質量，來顯示視頻圖像。可分級編碼靈活支持多種清晰度的這一功能對於HDTV跟標準清晰度電視(SDTV) 相互配合運作來講十分重要，保持HDTV接收機應跟SDTV產品相兼容。只要HDTV源進行了可分級編碼，就能實現這一兼容性，這就能避免很浪費地將兩個單獨的比特流分別地傳輸給HDTV和SDTV接收機。MPEG2已對三種可分級編碼方案進行了標準化：SNR可分級性、空間可分級性及時間可分級性--每一種方案的目標在於有助於滿足特殊應用的需求。空間可分級性已經開發完成，以便在接收機顯示不同的空間清晰度--從基層能夠再現空間清晰度較低的視頻，這一功能對於許多應用都是有用的，包括對HDTV／TV系統採用嵌入式編碼，這樣就允許從數字TV業務向具有較高空間清晰度的HDTV業務過渡。空間可分級性能夠靈活的支持很寬範圍的空間清晰度，但給主要編碼方案增添了很大的裝置複雜性。SNR可分級性已基本開發成功，對於按優先排列傳輸媒體來說，SNR可分級性能使視頻質量下降時比較緩慢(質量可分級性)，如果基層能避免受到傳輸誤差的影響，那麼只要對基層信號加以解碼，就能獲得質量衰減緩慢的視頻。用來實現質量緩慢衰減的算法基於一種頻率(DCT域)可分級性技術，能夠獲得極佳的編碼效率。在基層，DCT係數在量化步長較大下被量化和發送，以便在低比特率情況下來獲取適中的圖像質量。非量化DCT係數跟來自基層、量化步長較小的量化係數之間存在差值，而增強層就對這一差值進行編碼，加以發送。在解碼器，通過對較低層和較高層比特流進行解碼，就能再現最高質量的視頻信號。利用這一方法，也可能在接收機中獲取空間清晰度較低的視頻圖像。已開發的時間可分級性方法的目的跟空間可分級性的相類似--只要具有一個適用於立體顯示功能接收機的分層比特流，立體視頻就能得到支持。不同的可分級性方法還可以結合於一個混合編碼方案之中，也就是說，將空間可分級性和時間可分級性方法結合於一個混合層編碼方案之中，這樣，擁有不同空間清晰度和幀頻的各種業務之間的互操作性就能得到支持。將空間可分級性與SNR可分級性相結合，就能夠獲得HDTV與SDTV業務之間的互操作性，並對頻道誤差有一定的恢復功能 MPEG2句法最多可支持三個不同的可分級層。可分級編碼的其它一些重要應用還有視頻數據庫瀏覽以及在多媒體環境中視頻的多清晰度重放。

而MPEG4提出的來的初衷是制定一個通用的低碼率（64KB/S以下）的標準，並打算採用第二代壓縮編碼算法，以有效的支持甚低碼率的應用。但是由於很多壓縮編碼的第二代算法仍處於研究階段或是不夠成熟，MPEG4目標又轉向支持目前的標準尚未全面支持的那些應用。例如，移動通信中的聲像業務，與其他多媒體數據（如計算機產生的圖形，圖像）的集成和交互式多媒體服務等。在5－64KB/S的範圍內，MPEG4支持的圖像格式從每行幾個像素、每幀幾行到CIF格式，幀率從0Hz到15Hz。由於其壓縮率非常高，數據量也很小，因而圖像質量不如MPEG1及2。

MPEG4包括如下幾部分主要功能：

1，基於內容的編碼（content-oriented）,即不是像MPEG1,2基於像素的編碼，而是基於對象（object）和實體 (entity)進行編碼。對每一個對象的編碼形成一個對象碼流層，該碼流中包含着對象的形狀、位置、紋理以及其他方面的屬性等。對一幅圖像編碼所形成的碼流就由一系列這樣的對象層碼流所構成。用戶可以直接對“對象層”進行存取操作。??

2，編碼效率的改進和併發數據流的編碼。

3，錯誤處理的魯棒性，有助於低比特率視頻信號在高誤碼率環境（如移動通信環境）下的存儲和傳輸。

4，基於內容的可伸縮性（scalable）,用戶可以有選擇的只對感興趣的對象進行傳輸、解碼和顯示。

與MPEG4主要面對移動通信或目前Internet上低帶寬多媒體的應用相比，MPEG2主要是用於高帶寬高保真的多媒體業務環境，它可以提供廣播電視級圖像質量乃至高清晰度電視的圖像質量。MPEG2的提出使得目前人們在業餘時間最主要的消費娛樂方式--電視，可以在數字網中傳輸，人們有可能通過網絡來欣賞電視。對於多媒體業務來說，這是一個重要的進步。這使得多媒體業務系統真正走進人們的生活。目前，符合MPEG2標準的視頻壓縮編碼器已形成商品化產品。

MPEG2與MPEG4在視頻編碼的簡單比較

MPEG2與MPEG4在視頻編碼的簡單比較

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

全面系統的AI學習路徑，幫助普通人也能玩轉AI

HTML 00 Tutorial

uni-app實現上拉加載

vue3編譯優化之“靜態提升”

又是一個月-20240513

flask 如何保證返回json有序

linux服務器設置ssh免密

jpg文件格式分析

《春天裏》本來不是一首民工的歌

V4L2 和 YUV

【AV SYNC】數字電視中的編解碼器同步機制

M-JPEG VS MPEG

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結