MPEG-4標準及其在廣播電視領域的應用

　MPEG（Moving Picture Experts Group）專家組繼成功定義了MPEG—1和MPEG—2之後，於1993年7月開始制訂全新的MPEG－4標準，並分別於1999年初和2000年初正式公佈了版本1和版本2。到2001年10月，MPEG一4已定義了19個視像類（Visual Profile），其中新定義的簡單演播室類（Simple Studio Profile）和核心演播室類（Core studio Profile）使MPEG-4對MPEG-2類別保留了一些形式上的兼容，其碼率可高達2Gbps。隨着MPEG-4標準的不斷擴展，它不但能支持碼率低於64kbps的多媒體通信，也能支持廣播級的視頻應用。MPEG-4標準將廣泛運用於數字電視、動態圖像、萬維網（www）、實時多媒體監控、基於內容存儲和檢索的多媒體系統、互聯網上的視頻流與可視遊戲、基於面部表情模擬的虛擬會議、DVD上的交互多媒體應用、基於計算機網絡的可視化合作實驗室場景應用、演播電視等，它將推動電信、計算機、廣播電視三大網絡的最終融合，從而成爲今後一段時間壓縮標準的主流。

　　MPEG-4 標準的主要特點和功能

　　MPEG—4視頻編碼標準支持MPEG—1、MPEC－2中的大多數功能，提供不同的視頻標準源格式、碼率、幀頻下矩形圖像的有效編碼，同時也支持基於內容的圖像編碼。下圖爲MPEG一4支持的碼率與相應功能集之間關係的示意圖。

在這一功能集的底層是VLBV（Very Low Bit Rate Video）核心。它爲碼率在5一64kbps範圍內的視頻操作與應用提供算法與工具，支持較低的空間分辨率（低於352 X 288像素）和較低的幀頻（低於15Hz）。VLBV核心支持的專用功能包括：矩形圖像序列的有效編碼、多媒體數據庫的搜索和隨機存取。

　　MPEG—4的HBV（High Bit Rate Video）同樣支持上述功能，其碼率範圍在64kbps—10Mbbps之間，它與VLBL核心採用相同或相似的算法，但它支持更高的空間與時間分辨率，允許傳輸和存儲適用於演播室的高質量視頻信號，其輸入可以是ITU-R Rec.601的標準信號，典型應用爲數字電視廣播與交互式檢索。MPEG－4最終支持的碼率將高於MPEG—2。　　MPEG－4 提出了基於內容（Content－based）的存取概念，使用戶可與場景進行交互。它對運動圖像中的內容進行編碼，其具體的編碼對象就是圖像中的音頻和視頻，稱爲AV對象（AVO：Audio Video Object）。AV對象可以組成AV場景（AVOs：Audio Video Object in a scene）。因此，MPEG—4標準的基本內容就是高效率地編碼、組織、存儲、傳輸AV對象。

　　MPFG－4標準支持8項新的或改進的功能，可分爲以下3類：

　　1、基於內容的交互性

　　基於內容的多媒體數據存取工具；基於內容的碼流操縱和編輯；自然與合成數據的混合編碼；增強的時間域隨機存取。

　　2、高壓縮率

　　提高編碼效率；對多個併發數據流的編碼。

　　3、靈活多樣的存取

　　錯誤易發環境中的抗錯性（Robustness）；基於內容的尺度可變性（Content-based scalability）。

　　MPEG-4標準的構成

　　1、DMIF

　　DMIF即多媒體傳送整體框架，它主要解決交互網絡中、廣播環境下以及磁盤應用中多媒體應用的操作問題。通過DMIF，MPEG-4可以建立具有特殊品質服務（QoS：Quality of Service）的信道和麪向每個基本流的帶寬。

　　2、數據平面

　　MPEG-4中的數據平面可以分爲兩部分：傳輸關係部分和媒體關係部分。爲了使基本流和AV對象在同一場景中出現，MPEG-4引用了對象描述（OD）和流圖桌面（SMT）的概念。OD傳輸與特殊AV對象相關的基本流的信息流圖。桌面把每一個流與一個CAT（Channel Association Tag）相連，CAT可實現該流的順利傳輸。

　　3、緩衝區管理和實時識別

　　MPEG-4定義了一個系統解碼模式（SDM），該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置，它要求特殊的緩衝區和實時模式。通過有效的管理，可以更好地利用有限的緩衝區空間。

　　4、音頻編碼

　　MPEG-4的優越之處在於，它不僅支持自然聲音，而且支持合成聲音。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結合，並支持音頻的對象特徵。

　　5、視頻編碼

　　與音頻編碼類似，MPBG—4也支持對自然和合成的視覺對象的編碼。合成的視覺對象包括2D、3D動畫和人面部表情動畫等。

　　6、場景描述

　　MPEG—4提供了一系列工具，用於組成場景中的一組對象。一些必要的合成信息就組成了場景描述。

　　MPEG-4 標準的視頻編碼技術

　　爲了支持基於內容的交互性，即支持對內容獨立地進行編、解碼，MPEG一4視頻檢驗模型引入了視頻對象面（VOP：Video Object Plane）的概念。假設輸入的視頻序列的每一幀都被分割成多個任意形狀的圖像區域（視頻對象面），每個區域可能覆蓋場景中特定的感興趣的圖像或視頻內容。輸入進行編碼的VOP可以是任意形狀的，且形狀和位置可隨幀而變。屬於場景中同一物理對象的連續VOP序列稱爲視頻對象。同一視頻對象的VOP序列的形狀、運動和紋理信息被編碼傳輸，或者編碼爲一個隔離的視頻對象層（VOL：Video Object Layer）。

　　MPEG－4視頻編碼器的基本結構包括形狀編碼（對於任意形狀的VOS）、運動補償和基於DCT的紋理編碼（採用標準的 8 X 8 DCT或根據形狀的自適應DCT）。具體的編碼方法爲：首先對輸入的原圖像序列進行場景分析和對象分割，以劃分不同的VOP，得到各個VOP的形狀和位置信息，它可以用alpha平面來表示。發送端只需傳送alpha平面，接收端就可以確定VOP的形狀和位置。alpha平面所需的比特數較多，需要進行壓縮編碼。顯然，只要對VOP的輪廓進行編碼和傳送，接收端就可以恢復alpha平面，輪廓信息在輪廓編碼器中進行編碼。提取的形狀和位置信息又用來控制VOP的運動和紋理編碼。對運動和紋理信息編碼仍然採用經典的類似MPEG-1／2標準的運動預測／補償法。輸入第N幀的VOP與幀存儲器中存儲的N—1幀的VOP進行比較，找到運動矢量，然後對兩幀VOP的差值進行量化、編碼。對不同對象的運動和紋理信息的編碼可因地制宜地採用不同的方祛，以提高編碼效率。編碼後得到的紋理信息，與運動編碼器和形狀編碼器輸出的運動信息和形狀信息復接形成該VOP的比特流層。不同視頻對象的VOP序列分別進行編碼，形成各自的比特流層，經復接後在信道上傳送。傳送的順序依次爲形狀信息、運動信息和紋理信息。接收端的解碼過程是編碼過程的逆操作。

　　MPEG-4 標準在廣播電視領域應用前景

　　隨着MPEG一4標準的不斷補充和完善，它已經能夠支持廣播級的視頻應用。MPEG—4的出現將改變傳統的電視製作理念，同時也賦予電視觀衆更大的自主權，它不但給廣播電視領域注入新的活力，也將給廣大電視工作者帶來更多的機遇與挑戰。MPEG—4標準在廣播電視領域將會有以下應用：

　　1、虛擬演播室

　　MPEG—4獨有的基於內容的交互性，可爲虛擬演播室技術帶來突破性的發展，虛擬演播室的應用範圍也將得到擴展。

　　◇虛擬出席

　　利用MPEG—4支持自然視頻圖像同合成數據混合編碼的特點，可以實現虛擬出席。幾個身處異地的表演者可以在虛擬場景中面對面地相互交談，外地的節目嘉賓可以不必親臨本地演播室參與節目製作。

　　◇虛擬重放

　　利用 MPEG－4支持對同一景物多視點編碼的特點，可將其應用在立體視頻方面，從而實現虛擬重放。虛擬重放主要應用於球類比賽的轉播及評論節目等，可從各個角度模仿真實比賽的情況。

　　◇視頻跟蹤

　　利用MPEG-4支持基於AV內容的數據訪問和操作的特點，可有效實現視頻跟蹤。可在視頻圖像上直接描畫各種箭頭、軌跡、路線和標誌，使觀衆更清楚地瞭解比賽中的每一個細節。

　　◇虛擬廣告

　　MPEG—4提供基於內容的碼流操縱和編輯，使用戶可以在圖像中選擇指定的對象並改變其特性，利用這一特點，可實現虛擬廣告的製作。將演播室製作的虛擬廣告牌插入到賽場或表演場的空地上，或用虛擬廣告牌替換掉場地上原有的廣告牌，合成後可達到以假亂真的效果。

　　2、交互電視

　　利用MPEG－4的交互性和支持多個併發數據流編碼的特點，可實現交互電視的使用。例如：在同時轉播幾場足球比賽時，觀衆可在家裏任意選擇觀看自己喜愛的比賽，他們甚至能以不同的分辨率同時選擇觀看3—4場比賽，還可享受附加的自動切換功能，以免漏掉所有比賽中的進球場面。這類應用還利用了MPEG—4所支持的複雜度可伸縮特性，即允許終端用戶解碼每個流時只利用接收端解碼能力的一部分。當然，前提條件是節目本身可以按照不同的分辨率解碼和顯示。另外，用戶還可被允許進行以下操作：改變場景的視、聽點，例如在場景中漫遊；把場景中的對象拖到不同的位置上；點擊特定對象以觸發一系列事件，例如開始或終止視頻流；多語言音軌時選擇想要的語言等。

　　3、視頻編輯

　　MPEG—4定義的簡單演播室類（Simple Studio Profile）能夠爲視頻編輯提供高質量的信號，它僅有1幀，採用形狀編碼，支持多個alpha通道，碼率可高達2Gbps。核心演播室類（Core Studio Profile）在簡單演播室類的基礎上增加了P幀，使編碼更高效也更復雜。這兩個新擴展的視像類使MPEG－4用於高質量的視頻編輯成爲可能。

　　◇利用MPEG—4支持基於內容編輯的特點，可直接選取音、視頻內容進行編碼，並對其靈活地進行控制和顯示，用戶可以自行選擇場景中物體的解碼質量，並可改變其某些特性，進行電視節目製作和編輯。

　　◇利用MPEG—4支持時間域隨機存取的特點，能夠對音、視頻序列進行隨機存取，並以序列中的某個音、視頻對象爲目標進行快速搜索。

　　◇利用MPEG—4支持自然與合成數據混合編碼的特點，將各種特技功能應用在自然的和合成的AV對象上，增強了節目編輯製作能力。

　　◇利用MPEG－4的高壓縮率和在誤碼環境中的抗錯性，可以較窄的帶寬傳輸新聞文稿及粗編節目，方便節目的審查、管理、製作和顯示。

　　目前，已經有公司展示了在拍攝的同時可將圖像進行MPBG－4編碼的數碼攝像機，如果使用相應的網絡組件，還可以通過因特網進行圖像的實時發送。隨着MPEG－4編、解碼技術的成熟，未來由此產生的網上電視臺將對傳統媒體產生強烈的衝擊．MPEG—4標準完成了從基於像素的傳統編碼向基於對象和內容的現代編碼的轉變，順應了現代圖像壓縮編碼的發展潮流，必將對未來的廣播電視領域產生深遠的影響。

MPEG-4標準及其在廣播電視領域的應用

AI 畫圖真刺激，手把手教你如何用 ComfyUI 來畫出刺激的圖

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

ASTRA32-Advanced System Information Tool

Multi-threading for Experts:Inside a Parallel Application

基於VC++6.0的DLL開發入門（轉）

影像處理應用軟件

DirectX5.0最新遊戲編程指南 DirectDraw篇（轉）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結