各種主流音頻/視頻編碼格式介紹

各種主流音頻編碼格式介紹
 
1、PCM編碼
  PCM 脈衝編碼調製是Pulse Code Modulation的縮寫。前面的文字我們提到了PCM大致的工作流程,我們不需要關心PCM最終編碼採用的是什麼計算方式,我們只需要知道PCM編碼 的音頻流的優點和缺點就可以了。PCM編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的Audio CD就採用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。
  2、WAVE 
    這是由微軟開發的早期的音頻文件格式,符合 PIFF Resource Interchange File Format規範。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數。WAV對音頻流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支持 ACM規範的編碼都可以爲WAV的音頻流進行編碼。WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但 這不表示WAV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應的Decode,就可以欣賞這些WAV了。
    在Windows平臺下,基於PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由於本身可以達到較高的音質的要求,因此,WAV 也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基於PCM編碼的WAV被作爲了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如MP3轉 換成WMA。
  3、MP3編碼
  MP3作爲目前最爲普及的音頻壓縮格 式,爲大家所大量接受,各種與MP3相關的軟件產品層出不窮,而且更多的硬件產品也開始支持MP3,我們能夠買到的VCD/DVD播放機都很多都能夠支持 MP3,還有更多的便攜的MP3播放器等等,雖然幾大音樂商極其反感這種開放的格式,但也無法阻止這種音頻壓縮的格式的生存與流傳。MP3發展已經有10 個年頭了,他是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3的簡稱,是MPEG1的衍生編碼方案,1993年由德國Fraunhofer IIS研究院和湯姆生公司合作發展成功。MP3可以做到12:1的驚人壓縮比並保持基本可聽的音質,在當年硬盤天價的日子裏,MP3迅速被用戶接受,隨着 網絡的普及,MP3被數以億計的用戶接受。MP3編碼技術的發佈之初其實是非常不完善的,由於缺乏對聲音和人耳聽覺的研究,早期的mp3編碼器幾乎全是以 粗暴方式來編碼,音質破壞嚴重。隨着新技術的不斷導入,mp3編碼技術一次一次的被改良,其中有2次重大技術上的改進。
  VBR:MP3格式的文件有一個有意思的特徵,就是可以邊讀邊放,這也符合流媒體的最基本特徵。也就是說播放器可以不用預讀文件的全部內容 就可以播放,讀到哪裏播放到哪裏,即使是文件有部分損壞。雖然mp3可以有文件頭,但對於mp3格式的文件卻不是很重要,正因爲這種特性,決定了MP3文 件的每一段每一幀都可以單獨的平均數據速率,而無需特別的解碼方案。於是出現了一種叫VBR(Variable bitrate,動態數據速率)的技術,可以讓MP3文件的每一段甚至每一幀都可以有單獨的bitrate,這樣做的好處就是在保證音質的前提下最大程度 的限制了文件的大小。這種技術的優越性是顯而易見的,但要運用確實是一件難事,因爲這要求編碼器知道如何爲每一段分配bitrate,這對沒有波形分析的 編碼器而言,這種技術如同虛設。正是如此,VBR技術並沒有一出現就顯得光彩奪目。 
 聽覺模型的導入:專家們通過長期的聲學研究,發現人耳存在遮蔽效應。聲音信號實際是一種能量波,在空氣或其他媒介中傳播,人耳對聲音能量的多少即響度或聲壓最直接的反應就是聽到這個聲音的大小,我們稱它爲響度, 表示響度這種能量的單位爲分貝(dB)。即使是同樣響度的聲音,人們也會因爲它們頻率不同而感覺到聲音大小不同。人耳最容易聽到的就是4000Hz的頻 率,不管頻率是否增高或降低,即使是響度在相同的情況下,大家都會覺得聲音在變小。但響度降到一定程度時,人耳就聽不到了,每一個頻率都有着不同的值。
    可以看到這條曲線基本成一個V字型,當頻率超過15000Hz時,人耳的會感覺到聲音很小,很多聽覺不是很好的人,根本就聽不到20000Hz的頻率,不 管響度有多大。當人耳同時聽到兩個不同頻率、不同響度的聲音時,響度較小的那個也會被忽略,例如:在白天我們很難聽到電腦中散熱風扇的聲音,晚上卻成了噪 聲源,根據這種原理,編碼器可以過濾掉很多聽不到的聲音,以簡化信息複雜度,增加壓縮比,而不明顯的降低音質。這種遮蔽被稱爲同時遮蔽效應。但聲音A被聲 音B遮蔽,如果A處於B爲中心的遮蔽範圍內,遮蔽會更明顯,這個範圍叫臨界帶寬。每一種頻率的臨界帶寬都不一樣,頻率越高的臨界帶寬越寬。 
   根據這種效應,專家們設計出人耳聽覺心理模型,這個模型被導入到mp3編碼中後,導致了一場翻天覆地的音質革命,mp3編碼技術一直揹負着音質差的惡名, 但這個惡名現在已經逐漸被洗脫。到了此時,一直被埋沒的VBR技術光彩四射,配合心理模型的運用便現實出強大的誘惑力與殺傷力。
     長期來,很多人對MP3印象不好,更多人認爲WMA的最佳音質要好過MP3,這種說法是不正確的,在中高碼率下,編碼得當的MP3要比WMA優秀很多,可 以非常接近CD音質,在不太好的硬件設備支持下,沒有多少人可以區分兩者的差異,這不是神話故事,儘管你以前盲聽就可以很輕鬆區分MP3和CD,但現在你 難保證你可以分辨正確。因爲MP3是優秀的編碼,以前被埋沒了.
  4、OGG編碼 
   網絡上出現了一種叫Ogg Vorbis的音頻編碼,號稱MP3殺手!Ogg Vorbis究竟什麼來頭呢?OGG是一個龐大的多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。整個OGG項目計劃的目的就是向任何人提供 完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞彙是特里普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞彙成爲了OGG項目中音頻編碼的正式命名。目前Vorbis已經開發成功,並且開發出了編碼器。
   Ogg Vorbis是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis可以在相對較低的數據速率下實現比MP3更好的音質!Ogg Vorbis這種編碼也遠比90年代開發成功的MP3先進,她可以支持多聲道,這意味着什麼?這意味着Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3只能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命 性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應的。
  和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來後還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和 MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和MP3一樣,OGG也支持VBR。
  5、MPC 編碼 
   MPC是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什麼複雜的背景故事,她的出現目的就只有一個,更小的體積更好的音 質!MPC以前被稱作MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印象,就是她出衆的音質。
  6、mp3PRO 編碼
   2001年6月14日,美國湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協會(Fraunhofer Institute)於6月14日發佈了一種新的音樂格式版本,名稱爲mp3PRO,這是一種基於mp3編碼技術的改良方案,從官方公佈的特徵看來確實相 當吸引人。從各方面的資料顯示,mp3PRO並不是一種全新的格式,完全是基於傳統mp3編碼技術的一種改良,本身最大的技術亮點就在於 SBR(Spectral Band Replication 頻段複製),這是一種新的音頻編碼增強算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效 率。SBR最大的優勢就是在低數據速率下實現非常高效的編碼,與傳統的編碼技術不同的是,SBR更像是一種後處理技術,因此解碼器的算法的優劣直接影響到 音質的好壞。高頻實際上是由解碼器(播放器)產生的,SBR編碼的數據更像是一種產生高頻的命令集,或者稱爲指導性的信號源,這有點 midi的工作方式。我們可以看到,mp3PRO其實是一種mp3信號流和SBR信號流的混合數據流編碼。有關資料顯示,SBR技術可以改善低數據流量下 的高頻音質,改善程度約爲30%,我們不管這個30%是如何得來的,但可以事先預知這種改善可以讓64kbps的mp3達到128kbps的mp3的音質 水平(注:在相同的編碼條件下,數據速率的提升和音質的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的64kbps的mp3PRO可以媲美 128kbps的mp3的宣傳基本是吻合的。
  7、WMA 
  WMA就是 Windows Media Audio編碼後的文件格式,由微軟開發,WMA針對的不是單機市場,是網絡!競爭對手就是網絡媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質。和以往的編碼不同,WMA支持防複製功能,她支持通過 Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現在線廣播,由於是微軟的傑 作,因此,微軟在Windows中加入了對WMA的支持,WMA有着優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。
  8、RA(rm) 
   RA就是RealAudio格式,這是網上接觸得非常多的一種格式,大部分音樂網站的在線試聽都是採用了RealAudio,這種格式完全針對的就是網 絡上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據聽衆的帶寬來控制自己的碼率,在保證流暢的前提下儘可能提高音質。RA可以支持多 種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協議來隱匿文件的真實網絡地址,從而實現只在線播放而不提供下 載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA和WMA是目前互聯網上,用於在線試聽最多的音頻媒體格式。
  9、APE 
   APE是Monkey's Audio提供的一種無損壓縮格式。Monkey's Audio提供了Winamp的插件支持,因此這就意味着壓縮後的文件不再是單純的壓縮格式,而是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比 遠低於其他格式,但能夠做到真正無損,因此獲得了不少發燒用戶的青睞。在現有不少無損壓縮方案種,APE是一種有着突出性能的格式,令人滿意的壓縮比以及 飛快的壓縮速度,成爲了不少朋友私下交流發燒音樂的唯一選擇。
 
 
 
 
視頻文件格式介紹
一:普通視頻文件格式  
  ●AVI格式 : 它的英文全稱爲Audio Video Interleaved,即音頻視頻交錯格式。它於1992年被Microsoft公司推出,隨Windows3.1一起被人們所認識和熟知。所謂“音頻 視頻交錯”,就是可以將視頻和音頻交織在一起進行同步播放。這種視頻格式的優點是圖像質量好,可以跨多個平臺使用,其缺點是體積過於龐大,而且更加糟糕的 是壓縮標準不統一,最普遍的現象就是高版本Windows媒體播放器播放不了採用早期編碼編輯的AVI格式視頻,而低版本Windows媒體播放器又播放 不了採用最新編碼編輯的AVI格式視頻,所以我們在進行一些AVI格式的視頻播放時常會出現由於視頻編碼問題而造成的視頻不能播放或即使能夠播放,但存在 不能調節播放進度和播放時只有聲音沒有圖像等一些莫名其妙的問題,如果用戶在進行AVI格式的視頻播放時遇到了這些問題,可以通過下載相應的解碼器來解 決。
  ●nAVI格式 :nAVI是newAVI的縮寫,是一個名爲 ShadowRealm的地下組織發展起來的一種新視頻格式(與我們上面所說的AVI格式沒有太大聯繫)。它是由Microsoft ASF壓縮算法的修改而來的,但是又與下面介紹的網絡影像視頻中的ASF視頻格式有所區別,它以犧牲原有ASF視頻文件視頻“流”特性爲代價而通過增加幀 率來大幅提高ASF視頻文件的清晰度。
  ●DV-AVI格式 :DV的英文全稱是 Digital Video Format,是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。目前非常流行的數碼攝像機就是使用這種格式記錄視頻數據的。它可以通過 電腦的IEEE 1394端口傳輸視頻數據到電腦,也可以將電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般是.avi,所以也叫DV-AVI 格式。
  ●MPEG格式 :它的英文全稱爲Moving Picture Expert Group,即運動圖像專家組格式,家裏常看的VCD、SVCD、DVD就是這種格式。MPEG文件格式是運動圖像壓縮算法的國際標準,它採用了有損壓縮 方法減少運動圖像中的冗餘信息,說的更加明白一點就是MPEG的壓縮方法依據是相鄰兩幅畫面絕大多數是相同的,把後續圖像中和前面圖像有冗餘的部分去除, 從而達到壓縮的目的(其最大壓縮比可達到200:1)。目前MPEG格式有三個壓縮標準,分別是MPEG-1、MPEG-2、和MPEG-4,另 外,MPEG-7與MPEG-21仍處在研發階段。
  MPEG-1 :制定於 1992年,它是針對1.5Mbps以下數據傳輸率的數字存儲媒體運動圖像及其伴音編碼而設計的國際標準。也就是我們通常所見到的VCD製作格式。使用 MPEG-1的壓縮算法,可以把一部120分鐘長的電影壓縮到1.2GB左右大小。這種視頻格式的文件擴展名包 括.mpg、.mlv、.mpe、.mpeg及VCD光盤中的.dat文件等。
  MPEG-2 : 制定於1994年,設計目標爲高級工業標準的圖像質量以及更高的傳輸率。這種格式主要應用在DVD/SVCD的製作(壓縮)方面,同時在一些HDTV(高 清晰電視廣播)和一些高要求視頻編輯、處理上面也有相當的應用。使用MPEG-2的壓縮算法,可以把一部120分鐘長的電影壓縮到4到8GB的大小。這種 視頻格式的文件擴展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盤上的.vob文件等。
  MPEG-4 : 制定於1998年,MPEG-4是爲了播放流式媒體的高質量視頻而專門設計的,它可利用很窄的帶度,通過幀重建技術,壓縮和傳輸數據,以求使用最少的數據 獲得最佳的圖像質量。目前MPEG-4最有吸引力的地方在於它能夠保存接近於DVD畫質的小體積視頻文件。另外,這種文件格式還包含了以前MPEG壓縮標 準所不具備的比特率的可伸縮性、動畫精靈、交互性甚至版權保護等一些特殊功能。這種視頻格式的文件擴展名包括.asf、.mov和DivX AVI等。
  小提示:細心的用戶一定注意到了,這中間怎麼沒有MPEG-3編碼?實際上,大家熟悉的MP3就是採用的MPEG-3(MPEG Layeur3)編碼。
  ●DivX格式 : 這是由MPEG-4衍生出的另一種視頻編碼(壓縮)標準,也即我們通常所說的DVDrip格式,它採用了MPEG4的壓縮算法同時又綜合了MPEG-4與 MP3各方面的技術,說白了就是使用DivX壓縮技術對DVD盤片的視頻圖像進行高質量壓縮,同時用MP3或AC3對音頻進行壓縮,然後再將視頻與音頻合 成並加上相應的外掛字幕文件而形成的視頻格式。其畫質直逼DVD並且體積只有DVD的數分之一。這種編碼對機器的要求也不高,所以DivX視頻編碼技術可 以說是一種對DVD造成威脅最大的新生視頻壓縮格式,號稱DVD殺手或DVD終結者。
  ●MOV格式 :美國Apple公司開發的一種視頻格式,默認的播放器是蘋果的QuickTimePlayer。具有較高的壓縮比率和較完美的視頻清晰度等特點,但是其最大的特點還是跨平臺性,即不僅能支持MacOS,同樣也能支持Windows系列。

  二、網絡影像視頻 
  ●ASF格式 : 它的英文全稱爲Advanced Streaming format,它是微軟爲了和現在的Real Player競爭而推出的一種視頻格式,用戶可以直接使用Windows自帶的Windows Media Player對其進行播放。由於它使用了MPEG-4的壓縮算法,所以壓縮率和圖像的質量都很不錯(高壓縮率有利於視頻流的傳輸,但圖像質量肯定會的損 失,所以有時候ASF格式的畫面質量不如VCD是正常的)。
  ●WMV格式 :它的 英文全稱爲Windows Media Video,也是微軟推出的一種採用獨立編碼方式並且可以直接在網上實時觀看視頻節目的文件壓縮格式。WMV格式的主要優點包括:本地或網絡回放、可擴充 的媒體類型、部件下載、可伸縮的媒體類型、流的優先級化、多語言支持、環境獨立性、豐富的流間關係以及擴展性等。
  ●RM格式 :Real Networks公司所制定的音頻視頻壓縮規範稱爲Real Media,用戶可以使用RealPlayer或RealOne Player對符合RealMedia技術規範的網絡音頻/視頻資源進行實況轉播並且RealMedia可以根據不同的網絡傳輸速率制定出不同的壓縮比 率,從而實現在低速率的網絡上進行影像數據實時傳送和播放。這種格式的另一個特點是用戶使用RealPlayer或RealOne Player播放器可以在不下載音頻/視頻內容的條件下實現在線播放。另外,RM作爲目前主流網絡視頻格式,它還可以通過其Real Server服務器將其它格式的視頻轉換成RM視頻並由Real Server服務器負責對外發布和播放。RM和ASF格式可以說各有千秋,通常RM視頻更柔和一些,而ASF視頻則相對清晰一些。
  ●RMVB格式 : 這是一種由RM視頻格式升級延伸出的新視頻格式,它的先進之處在於RMVB視頻格式打破了原先RM格式那種平均壓縮採樣的方式,在保證平均壓縮比的基礎上 合理利用比特率資源,就是說靜止和動作場面少的畫面場景採用較低的編碼速率,這樣可以留出更多的帶寬空間,而這些帶寬會在出現快速運動的畫面場景時被利 用。這樣在保證了靜止畫面質量的前提下,大幅地提高了運動圖像的畫面質量,從而圖像質量和文件大小之間就達到了微妙的平衡。另外,相對於DVDrip格 式,RMVB視頻也是有着較明顯的優勢,一部大小爲4700MB左右的DVD影片,如果將其轉錄成同樣視聽品質的RMVB格式,其個頭最多也就400MB 左右。不僅如此,這種視頻格式還具有內置字幕和無需外掛插件支持等獨特優點。要想播放這種視頻格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解碼器形式進行播放。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章