音視頻編碼技術與格式大全

一、常見視頻格式中採用的技術

  當PC開始擁有FPU(浮點處理器)後,PC如何處理多媒體信息的問題也被擺上檯面。無數專家開始爲音頻視頻編碼技術運用在PC上開始忙碌了,視頻技術也因此得到了飛快的進步。

  1、無聲時代的FLC

  FLC、FLI是Autodesk開發的一種視頻格式,僅僅支持256色,但支持色彩抖動技術,因此在很多情況下很真彩視頻區別不是很大,不支持音頻信號,現在看來這種格式已經毫無用處,但在沒有真彩顯卡沒有聲卡的DOS時代確實是最好的也是唯一的選擇。最重要的是,Autodesk的全系列的動畫製作軟件都提供了對這種格式的支持,包括著名的3D Studio X,因此這種格式代表了一個時代的視頻編碼水平。直到今日,仍舊有不少視頻編輯軟件可以讀取和生成這種格式。但畢竟廉頗老矣,這種格式已經被無情的淘汰。   2、載歌載舞的AVI

  AVI--Audio Video Interleave,即音頻視頻交叉存取格式。1992年初Microsoft公司推出了AVI技術及其應用軟件VFW(Video for Windows)。在AVI文件中,運動圖像和伴音數據是以交織的方式存儲,並獨立於硬件設備。這種按交替方式組織音頻和視像數據的方式可使得讀取視頻數據流時能更有效地從存儲媒介得到連續的信息。構成一個AVI文件的主要參數包括視像參數、伴音參數和壓縮參數等。AVI文件用的是AVI RIFF形式,AVI RIFF形式由字串“AVI”標識。所有的AVI文件都包括兩個必須的LIST塊。這些塊定義了流和數據流的格式。AVI文件可能還包括一個索引塊。
  只要遵循這個標準,任何視頻編碼方案都可以使用在AVI文件中。這意味着AVI有着非常好的擴充性。這個規範由於是由微軟制定,因此微軟全系列的軟件包括編程工具VB、VC都提供了最直接的支持,因此更加奠定了AVI在PC上的視頻霸主地位。由於AVI本身的開放性,獲得了衆多編碼技術研發商的支持,不同的編碼使得AVI不斷被完善,現在幾乎所有運行在PC上的通用視頻編輯系統,都是以支持AVI爲主的。AVI的出現宣告了PC上啞片時代的結束,不斷完善的AVI格式代表了多媒體在PC上的興起。
  說到AVI就不能不提起英特爾公司的Indeo video系列編碼,Indeo編碼技術是一款用於PC視頻的高性能的、純軟件的視頻壓縮/解壓解決方案。Indeo音頻軟件能提供高質量的壓縮音頻,可用於互聯網、企業內部網和多媒體應用方案等。它既能進行音樂壓縮也能進行聲音壓縮,壓縮比可達8:1而沒有明顯的質量損失。Indeo技術能幫助您構建內容更豐富的多媒體網站。目前被廣泛用於動態效果演示、遊戲過場動畫、非線性素材保存等用途,是目前使用最廣泛的一種AVI編碼技術。現在Indeo編碼技術及其相關軟件產品已經被Ligos Technology 公司收購。隨着MPEG的崛起,Indeo面臨着極大的挑戰。

  3、容量與質量兼顧的MPEG系列編碼

  和AVI相反,MPEG不是簡單的一種文件格式,而是編碼方案。
  MPEG-1(標準代號ISO/IEC11172)制定於1991年底,處理的是標準圖像交換格式(standard interchange format,SIF)或者稱爲源輸入格式(Source Input Format,SIF)的多媒體流。是針對1.5Mbps以下數據傳輸率的數字存儲媒質運動圖像及其伴音編碼(MPEG-1 Audio,標準代號ISO/IEC 11172-3)的國際標準,伴音標準後來衍生爲今天的MP3編碼方案。MPEG-1規範了PAL制(352*288,25幀/S)和NTSC制(爲352*240,30幀/S)模式下的流量標準, 提供了相當於家用錄象系統(VHS)的影音質量,此時視頻數據傳輸率被壓縮至1.15Mbps,其視頻壓縮率爲26∶1。使用MPEG-1的壓縮算法,可以把一部120分鐘長的多媒體流壓縮到1.2GB左右大小。常見的VCD就是MPEG-1編碼創造的傑作。MPEG-1編碼也不一定要按PAL/NTSC規範的標準運行,你可以自由設定影像尺寸和音視頻流量。隨着光頭拾取精度的提高,有人把光盤的信息密度加大,並適度降低音頻流流量,於是出現了只要一張光盤就存放一部電影的DVCD。DVCD碟其實是一種沒有行業標準,沒有國家標準,更談不上是國際標準的音像產品。
  當VCD開始向市場普及時,電腦正好進入了486時代,當年不少朋友都夢想擁有一塊硬解壓卡,來實現在PC上看VCD的夙願,今天回過頭來看看,覺得真有點不可思議,但當時的現狀就是486的系統不借助硬解壓是無法流暢播放VCD的,上萬元的486系統都無法流暢播放的MPEG-1被打上了貴族的標誌。隨着奔騰的發佈,PC開始奔騰起來,直到後來Windows Media Player也直接提供了MPEG-1的支持,至此MPEG-1使用在PC上已經完全無障礙了。
  MPEG-2(標準代號IOS/IEC13818)於1994年發佈國際標準草案(DIS),在視頻編碼算法上基本和MPEG-1相同,只是有了一些小小的改良,例如增加隔行掃描電視的編碼。它追求的是大流量下的更高質量的運動圖象及其伴音效果。MPEG-2的視頻質量看齊PAL或NTSC的廣播級質量,事實上MPEG-1也可以做到相似效果,MPEG-2更多的改進來自音頻部分的編碼。目前最常見的MPEG-2相關產品就是DVD了,SVCD也是採用的MPEG-2的編碼。MPEG-2還有一個更重要的用處,就是讓傳統的電視機和電視廣播系統往數碼的方向發展。
  MPEG-3最初爲HDTV制定,由於MPEG-2的快速發展,MPEG-3還未徹底完成便宣告淘汰。
  MPEG-4於1998年公佈,和MPEG-2所針對的不同,MPEG-4追求的不是高品質而是高壓縮率以及適用於網絡的交互能力。MPEG-4提供了非常驚人的壓縮率,如果以VCD畫質爲標準,MPEG-4可以把120分鐘的多媒體流壓縮至300M。MPEG-4標準主要應用於視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率爲176X144。MPEG-4利用很窄的帶寬,通過幀重建技術,壓縮和傳輸數據,以求以最少的數據獲得最佳的圖象質量。
  MJPEG,這並不是專門爲PC準備的,而是爲專業級甚至廣播級的視頻採集與在設備端回放的準備的,所以MJPEG包含了爲傳統模擬電視優化的隔行掃描電視的算法,如果在PC上播放MJPEG編碼的文件,效果會很難看(如果你的顯卡不支持MJPEG的動態補償),但一旦輸出到電視機端,你立刻會發現這種算法的好處。

  4、屬於網絡的流媒體

  RealNetworks RealVideo,採用的是 RealNetworks 公司自己開發的 Real G2 Codec,它具有很多先進的設計,例如,SVT (Scalable Video Technology);雙向編碼(Two-Encoding,類似於VBR)。RealMedia 音頻部分採用的是 RealAudio ,可以接納很多音頻編碼方案,可實現聲音在單聲道、立體聲音樂不同速率下的壓縮。最新的RealAudio竟然採用ATRAC3編碼方案,以挑戰日益成熟的MP3。
  Windows Media,視頻編碼採用的是非常先進的 MPEG-4 視頻壓縮技術,被稱作 Microsoft MPEG-4 Video Codec,音頻編碼採用的是微軟自行開發的一種編碼方案,目前沒有公佈技術資料,在低流量下提供了令人滿意的音質和畫質。最新的Windows Media Encoding Utility V8.0將流技術推向到一個新的高度,我們常見的ASF、WMV、WMA就是微軟的流媒體文件。
  事實上我們常見的MPG文件,也具有流媒體的最大特徵--邊讀邊放。

二、常見的編碼與常見的文件格式的對應關係及其常用用途

  1、Audodesk FLC

  這是一種古老的編碼方案,常見的文件後綴爲FLC和FLI。由於FLC僅僅支持256色的調色板,因此它會在編碼過程中儘量使用抖動算法(也可以設置不抖動),以模擬真彩的效果。這種算法在色彩值差距不是很大的情況下幾乎可以達到亂真的地步,例如紅色A(R:255,G:0,B:0)到紅色B(R:255,G:128,B:0)之間的抖動。這種格式現在已經很少被採用了,但當年很多這種格式被保留下來,這種格式在保存標準256色調色板或者自定義256色調色板是是無損的,這種格式可以清晰到像素,非常適合保存線框動畫,例如CAD模型演示。現在這種格式很少見了。

  2、Microsoft RLE

  這是微軟開發爲AVI格式開發的一種編碼,文件擴展名爲AVI,使用了RLE壓縮算法,這是一種無損的壓縮算法,我們常見的tga格式的圖像文件就使用了RLE算法。
  什麼是RLE算法呢?這是一種很簡單的算法,舉一個很簡單的例子:
  假設一個圖像的像素色彩值是這樣排列的:紅紅紅紅紅紅紅紅紅紅紅紅藍藍藍藍藍藍綠綠綠綠,經過RLE壓縮後就成爲了:紅12藍6綠4。這樣既保證了壓縮的可行性,而且不會有損失。而且可以看到,但顏色數越少時,壓縮效率會更高。由於Microsoft RLE僅僅支持256色,而且沒有抖動算法,在色彩處理方面,FLC明顯的比Microsoft RLE要好很多。當然這也不表示Microsoft RLE一無是處,和FLC一樣,Microsoft RLE在處理相鄰像素時也沒有色染,可以清晰的表現網格。因此同樣可以優秀的表現單色字體和線條。只要色彩不是很複雜,FLC能做的,Microsoft RLE也可以做到。由於AVI可以擁有一個音頻流,而且Windows系統給與了直接的支持,Microsoft RLE最常用的用途是,在256色顯示模式下,通過配合抓屏生成AVI的工具製作一個軟件的操作演示過程,以達到圖文並茂,形聲兼備的效果。

  3、Microsoft Video1

  這也是由微軟提供的一個AVI編碼,任何Windows系統都自帶了了它的Codec,這個編碼支持真彩,畫面質量很不錯,Microsoft Video1的壓縮效率非常低下,編碼後的文件龐大得讓人受不了。這個Microsoft Video1究竟有什麼用呢?一般被用在保存一些沒有漸變的小型視頻素材方面。

  4、Indeo video R3.2

  這個編碼由intel架構實驗室開發,對應的文件格式是AVI,相對之前的流行的編碼,Indeo video R3.2最大的特點就是高壓縮比(當然,比起現在的壓縮方案,實在是不值得一提),intel聲稱壓縮比可達8:1而沒有明顯的質量損失,解碼速度也非常快,對系統要求不高,由於Windows9X中自帶Indeo video R3.2的Codec,所以Indeo video R3.2一度成爲了最流行的AVI編碼方案。有不少遊戲的過場動畫和啓動動畫都是Indeo video R3.2編碼的。Indeo video R3.2同樣不適合高要求的環境,在要表現細線條或大色彩值變化的漸變時,Indeo video R3.2會表現得非常糟糕。如果畫面的色彩值差異不是很大,也沒有明顯的色彩區域界限,Indeo video R3.2還是合適的,例如海天一色的場景。Indeo video R3.2已經基本被淘汰,如果不是爲了播放以前遺留的一些Indeo video R3.2編碼視頻,恐怕Windows ME/2000都不會有Indeo video R3.2的Codec了。

  5、Indeo video 5.10

  這個編碼方案同樣也是intel架構實驗室開發的,它繼承了Indeo video R3.2的優點,對應的文件格式仍然是AVI,解碼速度同樣非常快。Windows ME/2000自帶了Indeo video 5.1的Codec,很多遊戲也適用Indeo video 5.10來編碼自己的演示動畫。在沒有DivX普及前,這幾乎是最流行的AVI編碼了,由於微軟和intel的同時支持,這種編碼方案被廣泛採用。

  6、None

  顧名思義,這是一個沒有損失的視頻編碼方案,對應的文件擴展名爲AVI。這種編碼幾乎是不壓縮的,文件大得驚人!那麼這種編碼有什麼用途呢?用途就是保存視頻素材,因爲是無損的,保存素材非常合適,代價就是大量的存儲空間。

  7、MPEG1

  我們熟知的VCD就是MPEG1編碼的,對應的文件擴展名爲MPG、MPEG或者DAT。事實上MPEG1可以工作於非PAL制和非NTSC制標準下。它可以自由設置數據流量和畫面尺寸,只是這樣非標準的文件無法直接刻錄成VCD。

  8、MPEG2

  DVD的視頻部分就是採用的MPEG2,SVCD同樣也採用了MPEG2編碼。對應的文件擴展名一般爲VOB、MPG。MPEG2的設計目標就是提供接近廣播級的高品質輸出。

9、DivX

  DivX是近2年開始被大家認識的,DivX 視頻編碼技術可以說是一種對 DVD 造成威脅的新生視頻壓縮格式(有人說它是 DVD 殺手)對應的文件擴展名爲AVI或者DivX,它由 Microsoft mpeg-4v3 修改而來,使用 MPEG-4 壓縮算法。據說是美國禁止出口的編碼技術。DivX最大的特點就是高壓縮比和不錯的畫質,更可貴的是,DivX的對系統要求也不高,只要主頻300的CPU就基本可以很流暢的播放了,因此從DivX誕生起,立刻吸引了大家的注意力。DivX擁有比Indeo video 5.10高太多的壓縮效率,編碼質量也遠遠比Indeo video 5.10好,我實在想不出Indeo video 5.10還會有什麼前途。

  10、PICVideo MJPEG

  MJPEG是很多視頻卡支持的一種視頻編碼,隨卡提供了Codec,安裝完成後可以象使用其它編碼一樣生成AVI文件。MJPEG編碼常用於非線性系統,批上了一層很專業的外衣。MJPEG的編碼質量是相當高的,是一種以質量爲最高要求的編碼,這種編碼的設置比較複雜,可以得到很高的壓縮比,但犧牲瞭解碼速度,如果要保證解碼速度,編碼後的壓縮比確不是很理想,如果您希望從專業的非線性系統上捕捉視頻,然後自行進行處理,這種格式是很有必要去了解一些的。

  11、RealNetworks RealVideo

  REAL VIDEO(RA、RAM)格式由Real Networks公司開發的,一開始就定位在視頻流應用方面的,也可以說是視頻流技術的始創者。它可以在用 56K MODEM 撥號上網的條件實現不間斷的視頻播放。從RealVideo的定位來看,就是犧牲畫面質量來換取可連續觀看性。其實RealVideo也可以實現不錯的畫面質量,由於RealVideo可以擁有非常高的壓縮效率,很多人把VCD編碼成RealVideo格式的,這樣一來,一張光盤上可以存放好幾部電影。REAL VIDEO存在顏色還原不準確的問題,RealVideo就不太適合專業的場合,但RealVideo出色的壓縮效率和支持流式播放的特徵,使得RealVideo在網絡和娛樂場合佔有不錯的市場份額。

  12、Windows Media video

  Windows Media video就是微軟爲了和現在的Real Networks的RealVideo競爭而發展出來的一種可以直接在網上觀看視頻節目的文件壓縮格式!由於它使用了MPEG4的壓縮算法,所以壓縮率和圖像的質量都很不錯。我們經常看到的ASF和WMV就是Windows Media video。Windows Media video的編碼質量明顯好於RealVideo,因爲Windows Media video是微軟的傑作,所以Windows系統給Windows Media video給與了很好的支持,Windows Media Player可以直接播放這些文件。


三、有關音頻編碼

  自然界中的聲音非常複雜,波形極其複雜,通常我們採用的是脈衝代碼調製編碼,即PCM編碼。PCM通過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換爲數字編碼。

1、什麼是採樣率和採樣大小(位/bit)?

  聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行採樣。採樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,爲了復原波形,一次振動中,必須有2個點的採樣,人耳能夠感覺到的最高頻率爲20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次採樣,用40kHz表達,這個40kHz就是採樣率。我們常見的CD,採樣率爲44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示信號強度。量化電平數爲2的整數次冪,我們常見的CD位16bit的採樣大小,即2的16次方。採樣大小相對採樣率更難理解,因爲要顯得抽象點,舉個簡單例子:假設對一個波進行8次採樣,採樣點分別對應的能量值分別爲A1-A8,但我們只使用2bit的採樣大小,結果我們只能保留A1-A8中4個點的值而捨棄另外4個。如果我們進行3bit的採樣大小,則剛好記錄下8個點的所有信息。採樣率和採樣大小的值越大,記錄的波形更接近原始信號。

2、有損和無損

  根據採樣率和採樣大小可以得知,相對自然界的信號,音頻編碼最多隻能做到無限接近,至少目前的技術只能這樣了,相對自然界的信號,任何數字音頻編碼方案都是有損的,因爲無法完全還原。在計算機應用中,能夠達到最高保真水平的就是PCM編碼,被廣泛用於素材保存及音樂欣賞,CD、DVD以及我們常見的WAV文件中均有應用。因此,PCM約定俗成了無損編碼,因爲PCM代表了數字音頻中最佳的保真水準,並不意味着PCM就能夠確保信號絕對保真,PCM也只能做到最大程度的無限接近。我們而習慣性的把MP3列入有損音頻編碼範疇,是相對PCM編碼的。強調編碼的相對性的有損和無損,是爲了告訴大家,要做到真正的無損是困難的,就像用數字去表達圓周率,不管精度多高,也只是無限接近,而不是真正等於圓周率的值。

  3、爲什麼要使用音頻壓縮技術

  要算一個PCM音頻流的碼率是一件很輕鬆的事情,採樣率值×採樣大小值×聲道數 bps。一個採樣率爲44.1KHz,採樣大小爲16bit,雙聲道的PCM編碼的WAV文件,它的數據速率則爲 44.1K×16×2 =1411.2 Kbps。我們常說128K的MP3,對應的WAV的參數,就是這個1411.2 Kbps,這個參數也被稱爲數據帶寬,它和ADSL中的帶寬是一個概念。將碼率除以8,就可以得到這個WAV的數據速率,即176.4KB/s。這表示存儲一秒鐘採樣率爲44.1KHz,採樣大小爲16bit,雙聲道的PCM編碼的音頻信號,需要176.4KB的空間,1分鐘則約爲10.34M,這對大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂的朋友,要降低磁盤佔用,只有2種方法,降低採樣指標或者壓縮。降低指標是不可取的,因此專家們研發了各種壓縮方案。由於用途和針對的目標市場不一樣,各種音頻壓縮編碼所達到的音質和壓縮比都不一樣,在後面的文章中我們都會一一提到。有一點是可以肯定的,他們都壓縮過。

  4、頻率與採樣率的關係

  採樣率表示了每秒對原始信號採樣的次數,我們常見到的音頻文件採樣率多爲44.1KHz,這意味着什麼呢?假設我們有2段正弦波信號,分別爲20Hz和20KHz,長度均爲一秒鐘,以對應我們能聽到的最低頻和最高頻,分別對這兩段信號進行40KHz的採樣,我們可以得到一個什麼樣的結果呢?結果是:20Hz的信號每次振動被採樣了40K/20=2000次,而20K的信號每次振動只有2次採樣。顯然,在相同的採樣率下,記錄低頻的信息遠比高頻的詳細。這也是爲什麼有些音響發燒友指責CD有數碼聲不夠真實的原因,CD的44.1KHz採樣也無法保證高頻信號被較好記錄。要較好的記錄高頻信號,看來需要更高的採樣率,於是有些朋友在捕捉CD音軌的時候使用48KHz的採樣率,這是不可取的!這其實對音質沒有任何好處,對抓軌軟件來說,保持和CD提供的44.1KHz一樣的採樣率纔是最佳音質的保證之一,而不是去提高它。較高的採樣率只有相對模擬信號的時候纔有用,如果被採樣的信號是數字的,請不要去嘗試提高採樣率。

  5、流特徵

  隨着網絡的發展,人們對在線收聽音樂提出了要求,因此也要求音頻文件能夠一邊讀一邊播放,而不需要把這個文件全部讀出後然後回放,這樣就可以做到不用下載就可以實現收聽了。也可以做到一邊編碼一邊播放,正是這種特徵,可以實現在線的直播,架設自己的數字廣播電臺成爲了現實。


四、各種主流音頻編碼(或格式)的介紹

  1、PCM編碼

  PCM 脈衝編碼調製是Pulse Code Modulation的縮寫。前面的文字我們提到了PCM大致的工作流程,我們不需要關心PCM最終編碼採用的是什麼計算方式,我們只需要知道PCM編碼的音頻流的優點和缺點就可以了。PCM編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的Audio CD就採用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。

  2、WAVE

  這是一種古老的音頻文件格式,由微軟開發。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規範。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數。WAV對音頻流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支持ACM規範的編碼都可以爲WAV的音頻流進行編碼。很多朋友沒有這個概念,我們拿AVI做個示範,因爲AVI和WAV在文件結構上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以採用DivX編碼來壓縮視頻流,當然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示WAV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應的Decode,就可以欣賞這些WAV了。
在Windows平臺下,基於PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由於本身可以達到較高的音質的要求,因此,WAV也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基於PCM編碼的WAV被作爲了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如MP3轉換成WMA。

  3、 MP3編碼

  請參閱 MP3全攻略 一文

  4、OGG編碼

  網絡上出現了一種叫Ogg Vorbis的音頻編碼,號稱MP3殺手!Ogg Vorbis究竟什麼來頭呢?OGG是一個龐大的多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。整個OGG項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞彙是特里?普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞彙成爲了OGG項目中音頻編碼的正式命名。目前Vorbis已經開發成功,並且開發出了編碼器。
  Ogg Vorbis是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis可以在相對較低的數據速率下實現比MP3更好的音質!Ogg Vorbis這種編碼也遠比90年代開發成功的MP3先進,她可以支持多聲道,這意味着什麼?這意味着Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3只能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應的。
  和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來後還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和MP3一樣,OGG也支持VBR。

  5、MPC 編碼

  MPC是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什麼複雜的背景故事,她的出現目的就只有一個,更小的體積更好的音質!MPC以前被稱作MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印象,就是她出衆的音質。

  6、mp3PRO 編碼

2001年6月14日,美國湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協會(Fraunhofer Institute)於6月14日發佈了一種新的音樂格式版本,名稱爲mp3PRO,這是一種基於mp3編碼技術的改良方案,從官方公佈的特徵看來確實相當吸引人。從各方面的資料顯示,mp3PRO並不是一種全新的格式,完全是基於傳統mp3編碼技術的一種改良,本身最大的技術亮點就在於SBR(Spectral Band Replication 頻段複製),這是一種新的音頻編碼增強算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效率。SBR最大的優勢就是在低數據速率下實現非常高效的編碼,與傳統的編碼技術不同的是,SBR更像是一種後處理技術,因此解碼器的算法的優劣直接影響到音質的好壞。高頻實際上是由解碼器(播放器)產生的,SBR編碼的數據更像是一種產生高頻的命令集,或者稱爲指導性的信號源,這有點?idi的工作方式。我們可以看到,mp3PRO其實是一種mp3信號流和SBR信號流的混合數據流編碼。有關資料顯示,SBR技術可以改善低數據流量下的高頻音質,改善程度約爲30%,我們不管這個30%是如何得來的,但可以事先預知這種改善可以讓64kbps的mp3達到128kbps的mp3的音質水平(注:在相同的編碼條件下,數據速率的提升和音質的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的64kbps的mp3PRO可以媲美128kbps的mp3的宣傳基本是吻合的。

  7、WMA

  WMA就是Windows Media Audio編碼後的文件格式,由微軟開發,WMA針對的不是單機市場,是網絡!競爭對手就是網絡媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質。和以往的編碼不同,WMA支持防複製功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現在線廣播,由於是微軟的傑作,因此,微軟在Windows中加入了對WMA的支持,WMA有着優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。

  8、RA

  RA就是RealAudio格式,這是各位網蟲接觸得非常多的一種格式,大部分音樂網站的在線試聽都是採用了RealAudio,這種格式完全針對的就是網絡上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據聽衆的帶寬來控制自己的碼率,在保證流暢的前提下儘可能提高音質。RA可以支持多種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協議來隱匿文件的真實網絡地址,從而實現只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA和WMA是目前互聯網上,用於在線試聽最多的音頻媒體格式。

  9、APE

  APE是Monkey's Audio提供的一種無損壓縮格式。Monkey's Audio提供了Winamp的插件支持,因此這就意味着壓縮後的文件不再是單純的壓縮格式,而是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比遠低於其他格式,但能夠做到真正無損,因此獲得了不少發燒用戶的青睞。在現有不少無損壓縮方案種,APE是一種有着突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成爲了不少朋友私下交流發燒音樂的唯一選擇。
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章