音頻編碼格式

音頻編碼格式是指要在計算機內播放或是處理音頻文件,是對聲音文件進行數、模轉換的過程。

  • PCM編碼
    PCM 脈衝編碼調製是Pulse Code Modulation的縮寫。是目前計算機應用中最高保真水平的音頻編碼格式。PCM音頻數據是未經壓縮的音頻採樣數據裸流,它是由模擬信號經過採樣、量化、編碼轉換成的標準的數字音頻數據。PCM約定俗成了無損編碼,能做到最大程度的無限接近絕對保真。被廣泛用於素材保存及音樂欣賞,CD、DVD以及我們常見的WAV文件中均有應用,優點是音質好,缺點是體積大。

  • WAV格式
    WAV爲微軟公司(Microsoft)開發的一種聲音文件格式,它符合RIFF文件規範,用於保存Windows平臺的音頻信息資源,被Windows平臺及其應用程序所廣泛支持,在聲音文件質量和CD相差無幾。WAV打開工具是WINDOWS的媒體播放器。儘管音質出色,但在壓縮後的文件體積過大!相對其他音頻格式而言是一個缺點。WAV是最接近無損的音樂格式,所以文件大小相對也比較大。

    WAV特點
    WAV音頻格式的優點包括:簡單的編/解碼(幾乎直接存儲來自模/數轉換器(ADC)的信號)、普遍的認同/支持以及無損耗存儲。WAV格式的主要缺點是需要音頻存儲空間。對於小的存儲限制或小帶寬應用而言,這可能是一個重要的問題。常見的WAV文件使用PCM無壓縮編碼,這使WAV文件的質量極高,體積也出奇大。適用於:多媒體開發、保存音樂和音效素材。

  • MP3編碼
    MPEG-1 or MPEG-2 Audio Layer III是一種音頻壓縮技術,其全稱是動態影像專家壓縮標準音頻層面3(Moving Picture Experts Group Audio Layer III),簡稱爲MP3,是目前最流行的音頻編碼格式。1993年由德國Fraunhofer IIS研究院和湯姆生公司合作發展成功。

    MP3文件是由幀(frame)構成的,幀是MP3文件最小的組成單位。MPEG音頻文件是MPEG1標準中的聲音部分,也叫MPEG音頻層,它根據壓縮質量和編碼複雜程度劃分爲三層,即 Layer-1、Layer2、Layer3,且分別對應MP1、MP2、MP3這三種聲音文件,並根據不同的用途,使用不同層次的編碼。MPEG音頻編碼的層次越高,編碼器越複雜,壓縮率也越高,MP1和MP2的壓縮率分別爲4:1和6:1-8:1,而MP3的壓縮率則高達10:1-12:1,也就是說,一分鐘CD音質的音樂,未經壓縮需要10MB的存儲空間,而經過MP3壓縮編碼後只有1MB左右。不過MP3對音頻信號採用的是有損壓縮方式,爲了降低聲音失真度,MP3採取了“感官編碼技術”,即編碼時先對音頻文件進行頻譜分析,然後用過濾器濾掉噪音電平,接着通過量化的方式將剩下的每一位打散排列,最後形成具有較高壓縮比的MP3文件,並使壓縮後的文件在回放時能夠達到比較接近原音源的聲音效果。根據MPEG規範的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代。

  • AAC編碼
    AAC是高級音頻編碼(Advanced Audio Coding)的縮寫,出現於1997年,最初是基於MPEG-2的音頻編碼技術。由Fraunhofer IIS、Dolby Laboratories、AT&T、Sony等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出臺,AAC重新集成了其它技術(PS,SBR),爲區別於傳統的MPEG-2 AAC,故含有SBR或PS特性的AAC又稱爲MPEG-4 AAC。

    AAC是新一代的音頻有損壓縮技術,它通過一些附加的編碼技術(比如PS,SBR等),衍生出了LC-AAC,HE-AAC,HE-AACv2三種主要的編碼,LC-AAC就是比較傳統的AAC,相對而言,主要用於中高碼率(>=80Kbps),HE-AAC(相當於AAC+SBR)主要用於中低碼率(<=80Kbps),而新近推出的HE-AACv2(相當於AAC+SBR+PS)主要用於低碼率(<=48Kbps),事實上大部分編碼器設成<=48Kbps自動啓用PS技術,而>48Kbps就不加PS,就相當於普通的HE-AAC。

    AAC擴展名

  1. AAC—使用MPEG-2 Audio Transport Stream( ADTS,參見MPEG-2 )容器,區別於使用MPEG-4容器的MP4/M4A格式,屬於傳統的AAC編碼(FAAC默認的封裝,但FAAC亦可輸出 MPEG-4 封裝的AAC)
  2. MP4—使用了MPEG-4 Part 14的簡化版即3GPP Media Release 6 Basic (3gp6,參見3GP ) 進行封裝的AAC編碼(Nero AAC 編碼器僅能輸出MPEG-4封裝的AAC);
  3. M4A - 爲了區別純音頻MP4文件和包含視頻的MP4文件而由蘋果(Apple)公司使用的擴展名,Apple iTunes 對純音頻MP4文件採用了".M4A"命名。M4A的本質和音頻MP4相同,故音頻MP4文件亦可直接更改擴展名爲M4A。

AAC特點
4. AAC是一種高壓縮比的音頻壓縮算法,但它的壓縮比要遠超過較老的音頻壓縮算法,如AC-3、MP3等。並且其質量可以同未壓縮的CD音質相媲美。
5. 同其他類似的音頻編碼算法一樣,AAC也是採用了變換編碼算法,但AAC使用了分辨率更高的濾波器組,因此它可以達到更高的壓縮比。
6. AAC使用了臨時噪聲重整、後向自適應線性預測、聯合立體聲技術和量化哈夫曼編碼等技術,這些技術的使用都使壓縮比得到進一步的提高。(壓縮比通常爲18:1)
7. AAC支持更多種採樣率和比特率、支持1個到48個音軌、支持多達15個低頻音軌、具有多種語言的兼容能力、還有多達15個內嵌數據流。
8. AAC支持更寬的聲音頻率範圍,最高可達到96kHz,最低可達8KHz,遠寬於MP3的16KHz-48kHz的範圍。
9. 不同於MP3及WMA,AAC幾乎不損失聲音頻率中的甚高、甚低頻率成分,並且比WMA在頻譜結構上更接近於原始音頻,因而聲音的保真度更好。
10. AAC採用優化的算法達到了更高的解碼效率,解碼時只需較少的處理能力。
11. 不足:屬於有損壓縮,與APE、FLAC等無損格式相比,音質有“本質上”差距,同時USB3.0和大容量存儲空間等技術的普及,AAC的優勢不明顯。

  • WMA(Windows Media Audio)
    是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由於WMA在壓縮比和音質方面都超過了MP3,更是遠勝於RA(Real Audio),即使在較低的採樣頻率下也能產生較好的音質。一般使用Windows Media Audio編碼格式的文件以WMA作爲擴展名,一些使用Windows Media Audio編碼格式編碼其所有內容的純音頻ASF文件也使用WMA作爲擴展名。WMA支持防複製功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現在線廣播。

    WMA格式是以減少數據流量但保持音質的方法來達到更高的壓縮率目的,其壓縮率一般可以達到1:18,生成的文件大小隻有相應MP3文件的一半。
      所需頻寬:320~112kbps(壓縮10~12倍)
      特性:當Bitrate小於128K時,WMA幾乎在同級別的所有有損編碼格式中表現得最出色,但似乎128k是WMA一個檻,當Bitrate再往上提升時,不會有太多的音質改變。
      優點:當Bitrate小於128K時,WMA最爲出色且編碼後得到的音頻文件很小。
      缺點:當Bitrate大於128K時,WMA音質損失過大。WMA標準不開放,由微軟掌握。
      應用領域:voip

  • RA格式

    RA就是RealAudio格式,大部分音樂網站的在線試聽都是採用了RealAudio,這種格式完全針對的就是網絡上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據聽衆的帶寬來控制自己的碼率,在保證流暢的前提下儘可能提高音質。RA可以支持多種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協議來隱匿文件的真實網絡地址,從而實現只在線播放而不提供下載的欣賞方式。RA和WMA是目前互聯網上,用於在線試聽最多的音頻媒體格式。

  • AMR(Adaptive Multi-Rate)
    AMR:自適應多速率音頻壓縮音頻編碼格式,是一個使語音編碼最優化的專利,專用於有效地壓縮語音頻率。

    AMR音頻主要用於移動設備的音頻壓縮,壓縮比非常高,但是音質比較差,主要用於語音類的音頻壓縮,不適合對音質要求較高的音樂類音頻的壓縮。AMR被標準語音編碼 3GPP在1998年10月選用,現在廣泛在GSM和UMTS中使用。

  • OGG
    OGG是一個自由且開放標準的容器格式,由Xiph.Org 基金會所維護,“Ogg”意指一種文件格式,可以納入各式各樣自由和開放源代碼的編解碼器,包含音效、視頻、文字(像字幕)與元數據的處理。

    一般說到OGG,都是指Ogg_Vorbis,這就是常見的.ogg結尾的音頻文件,Vorbis是一種有損音訊壓縮格式,由Xiph.Org基金會所領導並開放源代碼。Vorbis通常以Ogg作爲容器格式,所以常合稱爲Ogg Vorbis。其實,OGG不僅僅只能包含Vorbis格式,它可以包含視頻格式。因此,爲了區分只包含音頻格式的文件格式,產生了一種新的文件格式OGV,這種格式既包含音頻格式,也包含視頻格式。但是OGV文件格式的壓縮方法和OGG是一樣的,可以採用同一種方式進行解析。

    優點與缺點:
    優點:

    1. Ogg Vorbis的音質和MP3不相上下,但無法和FLAC比。
    2. Ogg Vorbis支持類似於MP3的ID3信息;
    3. Ogg Vorbis格式支持流式播放;
    4. Ogg Vorbis避免了像MP3文件的ID3標記那樣煩瑣的操作(有很多針對MP3的ID3修改軟件標記早已不繁瑣)。

    缺點:

    1. 播放兼容性差。mp3已經成了便攜隨身聽的代名詞。絕大多數播放器、包括手機、pad等設備都支持mp3格式(其實mp3專利芯片授權費極低),而支持ogg格式的播放器很少。

    2. mp3是1997年以前就已經誕生,將近20年壟斷了消費機市場。ogg音頻普及性非常差,相對於mp3而言音質也沒有競爭力,普及的可能性極低。
      相對於已經普及的微軟WMA格式,ogg沒有任何優勢。不管是播放軟件兼容性,碼率,流媒體等方面。

    3. 多聲道系統已經由DOLBY、DTS兩家公司壟斷,他們都有完整的製作發行體系。大型多聲道電影、電視、音樂製作都是基於這兩家公司的技術和標準。ogg只能望洋興嘆了。

    4. 很多專業音頻製作軟件不支持ogg文件格式。

    5. 現今HIFI已經被HIRES(高解析)代替,隨着存儲、網速等限制,用戶的聆聽設備已經上了一個臺階,有損格式已經漸漸失去市場。

格式 特點 適用於
PCM編碼的WAV 音質非常好,被大量軟件所支持 多媒體開發、保存音樂和音效素材
MP3 音質好,壓縮比比較高,被大量軟件和硬件支持,應用廣泛 適合用於比較高要求的音樂欣賞
OGG 可以用比mp3更小的碼率實現比mp3更好的音質,高中低碼率下均具有良好的表現 用更小的存儲空間獲得更好的音質(相對MP3)
WMA 低碼率下的音質表現難有對手 在線試聽、低要求下的音樂欣賞
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章