音频格式详解

经典的WAV、WAVE文件作为最经典的Windows多媒体音频格式,应用非常广泛,它使用三个参数来表示声音:采样位数、采样频率和声道数。
声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。WAVE文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。
传统的MOD
MOD是一种类似波表的音乐格式,但它的结构却类似 MIDI,使用真实采样,体积很小,在以前的DOS年代,MOD经常被作为游戏的背景音乐。现在的MOD可以包含很多音轨,而且格式众多,如S3M、NST、669、MTM、XM、IT、XT和RT等。

电脑音乐MIDI
MIDI是Musical Instrument Data Interface的简称,它采用数字方式对乐器所奏出来的声音进行记录(每个音符记录为一个数字),然后,播放时再对这些记录通过FM或波表合成:FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出产生声音。

龙头老大MP3
MP3可谓是大名鼎鼎,它采用MPEG Audio Layer 3 技术,将声音用 1∶10 甚至 1∶12 的压缩率压缩,采样率为44kHz、比特率为112kbit/s。
MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。

网上霸主RA系列
RA、RAM和RM都是Real公司成熟的网络音频格式,采用了“音频流”技术,所以非常适合网络广播。在制作时可以加入版权、演唱者、制作者、Mail 和歌曲的Title等信息。
RA可以称为互联网上多媒体传播的霸主,适合于网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。

高压缩比的VQF
VQF即TwinVQ是由Nippon Telegraph and Telephone同YAMAHA公司开发的一种音频压缩技术。
VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到1∶18左右甚至更高。而像MP3、RA这些广为流行的压缩格式一般只有1∶12左右。但仍然不会影响音质,当VQF以44kHz-80kbit/s的音频采样率压缩音乐时,它的音质会优于44kHz-128kbit/s的MP3,以44kHz-96kbit/s压缩时,音乐接近44kHz-256kbit/s的MP3。

迷你光盘MD
MD(即MiniDisc)是SONY公司于1992年推出的一种完整的便携音乐格式,它所采用的压缩算法就是ATRAC技术(压缩比是1∶5)。MD又分为可录型MD(Recordable,有磁头和激光头两个头)和单放型MD(Pre-recorded,只有激光头)。
强大的编辑功能是MD的强项,可以快速选曲、曲目移动、合并、分割、删除和曲名编辑等多项功能,比CD更具个性化,随时可以拥有一张属于自己的MD专辑。MD的产品包括MD随身听、MD床头音响、MD汽车音响、MD录音卡座、MD摄像枪和MD驱动器等。

音乐CD
即CD唱片,一张CD可以播放74分钟左右的声音文件,Windows系统中自带了一个CD播放机,另外多数声卡所附带的软件都提供了CD播放功能,甚至有一些光驱脱离电脑,只要接通电源就可以作为一个独立的CD播放机使用。

潜力无限的WMA
微软在开发自己的网络多媒体服务平台上主推ASF(Audio Steaming format),这是一个开放支持在各种各样的网络和协议上的数据传输的标准。它支持音频、视频以及其他一系列的多媒体类型。而WMA是Windows Media Audio的缩写,相当于只包含音频的ASF文件。
WMA文件在80kbps、44kHz的模式下压缩比可达1∶18,基本上和VQF相同。而且压缩速度比MP3提高一倍。所以它应该比VQF更具有竞争力。

免费音乐格式Vorbis
为了防止MP3音乐公司收取的专利费用上升,GMGI的iCast公司的程序员开发了一种新的免费音乐格式Vorbis,其音质可以与MP3相媲美,甚至优于MP3。并且将通过网络发布,可以免费自由下载,不必担心会涉及侵权问题。但MP3在网上已经非常流行,微软的Windows Media技术也开始普及,Vorbis的前景还是不容乐观。

DVD-Audio
   DVD-Audio是以DVD(Digital Versatile Disc)作为储存媒介的新音乐媒体,于1999年三月提出。取样方式为LPCM(Linear Pulse Code Modulation),可选择性采用MLP(Meridian Lossless Packing)无失真压缩技术减少庞大的资料容量。DVD-Audio的取样率有44.1kHz、48kHz、88.2kHz、96kHz、176.4kHz、192kHz等,可以16Bits、20Bits、24Bits取样,使用立体声录制时最大资料流量可达192kHz 24Bits,当采用5.1声道(家庭剧院用中置一颗扬声器、主声道两颗、后环绕两颗、超低音一颗合称5.1声道)录制时最大取样率可达96kHz。DVD-Audio可于播放时搭配画面与音乐输出。DVD-Audio如此高的取样率最大的好处在于不需要繁复的超取样运算就可以得到正确的音讯波型,另一个好处是减少jitter对音质的影响。

其它音频格式
AIF/AIFF:苹果公司开发的一种声音文件格式,支持MAC平台,支持16位44.1kHz立体声。
AU:SUN的AU压缩声音文件格式,只支持8位的声音,,是互连网上常用到的声音文件格式,多由SUN工作站创建。
CDA:CD音轨文件。
CMF:CREATIVE 公司开发的一种类似MIDI的声音文件。
DSP:Digital Signal Processing(数字信号处理)的简称。通过提高信号处理方法,音质会极大地改善,歌曲会更悦耳动听。
S3U:MP3播放文件列表
RMI:MIDI乐器序列

有损压缩:
AAC:在高比特率下音质仅次于MPC,在高比特率和低比特率下表象都很不错。就是编码速度太慢!
MPC:低比特率下表现一般,不及Mp3Pro编码的MP3和OGG,高比特率下音质最好,编码速度快!
OGG:低比特率下音质最好,高比特率同样也不错。编码速度稍慢。
MP3(MP3Pro):在低比特率下音质次于OGG,其他方面同MP3
WMA:高低比特率下都一般,不支持VBR,最高192Kbit/s

无损压缩:
FLAC:压缩率在四个中最差,编码速度不错,平台支持很好。
PAC:稍慢的编码速度,压缩率排第三,平台支持良好。
APE:编码速度最快、最好的压缩率,平台支持一般。
WV:编码速度非常快,压缩率在四个种排第二,仅支持Windows平台

十款音频格式比较

       一、WMA

  由于是微软的作品,绝对不能小看,WMA象一剂强心针一样促进了流式媒体格式的大进步。WMA文件可以在仅仅20K Bitrate的流量下提供可听的音质,因此WMA常常当作用于在线收听和广播的首选,微软早就在Windows Media Player中提供了播放支持。当WMA的Bitrate上升到128k时,几乎在同级别的所有有损编码格式中笑傲江湖了,MP3在128KBitrate时,会出现明显的高频丢失,而WMA不会。但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。MP3却不一样,在192K时,音质可以比WMA好了。微软推出WMA编码时主要有2个针对目标,一个是瞄准了网络上的RM和RAM格式,另一个是用户硬盘中的MP3。但在高音质要求下,WMA仍无法构成对MP3的威胁。如果你要获得12:1左右或更高的压缩比,就不妨选择WMA格式,在这个流量下,WMA优秀太多了。
  WMA和MP3的优劣一直是大家争论的焦点,其实这是一个无法回答的问题。这要看你的实际需要,是追求高音质(mp3)还是高压缩率(wma)。

  二、VQF

  在WMA未流行之前,VQF是很受欢迎的一种格式,因为在低比特率下它的音质要好于MP3(比WMA稍差)。不支持"流"是VQF的致命弱点,这可能也是为什么现在它完全被WMA压下去的一个主要原因。

  三、MP3

  MP3最受争议的就是音质问题(尤其是随着WMA的普及),其高频损失很大,很多MP3编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节,类似吉他擦弦的感觉在MP3中是找不到的。在对MP3快要失望时,偶发现了Lame,它支持根据人耳遮蔽效应原理来分析波形,配合VBR技术,可以让音质达到令人吃惊的地步;其独创的心理音响模型技术保证了CD音频还原的真实性,配合VBR(动态比特率)和ABR(平均比特率)参数,编码出来的MP3音色纯厚、空间宽广、低音清晰、细节表现良好,音质几乎可以媲美CD音频,但文件体积却非常小。很多网友在使用LAME后的反映就是:立刻删除硬盘上所有的MP3和其他编码器,全部用Lame重新过一遍。
  Lame提供EXE和DLL,其中DLL是作为标准的动态运行库供其他程序调用。EXE是Command Line程序,象DOS程序一样工作,两者彼此独立,互不关联。但大家很快能发现两者编码的质量是不一样的,那是由于dll可控性差,与具备丰富调节参数的EXE版相比,其压缩出来的MP3效果稍逊一筹。但EXE是一个命令行工具,操作很麻烦,幸亏有了WinLAMEr或lameGUIxp这些Shell。只要学会使用这些Shell(是傻瓜型的,一看即会),就可以用LAME压缩出最最精彩的MP3了。
  再说说APS,在LAME出现以前,APS就是最好的MP3编码器,它使用的Fraunhofer IIS编码算法,这比LAME使用的编码算法要先进,在192k Bitrate(CBR)下,甚至比LAME编码的曲子要优秀,细节明显要丰富一些,但APS本身不支持VBR,当Bitrate往上提高时,音质就要比LAME编码的要差了,大部分朋友的MP3的一般都是128-192K Bitrate的,因此APS仍旧有推荐的价值。特别是有很多MP3随身听不支持VBR和256K Bitrate以上的MP3,LAME就不一定合适这些朋友了,APS就成了不错的选择,由它编码的曲子,绝对不会辱没你昂贵的PLAYER。

  四、MP3PRO

  MP3PRO完全是基于传统MP3编码技术的一种改良,本身最大的技术亮点就在于SBR(Spectral Band Replication频段复制),这是一种新的音频编码增强算法。它提供了改善低位率情况下音频和语音编码的性能的可能。这种方法可在指定的位率下增加音频的带宽或改善编码效率,SBR最大的优势就是在低数据速率下实现非常高效的编码。如果在高数据速率的情况下,SBR将如同虚设。当制作MP3PRO文件时,编码器将音频分为两部分。一部分是将音频数据中的低频段部分分离出来,通过传统的MP3技术而编码得出的正常的MP3音频流,此举可令到MP3编码器可以专注于低频段信号从而获得更好的压缩质量,而且原来的MP3播放器也可播放MP3PRO文件。另一部分则是将分离出来的高频段信号进行编码并嵌入到MP3流中,传统的MP3播放器会将其忽略掉,而新的MP3PRO播放器则可从中还原出高频信号,并将两者进行组合,得到高质量的全带宽的声音。官方宣称通过这样的技术,使得MP3PRO能在64kbps的编码率便可提供与128kbps的mp3相同的质量。
  低比特率下MP3PRO的性能很明显地比MP3要高,但是它与WMA谁胜谁负就很难说了,根据一些发烧友的评测, MP3PRO似乎略胜一些。高比特率下很少有人用到MP3PRO。

  五、OGG

  在高音质要求下,有损音频编码世界中是三足项立,分别为MP3、MPC、OGG。在大量新技术的支持下,这些编码都有非常出色的表现,都各自拥有一群支持者。较高比特率下,OGG展现出来的素质是很令人称道的,但是OGG也有一个不小的缺点,就是高频的金属味道,这多少有点让人失望。

  六、MPC

  较高比特率下(250kbps左右),MPC表现非常的出众,甚至超过了MP3,很难分辨它和原始信号有多少区别,无论从频率保留还是细节保留,以及信号强度失真来说,MPC太优秀了。但MPC并非万能的,它无法编码48khz采样率的曲子,所幸的是,这样的曲子来源很少。可惜这种格式并没有像MP3或WMA那样流行。

  七、ATRAC

  MD采用的就是ATRAC(Adaptive TRansform Acoustic Coding自适应声学转换编码)压缩算法,ATRAC目前仅支持MD,ATRAC还有一种衍生算法ATRAC3,OpenMG Jukebox使用的就是这种编码,编码后的文件扩展名为OMG。它集编码、抓轨、播放、管理和输出于一身,个头比较庞大,但操作还算方便。它使用了人耳遮蔽原理,能够有效的过滤人耳不敏感的声音信号,以达到更高的压缩比。与ATRAC不同的是,ATRAC3支持不同的平均数据速率,有132、105、66Kbits可选。这个软件可以直接向某些支持MDLP的MD机型提供直接输出,这样可以节省很多录制时间。这个软件对文件进行了严格的版权保护,无法象Mp3那样进行自由拷贝和备份。如果你有支持MDLP的MD,不妨试一试这个软件。

  八、APE

  和上面介绍的几款编码不同的是,这个编码提供了最好的音质保证(无损压缩)!还提供了Winamp的插件支持,可以直接用Winamp来播放。所谓无损就是指压缩后的格式和源文件在音质上并无差异,而Mp3、WMA等的编码方案是基于有损的,在损失部分音质的前提下节约存贮空间,所以说音质再好的Mp3、WMA也只能是无限接近源文件的音质。APE非常适合来编码讲究细节的独奏曲目和大动态的交响曲。向各位音乐迷们(不是歌迷)作最强烈的推荐!
  它的压缩比约为2:1。

  九、WAV

  它是未经压缩的格式,似乎不用多说,在APE未流行时,WAV一直是音质完美主义者的首选,即使是现在,如果你想做出高质量的音乐,WAV也是无法替代的中间体(因为目前公认最精确的抓轨软件EAC从CD直接得到的音乐是WAV格式)。

  十、RM

  RM已经是昨日黄花,没有任何新意,低Bitrate比不过WMA,高Bitrate比不过MP3,虽然新的RM导入了ATRAC3算法,但颓势已定,很难东山再起了。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章