音頻採樣概念

轉:http://blog.csdn.net/sepnic/article/details/6277133

數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行採樣,每一次採樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之爲樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所採樣的數目稱爲採樣頻率或採率,單位爲HZ(赫茲)。採樣頻率越高所能描述的聲波頻率就越高。採樣率決定聲音頻率的範圍(相當於音調),可以用數字波形表示。以波形表示的頻率範圍通常被稱爲帶寬。要正確理解音頻採樣可以分爲採樣的位數和採樣的頻率。

1.採樣位數 

採樣位數可以理解爲採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄製和回放的聲音就越真實。我們首先要知道:電腦中的聲音文件是用數字0和1來表示的。所以在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。採集卡的位是指採集卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數。採集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的準確程度。8位代表2的8次方--256,16 位則代表2的16次方--64K。比較一下,一段相同的音樂信息,16位聲卡能把它分爲64K個精度單位進行處理,而8位聲卡只能處理256個精度單位,造成了較大的信號損失,最終的採樣效果自然是無法相提並論的。
如今市面上所有的主流產品都是16位的採集卡,而並非有些無知商家所鼓吹的64 位乃至128位,他們將採集卡的複音概念與採樣位數概念混淆在了一起。如今功能最爲強大的採集卡系列採用的EMU10K1芯片雖然號稱可以達到32位,但是它只是建立在Direct Sound加速基礎上的一種多音頻流技術,其本質還是一塊16位的聲卡。應該說16位的採樣精度對於電腦多媒體音頻而言已經綽綽有餘了。

2.採樣頻率

數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行採樣,每一次採樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之爲樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所採樣的數目稱爲採樣頻率或採率,單位爲HZ(赫茲)。採樣頻率越高所能描述的聲波頻率就越高。
採樣頻率是指錄音設備在一秒鐘內對聲音信號的採樣次數,採樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,採樣頻率一般共分爲 22.05KHz、44.1KHz、48KHz三個等級,22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則更加精確一些。對於高於48KHz的採樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價值。
5kHz的採樣率僅能達到人們講話的聲音質量。 
11kHz的採樣率是播放小段聲音的最低標準,是CD音質的四分之一。 
22kHz採樣率的聲音可以達到CD音質的一半,目前大多數網站都選用這樣的採樣率。 
44kHz的採樣率是標準的CD音質,可以達到很好的聽覺效果。 

3. 位速


位速是指在一個數據流中每秒鐘能通過的信息量。您可能看到過音頻文件用 “128–Kbps MP3” 或 “64–Kbps WMA” 進行描述的情形。Kbps 表示 “每秒千位數”,因此數值越大表示數據越多:128–Kbps MP3 音頻文件包含的數據量是 64–Kbps WMA 文件的兩倍,並佔用兩倍的空間。(不過在這種情況下,這兩種文件聽起來沒什麼兩樣。原因是什麼呢?有些文件格式比其他文件能夠更有效地利用數據, 64–Kbps WMA 文件的音質與 128–Kbps MP3 的音質相同。)需要了解的重要一點是,位速越高,信息量越大,對這些信息進行解碼的處理量就越大,文件需要佔用的空間也就越多。
爲項目選擇適當的位速取決於播放目標:如果您想把製作的 VCD 放在 DVD 播放器上播放,那麼視頻必須是 1150 Kbps,音頻必須是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 視頻可達到 400 Kbps—超過這個限度播放時就會出現異常。

VBR

 

VBR(Variable Bitrate)動態比特率。也就是沒有固定的比特率,壓縮軟件在壓縮時根據音頻數據即時確定使用什麼比特率。這是Xing發展的算法,他們將一首歌的複雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR算法很差,音質與CBR相去甚遠。幸運的是, Lame完美地優化了VBR算法,使之成爲MP3的最佳編碼模式。這是以質量爲前提兼顧文件大小的方式,推薦編碼模式。

ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR也被稱爲“Safe VBR”,它是在指定的平均Bitrate內,以每50幀(30幀約1秒)爲一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量。舉例來說,當指定用192kbps ABR對一段wav文件進行編碼時,Lame會將該文件的85%用192kbps固定編碼,然後對剩餘15%進行動態優化:複雜部分用高於192kbps 來編碼、簡單部分用低於192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps範圍內質量要好於CBR。可以做爲 VBR和CBR的一種折衷選擇。

CBR(Constant Bitrate),常數比特率,指文件從頭到尾都是一種位速率。相對於VBR和ABR來講,它壓縮出來的文件體積很大,但音質卻不會有明顯的提高。
對MP3來說Bitrate是最重要的因素,它用來表示每秒鐘的音頻數據佔用了多少個bit(bit per second,簡稱bps)。這個值越高,音質就越好。 

MP3

 

MP3的全稱應爲MPEG1 Layer-3音頻文件,MPEG(Moving Picture Experts Group)在漢語中譯爲活動圖像專家組,特指活動影音壓縮標準,MPEG音頻文件是MPEG1標準中的聲音部分,也叫MPEG音頻層,它根據壓縮質量和編碼複雜程度劃分爲三層,即Layer-1、Layer2、Layer3,且分別對應MP1、MP2、MP3這三種聲音文件,並根據不同的用途,使用不同層次的編碼。MPEG音頻編碼的層次越高,編碼器越複雜,壓縮率也越高,MP1和MP2的壓縮率分別爲4:1和6:1-8:1,而MP3的壓縮率則高達 10:1-12:1,也就是說,一分鐘CD音質的音樂,未經壓縮需要10MB的存儲空間,而經過MP3壓縮編碼後只有1MB左右。不過MP3對音頻信號採用的是有損壓縮方式,爲了降低聲音失真度,MP3採取了“感官編碼技術”,即編碼時先對音頻文件進行頻譜分析,然後用過濾器濾掉噪音電平,接着通過量化的方式將剩下的每一位打散排列,最後形成具有較高壓縮比的MP3文件,並使壓縮後的文件在回放時能夠達到比較接近原音源的聲音效果。(另MP3PRO: mp3PRO編碼器將音頻的錄音分成兩個部分:mp3部分和PRO部分。mp3部分分析低頻段(Low Frequency Band)信息,並將其編碼成通常的mp3文件數據流。這就使得編碼器能夠集中編碼更少的有用信息,獲得更佳品質的編碼效果。同時,這也保證了 mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的則是高頻段(High Frequency Band)信息,並將其編碼成mp3數據流的一部分,而這些通常在老的mp3解碼器裏是被忽略的。新的mp3PRO解碼器會有效地利用這部分數據流,將兩段(高頻段和低頻段)合併起來產生完全的音頻帶,達到增強音質的效果。)

發佈了11 篇原創文章 · 獲贊 10 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章