音頻採樣定理

 1、採樣,量化。
 聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行採樣。採樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,爲了復原波形,一次振動中,必須有2個點的採樣,人耳能夠感覺到的最高頻率爲20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次採樣,用40kHz表達,這個40kHz就是採樣率。我們常見的CD,採樣率爲44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示信號強度。量化電平數爲2的整數次冪,我們常見的CD位16bit的採樣大小,即2的16次方。採樣大小相對採樣率更難理解,因爲要顯得抽象點,舉個簡單例子:假設對一個波進行8次採樣,採樣點分別對應的能量值分別爲A1-A8,但我們只使用2bit的採樣大小,結果我們只能保留A1-A8中4個點的值而捨棄另外4個。如果我們進行3bit的採樣大小,則剛好記錄下8個點的所有信息。採樣率和採樣大小的值越大,記錄的波形更接近原始信號。
  採樣頻率越高所能描述的聲波頻率就越高。 對於每個採樣系統均會分配一定存儲位(bit數)來表達聲波的聲波振幅狀態,稱之爲採樣分辨率或採樣精度,每增加一個bit,表達聲波振幅的狀態數就翻一翻,並且增加6db的動態範圍態,即6db的動態範圍,一個2bit的數碼音頻系統表達千種狀態,即12db的動態範圍,以此類推。如果繼續增加bit數則採樣精度就將以非常快的速度提高,可以計算出16bit能夠表達65536種狀態,對應,96db 而20bit可以表達1048576種狀態,對應120db。24bit可以表達多達16777216種狀態。對應144db的動態範圍,採樣精度越高,聲波的還原就越細膩。(注:動態範圍是指聲音從最弱到最強的變化範圍)人耳的聽覺範圍通常是20HZ~20KHZ。採樣定理表明採樣頻率必須大於被採樣信號帶寬的兩倍,另外一種等同的說法是奈奎斯特頻率必須大於被採樣信號的帶寬。
  如果信號的帶寬是 100Hz,那麼爲了避免混疊現象採樣頻率必須大於 200Hz。
  換句話說就是採樣頻率必須至少是信號中最大頻率分量頻率的兩倍,否則就不能從信號採樣中恢復原始信號。
  根據奈魁斯特(NYQUIST)採樣定理,用兩倍於一個正弦波的頻繁率進行採樣就能完全真實地還原該波形,因此一個數碼錄音波的休樣頻率直接關係到它的最高還原頻率指標例如,用44.1KHZ的採樣頻率進行採樣,則可還原最高爲22.05KHZ的頻率—–這個值略高於人耳的聽覺極限,(注: 可錄MD,例R900的取樣頻率爲44.1KHZ並且有取樣頻率轉換器,可將輸入的32KHz/44.1KHZ/48KHZ轉換爲該機的標準取樣頻率44.1KHZ的還原頻率足已記示和真實再現世界上所有人再能辯的聲音了,所以CD音頻的採樣規格定義爲16bit。44KHZ, 即使在最理想的環境下用現實生活中幾乎不可能製造的高精密電子元器件真實地實現了16bit的錄音,仍然會受到濾波和聲特定位等問題的困擾,人們還是能察覺出一些微小的失真所以很多專業數碼音頻系統已經使用18bit甚至24bit 進行錄音和回放了。

2、音頻速率,也叫碼率,或者比特率。

是指在一個數據流中每秒鐘能通過的信息量,也可以理解爲:每秒鐘用多少比特的數據量去表示。

原則上,音頻位速越高質量越好。

不過,如果是有損壓縮音頻,不同的壓縮算法,即使位速相同,也會導致音質結果完全不同。

典型代表:96kbps的WMA音頻格式的音質明顯要比96kbps的MP3音質好。爲什麼會這樣呢?因爲不同的壓縮算法,對數據的利用率不同而造成的差異。再舉例,假如MP3壓縮至48kbps以下,已經慘不忍睹,而如果是AAC音頻格式,同樣是48kbps的位速下,音質明顯比MP3好。

而對於無損壓縮音頻,即使位速完全不同,但是最後的音質卻相同。比如把同一個WAV文件分別壓縮成FLAC格式和APE格式,得到的文件,位速是不太相同的,但是音質卻是一樣的。即使是同一種格式,壓縮級別不同,位速也完全不同,可是最後的結果,音質還是一樣(但編碼解碼時,CPU佔用率不同,編碼時間也不同)。

發佈了28 篇原創文章 · 獲贊 18 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章