音視頻-位深度、採樣率以及碼率(1)

(一)關於位深度

位深度也叫採樣位深,音頻的位深度決定動態範圍。

我們常見的16Bit(16比特),可以記錄大概96分貝的動態範圍。那麼,您可以大概知道,每一個比特大約可以記錄6分貝的聲音。同理,20Bit可記錄的動態範圍大概就是120dB;24Bit就大概是144dB。

假如,我們定義0dB爲峯值,那麼聲音振幅以向下延伸計算,那麼,CD音頻可的動態範圍就是"-96dB~0dB。",依次類推,24Bit的HD-Audio高清音頻的的動態範圍就是"-144dB~0dB。"。由此可見,位深度較高時,有更大的動態範圍可利用,可以記錄更低電平的細節。

44分貝 - 屬於人類可以接受的程度
55分貝 - 開始感覺到煩
60分貝 - 開始沒有睡意
70分貝 - 令人精神緊張
85分貝 - 長時間讓人無法接受而捂住耳朵
100分貝 - 可讓你你的耳朵暫時失去聽覺
120分貝 - 可以瞬間刺穿你的耳膜
160分貝 - 碎玻璃
200分貝 - 人類死亡

 

(二)關於採樣頻率。


採樣頻率最直觀的影響是什麼?是影響聲音的頻率範圍表現力,採樣頻率越高,能表現的頻率範圍就越大。

根據採樣定理,低通信號的 無損採樣率 應該是 信號的帶寬 的 2 倍,人耳的聽覺極限是 20 KHz

44.1KHz採樣頻率,可以表現的頻率範圍是0Hz-22050Hz;48KHz採樣頻率可以表現的頻率範圍就是0Hz-24000Hz;96KHz採樣頻率可以表現的頻率範圍是0Hz-48000Hz。人耳能聽到的平均頻率範圍,大概是20Hz-20000Hz。


綜合以上兩條,那麼,假如您看到一個參數:

16Bit 44.1KHz,代表這個數字音頻能夠表現"96dB的動態範圍"和"0赫茲-22050赫茲"的頻率範圍;

24Bit 48KHz,代表這個數字音頻能夠表現"144dB的動態範圍"和"0赫茲-24000赫茲"的頻率範圍。

 

(三)音頻位速,也叫碼率,或者比特率。


位速是指在一個數據流中每秒鐘能通過的信息量,也可以理解爲:每秒鐘用多少比特的數據量去表示。

原則上,音頻位速越高質量越好。

不過,如果是有損壓縮音頻,不同的壓縮算法,即使位速相同,也會導致音質結果完全不同。

典型代表:96kbps的WMA音頻格式的音質明顯要比96kbps的MP3音質好。爲什麼會這樣呢?因爲不同的壓縮算法,對數據的利用率不同而造成的差異。再舉例,假如MP3壓縮至48kbps以下,已經慘不忍睹,而如果是AAC音頻格式,同樣是48kbps的位速下,音質明顯比MP3好。

而對於無損壓縮音頻,即使位速完全不同,但是最後的音質卻相同。比如把同一個WAV文件分別壓縮成FLAC格式和APE格式,得到的文件,位速是不太相同的,但是音質卻是一樣的。即使是同一種格式,壓縮級別不同,位速也完全不同,可是最後的結果,音質還是一樣(但編碼解碼時,CPU佔用率不同,編碼時間也不同)。

 

(四)總結:

1. 音頻:
音頻中叫採樣率,是指把音頻信號數字化(AD採樣)後一個通道1秒鐘有多少個樣本,對應而來的就是原始的數據。如44.1kHz的採樣率,就是指1個通道1秒鐘有44.1k個數據,這數據可以是16位,也可以是24或者其他,這就是採樣精度。
碼率就是音頻文件或者音頻流中1秒中的數據量,如1.44Mbps,就是1秒鐘內的數據量達1.44Mbits。
原始的音頻數據和實際傳輸的音頻流的大小一般不一致,是因爲存在壓縮算法這東東。壓縮後的音頻流一般是固定比特率,這樣有利於穩定地傳輸。也可能是可變比特率,同樣大小的文件能取得更好的壓縮效果。
CD音質,一般2通道,原始音頻數據1秒鐘的數據量是44.1k*16*2=1411.2kbits, 壓縮成128kbps的MP3,1秒鐘數據就變成了128kbits了。丟了少許一般人耳或者設備還原不了的細節,節省了大量的磁盤空間或帶寬。


2. 視頻:
視頻中對應時域的概念叫幀率,如電影的24fps,還有各種30fps,60fps,甚至高速攝影中的120fps,就是指1秒鐘抓多少幅圖像。耳朵比眼睛靈敏多了,眼睛還有視覺殘留,所以這個幀率比音頻採樣率低太多了。但是圖像細節更多,所以視頻有尺寸大小,分辨率,也有采樣精度(8b/10b)之類的區別。假設都是1920x1080的圖像,30fps。圖像原始的格式是RGB888,一秒鐘的數據量就是(8+8+8)*1920*1080*30 = 1,492,992,000 bits。
同樣視頻也存在壓縮算法,如H.264,壓縮完1秒鐘的數據就叫碼率。假設H.264壓縮1080p的視頻,碼率是10Mbps,就是說1秒中的數據量爲10*1024*1024= 10,485,760 bits。
兩者差別這麼大,也是通過色彩空間轉化,壓縮,丟掉一些人眼感知不到的細節,換取磁盤空間或帶寬。

=====================
一般而言,採樣率(幀率)越高,就能越真實低保留【原始模擬的音視頻細節】。碼率(採樣率)越高,能保留的【數字化後的音視頻內容】細節就越多,還原出來的音質或者畫質就越好。但是,技術是在不斷進步的,現在5W的LED比20年前5W的白熾燈要亮太多了。所以得結合各種採樣方式,壓縮算法質量,甚至音視頻特性來分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章