MPEG-2 數字視頻技術參考指南 (4)—— MPEG-2音頻壓縮

轉載請註明出處: http://blog.csdn.net/zhubin215130/article/details/8938098

        MPEG-2音頻壓縮充分利用了人耳的限制,在更嘈雜的背景音中難以聽出相似的目標聲音。有兩種類型的掩蔽:聽覺掩蔽和時域掩蔽。


  • 聽覺掩蔽


        聽覺掩蔽發生在兩個相似頻率聲音同時出現的時候,如果一個聲音比另一個的音量更大,它將完全淹沒另一個聲音。比如說,當你想在火車站小聲談話的時候,聽覺掩蔽就發生了,穿行而過的火車會完全淹沒掉你的聲音。當火車的聲音出現後,較爲輕微的聲音將無法被感知到。


        兩個信號在頻率上越接近,就越容易發生聽覺掩蔽,儘管可能其中一個聲音的音量只是稍微大那麼一點點。比如說,如果兩個小號發出非常近似的高頻聲,音量較弱一點的小號將無法被聽到。但是,如果換成是一個低音鼓用相同分貝演奏,弱音量的小號則很容易被聽見,因爲兩者的聲音頻率有顯著的不同。由於人耳的靈敏度依賴於頻率,因此掩蔽效果也就依賴於頻率。相比高頻音而言,低頻音之間需要離得更近才能被掩蔽,一般來說,弱純音離強純音越近(頻率相近)就越容易被掩蔽。


  • 時域掩蔽


        當一個高分貝的聲音出現後,它將淹沒掉緊跟其之前或之後的低分貝的聲音,這種現象稱之爲時域掩蔽。通常時域掩蔽的時間範圍是在高分貝聲音之前或之後的幾毫秒,火車汽笛的轟鳴很容易掩蔽掉緊跟其後的微弱的嗶嗶聲。


        爲了充分利用這些聽覺特性,音頻壓縮算法將音頻頻譜劃分成許多次頻帶(sub-band)。每個次頻帶的動態範圍會單獨的縮減,因此動態範圍壓縮的效果就不是很顯著。這意味着可能每個採樣只有2-4bit,而不是每個次頻帶中的音頻採樣都是16bit。次頻帶中也使用度量常數,每個次頻帶的bit分配也是獨立開的,因此重要的頻段區間具有更高的權重。次頻帶的大小會根據頻率的不同而不同,以適應人耳的頻率掩蔽。

 

發佈了78 篇原創文章 · 獲贊 13 · 訪問量 34萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章