研究音頻編解碼要看什麼書

前言。。。。。。

最近總是有人問研究音頻編解碼要看什麼書

其實這是一個很難回答的問題,原因有很多。

首先,做工程首先一個問題就是和課本學習不同,不是看書能解決的。

其次,音頻編解碼技術在國內研究的人很少包括總體的音頻技術國內相對國外都研究的不多。(從中國的潛艇噪聲技術一直解決不好就能看出一二)。

第三,音頻編解碼技術是一種應用,而一般的書籍都是理論基礎。

只看理論書籍和應用脫離太多,沒有實用會忘記。

我當初看書也是從工程入手,就是在實際工作中和個人興趣中看了大量的標準,然後對不懂的地方找論文,再找書籍補知識。可以說這是典型的逆向學習。

通常研究生是課本->看論文->做工程。

 

但是我還是總結 一下關於如何看書的問題,希望對入門者有幫助

概述。。。。。

首先,音頻編解碼技術是一種比較複雜的應用,而普通的書籍是一種理論書籍尤其是在中國。一會解釋這句話。

其次,音頻編解碼技術和一般的音頻技術不同,比如AEC,HRTF,後者分別是語音和音頻的應用技術,應該說是一種具體的應用技術,相對來說查資料還是容易有的放矢。

分解。。。。。

其實音頻編解碼技術也是一種具體的應用技術,但是可能系統相對複雜,目的相對基礎。它是信源編解碼技術的一個分支,目的就是壓縮數據。

那麼音頻編解碼技術包括哪些方面呢?

既然他是一種信源編解碼器技術(Source Coding Technology)那麼信源編解碼技術的書籍都可以看,做理論基礎學習。

另外其實我把音頻編解碼技術分爲5大技術,EQTPM,E,熵編碼,Q,量化編碼,T,變換編碼,P,預測編碼,M,音頻建模(感知建模,BCC建模,正弦建模等)

這裏包括4類書籍:

1.語音編解碼書籍,因爲國內講寬帶音頻編解碼的書籍很少,所以可以看些語音編解碼的書籍,裏面也有講EQTP技術。

例如:《語音處理技術》,《語音編碼》,《低碼率音頻編碼》,《數字語音編碼原理》,《變速率語音編碼》《低速率語音編碼》《數字語音編碼》《數據壓縮》

《JPEG2000 圖像壓縮基礎》:我認爲這本書講的還是不錯的,翻譯的也不錯,很多基本原理講的比較透徹。

2.理論基礎書籍,《信息論與編碼》,《信號與系統》,高數這類我就不但列出來了,但是也要常番。

3.國外的寬音頻編碼書籍,例如我認爲很經典的ANDREAS SPANIAS的《Audio Signal Processing and Coding 》。以及他的63頁的論文,《Perceptual Coding of Digital Audio》。

其他可看的書籍包括:

MP3之父——K. Brandenburg的《Applications of Digital Signal Processing to Audio and Acoustics》

《A Digital Signal Processing Primer, with Applications to Digital Audio and Computer Music》

《Auditory Perception and the MPEG Audio Standard》

《Foundation and Evolution of Standardized Coders (Wiley,2003)(ISBN 0471373125)(578s)》

漢堡聯邦國防軍大學Udo Zolzer教授的《Digital Audio Signal Processing》

《High-Fidelity Multichannel Audio Coding》

《Speech Coding Algorithms》

我強烈推薦把SPANIAS的書讀一下。至少把SPANIAS的那個論文仔細看一下。你會對音頻編碼的理解有很深的幫助。但是裏面會將很多關於耳朵的生理詞語,要拿着字典慢慢翻。這個論文我是煩爛了的。使我受益匪淺。

後面的書籍我還沒有系統看過,但都有PDF版本,我也是偶爾翻一下。因爲這些經典書籍你不花大時間理解,會造成假象是乍看起來都講得類似,但實際理解起來發現是對不同細節的闡述。

4.其他類書籍

專門書籍,

如《自適應信號處理》,因爲音頻編碼也好其他音頻技術也好,自適應技術是經常使用的。例如無損編碼的Wavpack,MPEG4 ALS,都使用了自適應技術。

濾波器設計的相關書籍。

《多抽樣率數字信號處理理論及其應用》:講解Transform技術。

HE-AAC和ATRAC3,使用的QMF,

MP3 使用的PQF

AAC,MP3使用的MDCT

AC3使用的TDAC(MDCT)

WMA和G。722.1的(MLT)

都是爲什麼,選擇這些變換工具。有什麼區別。

如果你能看看Vaidyananthan PP的書,會更有幫助。

最後。。。。。。。。。

除了這些書籍,建議大家多看看論文。

很多國外的大學都有專門的論文和PPT教學。

我把論文分3類。

1.會議論文(有的講的很有點概況,有的有些對原理公式還是講的比較清楚,還有一些強調系統性和介紹的)。

例如:倫敦學院的《A Survey of Packet Loss Recovery Techniques for Streaming Audio》 對PLC技術做了系統歸納

L Daudet的《A review on techniques for the extraction of transients in musical signals》對瞬態信號提取技術做了歸納。

2.畢業論文。往往講的很詳細。

這裏我舉2個例子,文章太多我就截屏解釋吧。

3.經典PPT

例如很多大學和機構開放課程會有一些經典PPT。

例如:德國Fraunhofer的主頁就有很多獎MPEG系列音頻編碼技術的PPT。非常好,非常推薦。

除了論文,我們還可以看一些一些常用的網址

我就給一個好了,超經典的

斯坦福大學

Julius Orion Smith III 教授的主頁

https://ccrma.stanford.edu/~jos/

不說了,自己看吧,引用裏面的介紹--(1GB of on-line publications, sound examples, and software )

 

結語。。。。。。。。

 饅頭要一口一口吃,耐心些,開始吧

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章