esp32~MP3音頻文件學習

主要了解了MP3文件結構及每個部分含義,音頻處理的專業術語概念。
比較重要的概念:

1. 編碼

從信息論的觀點來看,描述信源的數據是信息和數據冗餘之和,即:數據=信息+數據冗餘。音頻信號在時域和頻域上具有相關性,也即存在數據冗餘。將音頻作爲一個信源,音頻編碼的實質是減少音頻中的冗餘。
自然界中的聲音非常複雜,波形極其複雜,通常我們採用的是脈衝代碼調製編碼,即PCM編碼。PCM通過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換爲數字編碼。

2. 比特率

是指每秒傳送的比特(bit)數。單位爲bps(Bit Per Second),比特率越高,傳送的數據越大。在音頻、視頻領域,比特率常翻譯爲碼率,比特率表示經過編碼(壓縮)後的音、視頻數據每秒鐘需要用多少個比特來表示,而比特就是二進制裏面最小的單位,要麼是0,要麼是1。比特率與音、視頻壓縮的關係,簡單的說就是比特率越高,音頻、視頻的質量就越好,但編碼後的文件就越大;如果比特率越少則情況剛好相反。

比特率 = 採樣率 * 採樣位數 * 聲道數

3. 碼率/碼流/位率:

是指音頻、視頻文件在單位時間內使用的數據流量,通俗一點的理解就是取樣率,是音頻、視頻編碼中質量控制中最重要的部分,一般我們用的單位是Kb/s、Mb/s。一般來說碼流越大,壓縮比就越小,質量就越高。碼流越大,說明單位時間內取樣率越大,數據流,精度就越高,處理出來的文件就越接近原始文件。

4. MP3簡述

MP3全稱爲MPEG Audio Layer 3,它是一種高效的計算機音頻編碼方案,它以較大的壓縮比將音頻文件轉換成較小的擴展名爲.mp3的文件,基本保持源文件的音質,MP3是ISO/MPEG標準的一部分,

ISO/MPEG標準描述了使用高性能感知編碼方案的音頻壓縮,此標準一直在不斷更新以滿足“質高量小”的追求,現已形成MPEG Layer1、Layer2、Layer3三種音頻編解碼方案,分別對應MP1、MP2、MP3 這三種聲音文件

MPEG(Moving Picture Expert Group)是ISO下的一個動態圖像專家組,它指定的MPEG標準廣泛的應用於各種多媒體中,MPEG標準包括視頻和音頻標準,其中音頻標準已制定出MPEG-1、MPEG-2、MPEG-2 ACC、MPEG-4。MPEG-1和MPEG-2標準使用同一個音頻編解碼族Layer1、2、3,MP3絕大多數使用的是MPEG1標準

MP3音頻壓縮包含編碼和解碼兩部分,編碼是將原始信號轉換成電平信號的過程,解碼即是逆過程,MP3 採用了感知音頻編碼(PerceptualAudio Coding)這一失真算法。人耳感受聲音的頻率範圍是20Hz-20kHz,MP3截掉了大量的冗餘信號和無關的信號,編碼器通過混合濾波器組將原始聲音變換到頻率域,利用心理聲學模型,估算剛好能被察覺到的噪聲水平,再經過量化,轉換成Huffman編碼,形成MP3位流。解碼器要簡單得多,它的任務是從編碼後的譜線成分中,經過反量化和逆變換,提取出聲音信號。

5. MP3文件結構

大體上分爲三個部分:ID3V2+音頻數據+ID3V1
MP3文件結構
更多詳細參考

  1. MP3格式音頻文件結構解析MP3文件格式解析
  2. MP3文件結構解析(超詳細)MP3格式音頻文件結構解析
  3. MP3文件格式解析MP3編碼分析 - xiahouzuoxin
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章