PCM 音頻格式分析

源地址：http://gadil.blog.51cto.com/1077220/1142552

PCM文件：模擬音頻信號經模數轉換（A/D變換）直接形成的二進制序列，該文件沒有附加的文件頭和文件結束標誌。Windows的Convert工具可以把PCM音頻格式的文件轉換成Microsoft的WAV格式的文件。

          將音頻數字化，其實就是將聲音數字化。最常見的方式是透過脈衝編碼調製PCM(Pulse Code Modulation) 。運作原理如下。首先我們考慮聲音經過麥克風，轉換成一連串電壓變化的信號，如圖一所示。這張圖的橫座標爲秒，縱座標爲電壓大小。要將這樣的信號轉爲 PCM 格式的方法，是使用三個參數來表示聲音，它們是：聲道數、採樣位數和採樣頻率。

         採樣頻率：即取樣頻率,指每秒鐘取得聲音樣本的次數。採樣頻率越高,聲音的質量也就越好,聲音的還原也就越真實，但同時它佔的資源比較多。由於人耳的分辨率很有限,太高的頻率並不能分辨出來。在16位聲卡中有22KHz、44KHz等幾級,其中，22KHz相當於普通FM廣播的音質，44KHz已相當於CD音質了，目前的常用採樣頻率都不超過48KHz。

        採樣位數：即採樣值或取樣值（就是將採樣樣本幅度量化）。它是用來衡量聲音波動變化的一個參數，也可以說是聲卡的分辨率。它的數值越大，分辨率也就越高，所發出聲音的能力越強。
　
         聲道數很好理解，有單聲道和立體聲之分，單聲道的聲音只能使用一個喇叭發聲（有的也處理成兩個喇叭輸出同一個聲道的聲音），立體聲的pcm可以使兩個喇叭都發聲（一般左右聲道有分工），更能感受到空間效果。

下面再用圖解來看看採樣位數和採樣頻率的概念。讓我們來看看這幾幅圖。圖中的黑色曲線表示的是pcm文件錄製的自然界的聲波，紅色曲線表示的是pcm文件輸出的聲波，橫座標便是採樣頻率；縱座標便是採樣位數。這幾幅圖中的格子從左到右，逐漸加密，先是加大橫座標的密度，然後加大縱座標的密度。顯然，當橫座標的單位越小即兩個採樣時刻的間隔越小，則越有利於保持原始聲音的真實情況，換句話說，採樣的頻率越大則音質越有保證；同理，當縱座標的單位越小則越有利於音質的提高，即採樣的位數越大越好。

          在計算機中採樣位數一般有8位和16位之分，但有一點請大家注意，8位不是說把縱座標分成8份，而是分成2的8次方即256份；同理16位是把縱座標分成2的16次方65536份；而採樣頻率一般有11025HZ（11KHz），22050HZ（22KHz）、44100Hz（44KHz）三種。

          那麼，現在我們就可以得到pcm文件所佔容量的公式：
存儲量=(採樣頻率*採樣位數*聲道)*時間/8(單位：字節數)

例如，數字激光唱盤(CD－DA，紅皮書標準)的標準採樣頻率爲44.lkHz，採樣數位爲16位，立體聲(2聲道)，可以幾乎無失真地播出頻率高達22kHz的聲音，這也是人類所能聽到的最高頻率聲音。激光唱盤一分鐘音樂需要的存儲量爲：　　　　　
(44.1*1000*l6*2)*60/8=10，584，000(字節)=10.584MBytes
這個數值就是pcm聲音文件在硬盤中所佔磁盤空間的存儲量。

計算機音頻文件的格式決定了其聲音的品質，日常生活中電話、收音機等均爲模擬音頻信號，即不存在採樣頻率和採樣位數的概念，我們可以這樣比較一下：
          44KHz，16BIT的聲音稱作：CD音質；
          22KHz、16Bit的聲音效果近似於立體聲（FM Stereo）廣播，稱作：廣播音質；
          11kHz、8Bit的聲音，稱作：電話音質。
          微軟的WAV文件就是pcm編碼的一種。

PCM 音頻格式分析

怎麼在Release下調試代碼

Reference 3DV Test Sequence

再談異構計算CPU+GPU(APU)

win8安裝android

I 幀,B幀,P幀,IDR幀的區別

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結