音頻相關概念講解

一、音頻

        指人耳可以聽到的聲音頻率在20Hz~20kHz之間的聲波。
        如果在計算機加上相應的音頻卡—就是我們經常說的聲卡,我們可以把所有的聲音錄製下來,聲音的聲學特性如音的高低等都可以用計算機硬盤文件的方式儲存下來。反過來,我們也可以把儲存下來的音頻文件用一定的音頻程序播放,還原以前錄下的聲音。
二、採樣頻率
        指每秒鐘取得聲音樣本的次數。聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行採樣。
        採樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,爲了復原波形,採樣頻率越高,聲音的質量也就越好,聲音的還原也就越真實,但同時它佔的資源比較多。由於人耳的分辨率很有限,太高的頻率並不能分辨出來。22050的採樣頻率是常用的,44100已是CD音質,超過48000或96000的採樣對人耳已經沒有意義。這和電影的每秒24幀圖片的道理差不多。如果是雙聲道(stereo),採樣就是雙份的,文件也差不多要大一倍。
        根據奈奎斯特採樣理論,爲了保證聲音不失真,採樣頻率應該在40kHz左右。這個定理怎麼得來,我們不需要知道,只需知道這個定理告訴我們,如果我們要精確的記錄一個信號,我們的採樣頻率必須大於等於音頻信號的最大頻率的兩倍,記住,是最大頻率。
        在數字音頻領域,常用的採樣率有:
        8000 Hz - 電話所用採樣率,對於人的說話已經足夠
        11025 Hz - 電話所用採樣率
        22050 Hz - 無線電廣播所用採樣率
        32000 Hz - miniDV 數碼視頻 camcorder、DAT (LP mode)所用採樣率
        44100 Hz - 音頻 CD, 也常用於 MPEG-1 音頻(VCD,SVCD,MP3)所用採樣率
        47250 Hz - 商用 PCM 錄音機所用採樣率
        48000 Hz - miniDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用採樣率
        50000 Hz - 商用數字錄音機所用採樣率
        96000 Hz或者 192000 Hz - DVD-Audio、一些 LPCM DVD 音軌、BD-ROM(藍光盤)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用採樣率
二、採樣位數
        採樣位數也叫採樣大小或量化位數。它是用來衡量聲音波動變化的一個參數,也就是聲卡的分辨率或可以理解爲聲卡處理聲音的解析度。它的數值越大,分辨率也就越高,錄製和回放的聲音就越真實。而聲卡的位是指聲卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數,聲卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的準確程度。常見的聲卡主要有8位和16位兩種,如今市面上所有的主流產品都是16位及以上的聲卡。
        每個採樣數據記錄的是振幅, 採樣精度取決於採樣位數的大小:
        1 字節(也就是8bit) 只能記錄 256 個數, 也就是隻能將振幅劃分成 256 個等級;
        2 字節(也就是16bit) 可以細到 65536 個數, 這已是 CD 標準了;
        4 字節(也就是32bit) 能把振幅細分到 4294967296 個等級, 實在是沒必要了.
三、通道數
        即聲音的通道的數目。常見的單聲道和立體聲(雙聲道),現在發展到了四聲環繞(四聲道)和5.1聲道。
1.單身道
        單聲道是比較原始的聲音複製形式,早期的聲卡採用的比較普遍。單聲道的聲音只能使用一個揚聲器發聲,有的也處理成兩個揚聲器輸出同一個聲道的聲音,當通過兩個揚聲器回放單聲道信息的時候,我們可以明顯感覺到聲音是從兩個音箱中間傳遞到我們耳朵裏的,無法判斷聲源的具體位置。
2.立體聲
 

        雙聲道就是有兩個聲音通道,其原理是人們聽到聲音時可以根據左耳和右耳對聲音相位差來判斷聲源的具體位置。聲音在錄製過程中被分配到兩個獨立的聲道,從而達到了很好的聲音定位效果。這種技術在音樂欣賞中顯得尤爲有用,聽衆可以清晰地分辨出各種樂器來自的方向,從而使音樂更富想象力,更加接近於臨場感受。

        雙聲目前最常用途與兩個,在卡拉OK中,一個是奏樂,一個是歌手的聲音;在VCD中,一個是普通話配音,一個是粵語配音。

3.四聲環繞
        四聲道環繞規定了前左、前右,後左、後右四個發聲點,聽衆則被包圍在這中間。同時還建議增加一個低音音箱,以加強對低頻信號的回放處理(這也就是如今4.1聲道音箱系統廣泛流行的原因)。就整體效果而言,四聲道系統可以爲聽衆帶來來自多個不同方向的聲音環繞,可以獲得身臨各種不同環境的聽覺感受,給用戶以全新的體驗。如今四聲道技術已經廣泛融入於各類中高檔聲卡的設計中,成爲未來發展的主流趨勢。
4.5.1聲道
        5.1聲道已廣泛運用於各類傳統影院和家庭影院中,一些比較知名的聲音錄製壓縮格式,譬如杜比AC-3(Dolby Digital)、DTS等都是以5.1聲音系統爲技術藍本的,其中“.1”聲道,則是一個專門設計的超低音聲道,這一聲道可以產生頻響範圍20~120Hz的超低音。其實5.1聲音系統來源於4.1環繞,不同之處在於它增加了一箇中置單元。這個中置單元負責傳送低於80Hz的聲音信號,在欣賞影片時有利於加強人聲,把對話集中在整個聲場的中部,以增加整體效果。
        目前很多在線音樂播放器,比如說QQ音樂,已經提供5.1聲道音樂試聽和下載。
四、幀
        音頻的幀的概念沒有視頻幀那麼清晰,幾乎所有視頻編碼格式都可以簡單的認爲一幀就是編碼後的一副圖像。但音頻幀跟編碼格式相關,它是各個編碼標準自己實現的。因爲如果以PCM(未經編碼的音頻數據)來說,它根本就不需要幀的概念,根據採樣率和採樣精度就可以播放了。比如採樣率爲44.1kHZ,採樣精度爲16位的雙音頻,你可以算出比特率是44100*16*2bps,每秒的音頻數據是固定的44100*16*2/8 字節。
        amr幀比較簡單,它規定每20ms的音頻是一幀,每一幀音頻都是獨立的,有可能採用不同的編碼算法以及不同的編碼參數。
        mp3幀較爲複雜一點,包含了更多的信息,比如採樣率,比特率,等各種參數。
五、週期
        音頻設備一次處理所需要的幀數,對於音頻設備的數據訪問以及音頻數據的存儲,都是以此爲單位。
六、交錯模式
        數字音頻信號存儲的方式。數據以連續幀的方式存放,即首先記錄幀1的左聲道樣本和右聲道樣本,再開始幀2的記錄。
七、非交錯模式
        首先記錄的是一個週期內所有幀的左聲道樣本,再記錄所有右聲道樣本。
八、比特率
        比特率也叫碼率,指音樂每秒播放的數據量,單位用bit表示,也就是二進制位。 bps就是比特率。b就是比特(bit),s就是秒(second),p就是每(per),一個字節相當於8個二進制位。也就是說128bps的4分鐘的歌曲的文件大小是這樣計算的(128/8)*4*60=3840kB=3.8MB,1B(Byte)=8b(bit),一般mp3在128比特率左右爲益,也大概在3-4 BM左右的大小。
        在計算機應用中,能夠達到最高保真水平的就是PCM編碼,被廣泛用於素材保存及音樂欣賞,CD、DVD以及我們常見的 WAV文件中均有應用。因此,PCM約定俗成了無損編碼,因爲PCM代表了數字音頻中最佳的保真水準,並不意味着PCM就能夠確保信號絕對保真,PCM也只能做到最大程度的無限接近。
        要算一個PCM音頻流的碼率是一件很輕鬆的事情,採樣率值×採樣大小值×聲道數 bps。一個採樣率爲44.1KHz,採樣大小爲16bit,雙聲道的PCM編碼的WAV文件,它的數據速率則爲 44.1K×16×2 =1411.2Kbps。我們常見的Audio CD就採用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。
 

        雙聲道的PCM編碼的音頻信號,1秒鐘需要176.4KB的空間,1分鐘則約爲10.34M,這對大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂的朋友,要降低磁盤佔用,只有2種方法,降低採樣指標或者壓縮。降低採樣指標是不可取的,因此專家們研發了各種壓縮方案。最原始的有DPCM、ADPCM,其中最出名的爲MP3。所以,採用了數據壓縮以後的碼率遠小於原始碼。

 

轉自:https://blog.csdn.net/naibei/article/details/81030400

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章