音視頻之採樣率

音頻採樣率

是指錄音設備在一秒鐘內對聲音信號的採樣次數,採樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,採樣頻率一般共分爲11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五個等級,11025Hz能達到AM調幅廣播的聲音品質,而22050Hz和24000HZ能達到FM調頻廣播的聲音品質,44100Hz則是理論上的CD音質界限,48000Hz則更加精確一些。

採樣率(也稱爲採樣速度或者採樣頻率)

定義了每秒從連續信號中提取並組成離散信號的採樣個數,它用赫茲(Hz)來表示。採樣頻率的倒數叫作採樣週期或採樣時間,它是採樣之間的時間間隔。注意不要將採樣率與比特率(bit rate,亦稱“位速率”)相混淆。

採樣頻率只能用於週期性採樣的採樣器,對於非週期性採樣的採樣器沒有規則限制。

採樣頻率的常用的表示符號是{\displaystyle f_{s},}。

在數字音頻領域,常用的採樣率有:

  • 8,000 Hz - 電話所用採樣率,對於人的說話已經足夠
  • 11,025 Hz - AM調幅廣播所用採樣率
  • 22,050 Hz和24,000 Hz - FM調頻廣播所用採樣率
  • 32,000 Hz - miniDV數碼視頻camcorder、DAT(LP mode)所用採樣率
  • 44,100 Hz - 音頻CD,也常用於MPEG-1音頻(VCD, SVCD, MP3)所用採樣率
  • 47,250 Hz - Nippon Columbia(Denon)開發的世界上第一個商用PCM錄音機所用採樣率
  • 48,000 Hz - miniDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用採樣率
  • 50,000 Hz - 二十世紀七十年代後期出現的3M和Soundstream開發的第一款商用數字錄音機所用採樣率
  • 50,400 Hz - 三菱X-80商用數字錄音機所用所用採樣率
  • 96,000或者192,000 Hz - DVD-Audio、一些LPCM DVD音軌、Blu-ray Disc(藍光光盤)音軌、和HD-DVD(高清晰度DVD)音軌所用所用採樣率
  • 2.8224 MHz - SACD、索尼和飛利浦聯合開發的稱爲Direct Stream Digital的1位sigma-delta modulation過程所用採樣率。

聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行採樣。採樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,爲了復原波形,一次振動中,必須有2個點的採樣,人耳能夠感覺到的最高頻率爲20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次採樣,用40kHz表達,這個40kHz就是採樣率。我們常見的CD,採樣率爲44.1kHz。
採集過程中視頻和音頻同步是非常重要的,光有頻率信息是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示信號強度。量化電平數爲2的整數次冪,我們常見的CD位16級的採樣大小,即2的4次方。採樣大小相對採樣率更難理解,因爲要顯得抽象點,舉個簡單例子:假設對一個波進行8次採樣,採樣點分別對應的能量值分別爲A1-A8,但我們只使用2bit的採樣大小,結果我們只能保留A1-A8中4個點的值而捨棄另外4個。如果我們進行3bit的採樣大小,則剛好記錄下8個點的所有信息。採樣率和採樣大小的值越大,記錄的波形更接近原始信號。

參見:

音頻

音頻中叫採樣率,是指把音頻信號數字化(AD採樣)後一個通道1秒鐘有多少個樣本,對應而來的就是原始的數據。如44.1kHz的採樣率,就是指1個通道1秒鐘有44.1k個數據,這數據可以是16位,也可以是24或者其他,這就是採樣精度。
碼率就是音頻文件或者音頻流中1秒中的數據量,如1.44Mbps,就是1秒鐘內的數據量達1.44Mbits。
原始的音頻數據和實際傳輸的音頻流的大小一般不一致,是因爲存在壓縮算法這東東。壓縮後的音頻流一般是固定比特率,這樣有利於穩定地傳輸。也可能是可變比特率,同樣大小的文件能取得更好的壓縮效果。
CD音質,一般2通道,原始音頻數據1秒鐘的數據量是44.1k162=1411.2kbits, 壓縮成128kbps的MP3,1秒鐘數據就變成了128kbits了。丟了少許一般人耳或者設備還原不了的細節,節省了大量的磁盤空間或帶寬。

視頻

視頻中對應時域的概念叫幀率,如電影的24fps,還有各種30fps,60fps,甚至高速攝影中的120fps,就是指1秒鐘抓多少幅圖像。耳朵比眼睛靈敏多了,眼睛還有視覺殘留,所以這個幀率比音頻採樣率低太多了。但是圖像細節更多,所以視頻有尺寸大小,分辨率,也有采樣精度(8b/10b)之類的區別。假設都是1920x1080的圖像,30fps。圖像原始的格式是RGB888,一秒鐘的數據量就是(8+8+8)1920108030 = 1,492,992,000 bits。
同樣視頻也存在壓縮算法,如H.264,壓縮完1秒鐘的數據就叫碼率。假設H.264壓縮1080p的視頻,碼率是10Mbps,就是說1秒中的數據量爲10
1024*1024= 10,485,760 bits。
兩者差別這麼大,也是通過色彩空間轉化,壓縮,丟掉一些人眼感知不到的細節,換取磁盤空間或帶寬。

一般而言,採樣率(幀率)越高,就能越真實低保留【原始模擬的音視頻細節】。碼率(採樣率)越高,能保留的【數字化後的音視頻內容】細節就越多,還原出來的音質或者畫質就越好。但是,技術是在不斷進步的,現在5W的LED比20年前5W的白熾燈要亮太多了。所以得結合各種採樣方式,壓縮算法質量,甚至音視頻特性來分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章