音視頻基礎知識點

音頻

  • PCM:脈衝編碼調製(Pulse Code Modulation)。通過採樣、量化、編碼將模擬信號轉換爲數字信號。根據奈奎斯特採樣定理:爲了不失真地恢復模擬信號,採樣頻率應該不小於模擬信號頻譜中最高頻率的2倍。

  • 採樣率:即採樣的頻率。因爲採樣率要大於原聲波頻率的2倍,而人耳能聽到的最高頻率爲20kHz,所以爲了滿足人耳的聽覺要求,採樣率至少爲40kHz,通常爲44.1kHz,更高的通常爲48kHz。

  • 採樣位數:波形振幅在模擬信號上也是連續的樣本值,而在數字信號中,信號一般是不連續的,所以模擬信號量化以後,只能取一個近似的整數值,爲了記錄這些振幅值,採樣器會採用一個固定的位數來記錄這些振幅值,通常有8位、16位、32位。位數越多,記錄的值越準確,還原度越高。

  • 聲道數:支持能不同發聲(注意是不同聲音)的音響的個數。

  • 碼率:即比特率,一個數據流中每秒鐘能通過的信息量,單位bps(bit per second)。音頻碼率 = 採樣率 * 採樣位數 * 聲道數

視頻

  • 分辨率:橫向和縱向的像素數量,表示圖像的精細程度。1080P 的 P 指 Progressive scan(逐行掃描),即垂直方向像素點,也就是 "高",所以 1920 * 1080 叫 1080P, 不叫 1920P。

  • 碼率:概念同音頻的碼率。

  • 幀率:單位時間內幀的數量,單位爲:幀/秒 或fps(frames per second)。

  • RGB:紅、綠、藍三原色。通過R G B三種基礎色,可以混合出所有的顏色。

  • YUV:一種亮度與色度分離的色彩格式。

    • Y:亮度,就是灰度值。除了表示亮度信號外,還含有較多的綠色通道量;
    • U:藍色通道與亮度的差值;
    • V:紅色通道與亮度的差值。

因爲人眼對亮度敏感,對色度不敏感,所以減少部分UV的數據量,人眼是無法感知出來,這樣可以通過壓縮UV的分辨率,在不影響觀感的前提下,減小視頻的體積。

  • RGB和YUV的換算:

    Y = 0.299R + 0.587G + 0.114B
    U = -0.147R - 0.289G + 0.436B
    V = 0.615R - 0.515G - 0.100B
    ——————————————————
    R = Y + 1.14V
    G = Y - 0.39U - 0.58V
    B = Y + 2.03U
    
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章