視頻編碼那點事兒

週五下午,師兄李先成在企鵝上叫我,說他有個老師錄的優課沒法導入CS中編輯(我猜應該是個漂亮小師妹),轉碼後文件大小和時長都不對,而且這個學校錄播教室出來的視頻都有這個問題。第一感覺便是視頻編碼有問題,應該是學校的錄播系統使用了一個不太常見的編碼格式,但編輯軟件和轉碼軟件都錯誤識別了編碼格式,繼而使用了錯誤的解碼方案進行解碼,才導致出現這樣奇怪的事情發生。接到傳過來的視頻文件,有1個多G,簡單查一下視頻流信息,果然是這個原因。

上面這件事中牽涉到了視頻編碼的概念, 有時我們會簡稱編碼,而編碼在計算機中無處不在:數制上的二進制(Bit)、字節(Byte)、十六進制編碼,通信用的海明碼、循環冗餘碼(CRC)、數據鏈路層編碼(幀),字符上的GBK、Unicode編碼,音頻中Wav、MP3編碼,視頻中AVC、MPEG編碼等等,可以說計算機就是建立在編碼之上的科學,所以纔會有程序猿(媛)笑稱自己是碼農這回事,而音視頻編碼只是這大碼世界中的滄海一粟,今天我們就來簡單說說這麼個事兒。

 媒體編碼本質就是將可見的視頻數據與可聞的音頻數據整合成一個以時間爲參考線,以文件爲形式存放於介質之上的操作。從感知上來說,大衆最早接觸到的視頻編碼應該源於VCD。當年萬燕開創第一臺VCD後,中國大陸K歌之風遍地開花,各種戶外KTV小攤橫行街市,我還記得六安三角臺那裏每天華燈初上時,羣英薈萃的盛況。標準的VCD只能壓縮有限的幾首MTV進入一張640M的光盤中,這從歌攤經營者的角度來說,單張盤的成本偏高,加上磨損折舊報廢,成本就更高了,以我們中國人特有的小聰明角度去想,這事肯定有改進的空間。經過幾番努力,超壓的盜版碟就橫空出世,更多內容更長播放時長,這技術一掃整個數字音樂出版界。爲了兼容這種超壓碟,廠商不遺餘力的加強研發技術支持,這其中重點就是對超壓盜版碟的解碼技術研發,曾經那個喊的震天響的口號叫“超級糾錯,超級解碼”的VCD廠商,今天出了個通訊設備叫R15。當年每個購買VCD播放機的用戶,開口問店員的第一句話便是能看超壓碟不,可見其科普力量之大。

多媒體技術發展到今天,編碼早已經不是什麼稀罕事,各種跨平臺的媒體文件四處流動,構建了一個精神生活資源無比豐富的新世界。而這些流動的媒體使用了各異的編碼方式,那在這萬千種的編碼中,如何知曉一個視頻文件用了什麼編碼方式呢?其實,主流的視頻播放軟件都帶有編碼探測功能,以韓國的potplayer爲例,在播放的視頻上點右鍵選屬性即可以看到整個視頻編碼的詳細信息。此外,還有個好事的軟件叫MediaInfo,他的主業就是檢測視頻文件的編碼構成。

如果一款視頻後期的編輯軟件不認識你給的視頻文件,臨牀表現就是拖不到編輯軌道上或是跳出個紅框告訴你打不開,這時就要曲線救國,需要做轉碼處理,以將就視頻編輯軟件。一般來說,一種編碼轉另一種編碼,都會有對應專業工具,可是這些工具雖然針對性強,但蒐集整理不方便,本着以懶爲本的原則,綜合性轉換工具就誕生了,比如在前一篇文章介紹過的獨領風騷的格式工廠,其實暴風科技旗下的暴風轉碼也是相當優秀的,此外,像魔影工廠,狸窩、萬能轉換器都可以嘗試下,總有一款對你胃口。在Windows平臺上,WMV應該是沒有軟件不支持的格式,這是Windows Media所創建的一種格式,大微軟自家的格式,通用性極佳,所以優先推薦大家做爲中間碼使用。

下面我們來看看常見視頻編碼格式產生的歷史與特點,以便下次你見到他們不至於陌生:

AVI它的英文全稱爲Audio Video Interleaved,即音頻視頻交錯格式。它於1992年被Microsoft公司推出,隨Windows3.1一起被人們所認識和熟知。所謂“音頻視頻交錯”,就是可以將視頻和音頻交織在一起進行同步播放。這種視頻格式的優點是圖像質量好,可以跨多個平臺使用,其缺點是體積過於龐大,而且更加糟糕的是壓縮標準不統一,最普遍的現象就是高版本Windows媒體播放器播放不了採用早期編碼編輯的AVI格式視頻,而低版本Windows媒體播放器又播放不了採用最新編碼編輯的AVI格式視頻,所以我們在進行一些AVI格式的視頻播放時常會出現由於視頻編碼問題而造成的視頻不能播放或即使能夠播放,但存在不能調節播放進度和播放時只有聲音沒有圖像等一些莫名其妙的問題,如果用戶在進行AVI格式的視頻播放時遇到了這些問題,可以通過下載相應的解碼器來解決。 


MKVMKV是Matroska的一種媒體文件, Matroska是一種新的多媒體封裝格式,它可將多種不同編碼的視頻及16條以上不同格式的音頻和不同語言的字幕流封裝到一個Matroska Media文件當中。多媒體封裝格式,也稱多媒體容器 (MultimediaContainer),它不同於DivX、 MP3這類編碼格式,它只是爲多媒體編碼提供了一個“外殼”,常見的AVl、VOB、 MPEG格式都是屬於這種類型。但這些封裝格式要麼結構陳舊,要麼不夠開放,正因爲如此,才促成了Matroska這類新的多媒體封裝格式的誕生。 Matroska媒體定義了三種類型的文件:MKV是視頻文件,它裏面可能還包含有音頻和字幕;MKA是單一的音頻文件,但可能有多條及多種類型的音軌;MKS是字幕文件。這三種文件以MKV最爲常見。 


nAVInAVI是newAVI的縮寫,是一個名爲ShadowRealm的地下組織發展起來的一種新視頻格式(與我們上面所說的AVI格式沒有大聯繫)。它是由Microsoft ASF壓縮算法的修改而來的,但是又與下面介紹的網絡影像視頻中的ASF視頻格式有所區別,它以犧牲原有ASF視頻文件視頻“流”特性爲代價而通過增加幀率來大幅提高ASF視頻文件的清晰度。 


DV-AVIDV的英文全稱是Digital Video Format,是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。目前非常流行的數碼攝像機就是使用這種格式記錄視頻數據的。它可以通過電腦的IEEE 1394端口傳輸視頻數據到電腦,也可以將電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般是.avi,所以也叫DV-AVI格式。 


MPEG它的英文全稱爲Moving Picture Expert Group,即運動圖像專家組格式,家裏常看的VCD、SVCD、DVD就是這種格式。MPEG文件格式是運動圖像壓縮算法的國際標準,它採用了有損壓縮方法減少運動圖像中的冗餘信息,說的更加明白一點就是MPEG的壓縮方法依據是相鄰兩幅畫面絕大多數是相同的,把後續圖像中和前面圖像有冗餘的部分去除,從而達到壓縮的目的(其最大壓縮比可達到200:1)。目前MPEG格式有三個壓縮標準,分別是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7與MPEG-21仍處在研發階段。 


MPEG-1制定於1992年,它是針對1.5Mbps以下數據傳輸率的數字存儲媒體運動圖像及其伴音編碼而設計的國際標準。也就是我們通常所見到的VCD製作格式。使用MPEG-1的壓縮算法,可以把一部120分鐘長的電影壓縮到1.2GB左右大小。這種視頻格式的文件擴展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盤中的.dat文件等。 


MPEG-2制定於1994年,設計目標爲高級工業標準的圖像質量以及更高的傳輸率。這種格式主要應用在DVD/SVCD的製作(壓縮)方面,同時在一些HDTV(高清晰電視廣播)和一些高要求視頻編輯、處理上面也有相當的應用。使用MPEG-2的壓縮算法,可以把一部120分鐘長的電影壓縮到4到8GB的大小。這種視頻格式的文件擴展名括.mpg、.mpe、.mpeg、.m2v及DVD光盤上的.vob文件等。 


MPEG-4制定於1998年,MPEG-4是爲了播放流式媒體的高質量視頻而專門設計的,它可利用很窄的帶度,通過幀重建技術,壓縮和傳輸數據,以求使用最少的數據獲得最佳的圖像質量。目前MPEG-4最有吸引力的地方在於它能夠保存接近於DVD畫質的小體積視頻文件。另外,這種文件格式還包含了以前MPEG壓縮標準所不具備的比特率的可伸縮性、動畫精靈、交互性甚至版權保護等一些特殊功能。這種視頻格式的文件擴展名包括.asf、.mov和DivX AVI等。 


DivX這是由MPEG-4衍生出的另一種視頻編碼(壓縮)標準,也即我們通常所說的DVDrip格式,它採用了MPEG4的壓縮算法同時又綜合了MPEG-4與MP3各方面的技術,說白了就是使用DivX壓縮技術對DVD盤片的視頻圖像進行高質量壓縮,同時用MP3或AC3對音頻進行壓縮,然後再將視頻與音頻合成並加上相應的外掛字幕文件而形成的視頻格式。其畫質直逼DVD並且體積只有DVD的數分之一。這種編碼對機器的要求也不高,所以DivX視頻編碼技術可以說是一種對DVD造成威脅最大的新生視頻壓縮格式,號稱DVD殺手或DVD終結者。 


MOV美國Apple公司開發的一種視頻格式,默認的播放器是蘋果的QuickTimePlayer。具有較高的壓縮比率和較完美的視頻清晰度等特點,但是其最大的特點還是跨平臺性,即不僅能支持MacOS,同樣也能支持Windows系列。 


ASF它的英文全稱爲Advanced Streaming format,它是微軟爲了和現在的Real Player競爭而推出的一種視頻格式,用戶可以直接使用Windows自帶的Windows Media Player對其進行播放。由於它使用了MPEG-4的壓縮算法,所以壓縮率和圖像的質量都很不錯(高壓縮率有利於視頻流的傳輸,但圖像質量肯定會的損失,所以有時候ASF格式的畫面質量不如VCD是正常的)。

 
WMV它的英文全稱爲Windows Media Video,也是微軟推出的一種採用獨立編碼方式並且可以直接在網上實時觀看視頻節目的文件壓縮格式。WMV格式的主要優點包括:本地或網絡回放、可擴充的媒體類型、部件下載、可伸縮的媒體類型、流的優先級化、多語言支持、環境獨立性、豐富的流間關係以及擴展性等。 


RMReal Networks公司所制定的音頻視頻壓縮規範稱爲Real Media,用戶可以使用RealPlayer或RealOne Player對符合RealMedia技術規範的網絡音頻/視頻資源進行實況轉播並且RealMedia可以根據不同的網絡傳輸速率制定出不同的壓縮比率,從而實現在低速率的網絡上進行影像數據實時傳送和播放。這種格式的另一個特點是用戶使用RealPlayer或RealOne Player播放器可以在不下載音頻/視頻內容的條件下實現在線播放。另外,RM作爲目前主流網絡視頻格式,它還可以通過其Real Server服務器將其它格式的視頻轉換成RM視頻並由Real Server服務器負責對外發布和播放。RM和ASF格式可以說各有千秋,通常RM視頻更柔和一些,而ASF視頻則相對清晰一些。 


RMVB這是一種由RM視頻格式升級延伸出的新視頻格式,它的先進之處在於RMVB視頻格式打破了原先RM格式那種平均壓縮採樣的方式,在保證平均壓縮比的基礎上合理利用比特率資源,就是說靜止和動作場面少的畫面場景採用較低的編碼速率,這樣可以留出更多的帶寬空間,而這些帶寬會在出現快速運動的畫面場景時被利用。這樣在保證了靜止畫面質量的前提下,大幅地提高了運動圖像的畫面質量,從而圖像質量和文件大小之間就達到了微妙的平衡。另外,相對於DVDrip格式,RMVB視頻也是有着較明顯的優勢,一部大小爲700MB左右的DVD影片,如果將其轉錄成同樣視聽品質的RMVB格式,其個頭最多也就400MB左右。不僅如此,這種視頻格式還具有內置字幕和無需外掛插件支持等獨特優點。要想播放這種視頻格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解碼器形式進行播放。 


CAM和TScam通常是用數碼攝像機從電影院盜錄。有時會使用小三角架,但大多數時候不可能使用,所以攝像機會抖動。同時由於放攝像機的座位並非總是空的,使得有時拍攝不是水平的。如果後期剪裁很好,這很難看出,除非屏幕下方有字幕。由於聲音是從攝像機自帶的話筒錄製,所以經常會錄到觀衆的笑聲等聲音,尤其是喜劇片。因爲這些因素,圖象和聲音質量通常都很差。但有時很幸運電影院相當空,這樣會錄到好一些的聲音。 telesync (ts):除了使用外置的音源(一般是影院座椅上爲聽力不好的人設的耳機孔),telesysnc(ts) 和cam的標準是相同的。這個直接的音源並不能保證是好的音源,這是它因爲受到很多背景噪音的干擾。很多時候ts是在空的影院錄製,或是用專業攝像機在投影室錄製,所以圖象質量可能比cam好。質量的起伏可能很大,在下載前最好查看sample。以上就是我們常說的“槍版”,並且很大比例的ts是從cam錯誤標記成,現在很少有人使用cam標記,大部分使用攝像機從熒幕上拍攝的影片都標以ts標記,這種版本畫面質量比較差,並且有很大的背景雜音。 


Telecine (TC)使用電視電影機從膠片直接數字拷貝,其圖象和聲音質量應該很好,往往採用ac3聲音編碼,你需要ac3聲音解碼器才能觀看。通常會使用正確的高寬比(2.35:1),但有時也有4:3的tc。這就是被大家經常誤會成dvdrip的膠片版,這種版本往往出現在影片公映一個月左右,畫面效果比ts版好,聲音效果和真正的dvdrip無異,是推薦大家欣賞的版本。但是由於仍使用轉錄的方式,畫面清晰度、畫面髮色數、對比度以及幀數方面都不如dvdrip版。 


PPVRipsPay-Per-View videos ,大意是從付費電視裏翻錄下來的,一般成像爲4:3,清晰度比R5要差一些。    

         以上引用來自國內著名的安全論壇“吾愛破解”,說來慚愧,我在上面混了很多年,沒發過啥有技術含量的文章,倒是把電影看了無數部, 順帶漲了一些關於影音的知識。多媒體技術作爲一門科學不可能三言兩語就能描述清楚,否則人家研究生也就不用花兩三年去讀一個這方面的碩士了,視頻編碼作爲多媒體技術發展的一個核心技術當然也不可能幾句話概括的了,我只願這篇小文能在你做微課與優課時幫到你一點點,那便算作有價值了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章