華爲雲薛浩:走進視頻“新時代”



隨着社會發展,視頻產業的發展也在迅速加快。視頻“新時代”帶來了新的機遇、也有新的挑戰。本次分享我們邀請到了華爲雲的薛浩先生,他向我們分享了華爲雲在面對視頻“新時代”的想法、投入及對產業界的看法。



演講 / 薛浩
整理 / LiveVideoStack
 
大家上午好,我是來自華爲雲的薛浩,在華爲雲負責視頻、會議以及IoT等相關產品。今天非常高興有機會和大家分享華爲雲在視頻領域的一些想法、投入及對產業界的看法。

1

  這是一個“視頻優先”的時代

首先,表達一個觀點,我們認爲未來的世界會進入一個“視頻優先”的時代。


1.1. 視頻成爲現代社會的基礎服務

我們看到這些年視頻整體業務發生了變化——從單純的娛樂視頻逐漸向工業視頻發展,影響着人們的工作、生活等方方面面,目前全球大概有3億人通過視頻會議進行辦公協作。這種情況是如何產生的?實際上從人類的生物學結構上來說,人類對視頻信息更敏感,科學研究表明,人類83%的信息輸入是靠視覺進行觸發和感知的,視頻留下的印象和輸入衝擊會更大。同時,大腦處理視覺信息的速度比文字信息快60000多倍,這也從另一個層面驗證爲什麼大家對視頻有更多的依賴。也正是因爲這些特點,視頻現在逐漸變成了一個基礎服務。


2020年,視頻在IDC數據中心的流量佔比已經達到了73%,預計在2025年將達到95%以上。從中國及華爲雲的情況來看,大概有80%以上的網絡流量承載着視頻,同時存儲中50%以上是視頻的結構化數據。這意味着人類社會對視頻的認知已經從增值創新服務逐漸變成基礎服務。


我認爲做視頻的人不會有35歲現象或45歲現象那種職業焦慮,因爲它是終生的行業和事業。引用互聯網“點、線、面、體”說法,視頻行業是一個大船在前進,所以我覺得非常榮幸,能夠和在座各位從事視頻相關行業的夥伴一起向未來航行。


1.2.  視頻正在改變我們的世界



  • 視頻在改變我們的生活。我相信大家手機上都安裝了不止一個視頻app,很多人1/3的閒暇時間都是在消費視頻中度過的,未來也許還會投入到VR社交、AR社交等等。

  • 視頻在改變我們的工作。我想在座的各位每天平均要參加一到兩場視頻會議,我可能每天參加三到四場,以前的本地會議慢慢向遠程共享協作方面進行提升,改進工作效率。

  • 視頻也在改變行業。以前是人消費視頻,現在是機器消費視頻。現在所有的監控、攝像頭都說明視頻正在改變行業,視頻賦予了人們感受萬物的能力,我相信視頻這個空間是足夠大的。



今天我們看到有這麼大這麼廣闊的空間,那我們自己又處於一個怎樣的位置?

實際上,對於從業者來說,我們站在了時代的臨界點——創新逐步地加快:從過去的2D到3D、從1080P到2K再到4K,人類對體驗感知的訴求在逐步加快、迭代速度在加快——以前十年一代的技術,現在可能三年一代。


另一個是視頻從標清走向高清,從單向走向雙向。由儉入奢易,由奢入儉難,當人們已經做到更好的視頻體驗時,就很難再次回到過去。舉個例子:使用過85寸電視機之後,就很難再接受35寸的電視機。現在要思考的是,當前行業整個技術體系是否適應未來大家對視頻業務的需求?對視頻業務投入的創新和動力是否足夠支撐行業的快速迭代?這個產業未來會發展到哪些方向?這也是華爲面臨視頻業務問題時所思考的。


1.3.  視頻是一個長價值鏈業務



第二個變化點是,以前的視頻都是單點技術的創新,現在所做的新領域會有一些明確的創新焦點。而行情所示,視頻的產業鏈非常長——從基礎的理論研究、到標準和專利、再到芯片、到工業化的應用。在工業化應用過程中,從生產、製作、傳輸、分發再到最後的消費,產業鏈非常長,例如RTC、VR、AR這樣的技術,光單點的技術創新是很難完成真正的商用。同樣視頻產業也如此,產業鏈越長,產業的組合度、準備度也就越高。人們今天看到的每一個視頻場景,新產業的推出都需要各個行業的緊密配合以及整個產業鏈互相的匹配。


1.4.  端-邊-雲協同時代,突破時延極限



未來如AR、VR這種體驗的需求呈現着創新快、質量高、密度大的特點,所以我們在做技術創新時從以前專門在雲上或者專門在端側變成了“端、邊、雲”的技術創新。


以VR爲例,它涉及到許多基礎研究的科學:計算機圖形領域、語音識別、人工智能、建模壓縮傳輸等。現在視頻的場景越來越多樣化,智能終端也越來越強,所以做業務時要綜合考慮算力分佈、消費端分佈、如何做好質量成本以及延時和體驗的平衡。我認爲需要產業鏈打破行業技術的天花板才能夠發揮全鏈條的整體優勢、突破單點限制。


華爲本身有基礎研究、硬件、操作系統、傳輸、雲的技術優勢,所以對華爲來說使命是如何提升行業天花板。我們嘗試在5G網絡下,做到業界最極致的時延。目前行業內大家能普遍實現的時延在200ms左右,基本達到了極限,但是200ms可以做視頻會議,卻很難做遠程和聲演唱,也很難做VR、AR直播和互動。那麼如何把行業“端到端”的延遲做到極致?


舉一個例子,上圖是華爲聯合上海交通大學和中國移動做的技術實踐,環境是在上海交通大學5G網絡覆蓋條件下,通過華爲雲的邊緣及雲上,再到華爲企業內網的5G媒體實驗室,端到端用1080P/30幀爲例,嘗試如何優化時延。


實際上我們做了幾個協同點:第一個協同點是從終端的感知和編解碼出發,使用的是華爲終端(P系及Mate系手機——這個手機因爲華爲的鴻蒙生態、能力及硬件,做了許多優化)。在圖像的採集成像和編碼封裝上基本縮短了一半延遲。大家都知道華爲的應用在公有云上而不在運營商的網絡裏,所以從運營商網絡、核心網再到公網上有很多跳,中間可能還有防火牆。我們在網絡空口和媒體傳輸這個階段,尤其是針對媒體傳輸做了很多優化,加了一些私有協議或者標籤讓它識別爲媒體屬性的流,針對媒體屬性的流做優化可以降低非常大的延遲,同時還有一些下行如WI-FI、5G,我們多路徑地分到下行後再拼裝。


最後是在端側處理時,一些AI的插幀、分幀等。我們看到通過“雲、管、端、芯、媒”的互感聯動,其實可以把“端到端”的延遲做到100ms以下,極限時可以做到60ms。


昨天和虎牙同學交流時,我也提到希望業界的應用玩家們能夠參與進來。一方面是商業,另一方面投入科技前沿的創新。是否可以快一點將未來的技術商品化,把產業鏈的準備度增加一些,希望通過和業界合作從而找到更好的解決行業痛點的方法。

2

  產業鏈現狀:一邊向左、一邊向右

前面介紹了產業鏈的現狀,接下來再講一講華爲在中國市場看到的產業問題。看一看中國產業鏈是否準備好面向未來視頻業務演進。

2.1.  中國視頻消費內容極其繁榮



我們先看一組數據(上圖),毫無疑問,中國是視頻消費大國。縱觀全球視頻類app下載數量,中國佔據50%以上,榜首是字節跳動的抖音和TikTok,Top10的應用中中國佔到50%,同時按照觀影人數和次數統計,中國也是世界電影市場票房的第二大市場,觀影人數已經超過18億人次。


在全球的網絡流量中,中國的網絡流量佔20%,其中有80%是視頻流量。對比歐美國家,可以看到中國從21點開始網絡流量急劇升高、直到凌晨1點,中國的娛樂視頻是豐富多彩的。


2.2.  中國有差距、提升快



與之相匹配的,下面和大家介紹中國在基礎研究投入的狀態。

做視頻最基礎的是編解碼,這個領域其實是應用範圍最廣的,剛纔宋利老師講了很多標準的情況及發展演進。整體來看,主流標準長期被國外壟斷,比如MPEG、H.26x系列,中國的話語權很弱。在過去,每做一個MPEG設備,要支付很多錢,就像今天我們做手機要給高通交“高通稅”一樣,中國每年都要支出百億級專利許可費。但也有一個非常好的現象,最近五年中國廠商進步很快,特別是華爲、字節跳動、聯發科、騰訊、阿里巴巴和快手做出了表率,尤其是發佈了中國的AVS編碼,這其實和以前的WC、CGM一樣,中國一定要有話語權,在這個過程中,中國企業要積極參與。我希望無論是大廠同事或是初創公司同事都能夠關注並且支持中國自己的標準和應用。


2.3.  圖形處理專利多卻不強



在GPU圖像處理領域,實際上真正的基礎專利在日、美、韓三國。雖然中國的GPU專利多,但是不強,尤其是四方認可的基礎專利只有14項,排名第七。在基礎專利上,中國主要是科研機構在參與,企業參與感很低,表單TOP20中都沒有中國企業。


2.4.  計算機視覺領域,研究與技術應用脫節



計算機視覺領域可以被分成很多類,比如生物合成視頻、視頻感知、運動追蹤等。之前可能講了許多應用場景,從應用場景到基礎實踐、專利,國內都處於脫節缺失的狀態。目前從申請專利來看,掌握話語權的是美國企業,中國有些科研院所發表的專利主要聚焦在生物特徵識別,可能與安防監控行業發展較好有關。但像一些其他的基礎研究方面,我們還是以應用爲主。


2.5.  視頻製作生產領域,效率低下、基礎工具受限



接下來是視頻內容製作領域。前段時間,我參觀了廣電媒資行業,傳統的省電視臺,內心深受震撼,很多電視臺在傳統媒資製作和內容生產領域基本是美國標準、日本設備,廣電媒資行業很多企業都被綁架,將美國的軟件加日本的硬件設備做成一體機,這既沒有做到技術創新、也沒辦法向未來演進。廣電行業是未來視頻發展一個非常重要的領域,我們不能只關注互聯網視頻,要看到在影視製作領域也有非常大的空間。影視製作中有許多行業痛點和問題,比如內容的上傳分發。現在很多是上傳之後使用硬盤人工方式去做,我相信有一天,內容製作和生產可以用在雲上,方便所有後續視頻分發和消費。這也是視頻製作領域的一個問題,基礎工具幾乎爲零。


2.6.  虛擬現實技術領域,美日歐已領先佈局



下一部分是大家很關注的VR、AR部分,大家都認爲這是未來業務的高地,華爲也有許多VR、AR的應用,包括展臺展示了華爲雲帶來的虛擬數字人。但是如果從AR、VR向下看基礎專利、投入工具,可以看到它們涉及到了方方面面,如光學工程、語音成像工程、人工智能、3D等等,這裏有非常大的差異。從上圖表格中,我們看到專利申請數量的TOP20中只有一個是中國機構- 一所高校,它正在做仿真模擬,與消費級應用不太一樣。我們發現從基礎專利到企業應用的過程非常漫長,前面說到Facebook投入非常大精力去做,但國內沒有企業投資在基礎研究上,在此我也呼籲各位,如果你是主管請告訴老闆投入基礎研究,如果是開發者請做你認爲對的事情,這是在虛擬現實技術領域的情況。


2.7.  路在腳下 —— 改變行業,從你我做起



綜合以上現象,首先中國是當之無愧的視頻業務大國,前途是光明的,視頻應用或內容消費極其繁榮,可能多於美國和歐洲。但同時,視頻基礎技術很薄弱,所有的應用幾乎在做同質化競爭。基礎專利的不足是漫長的過程,中國的產業話語權非常少,容易被國外標準所左右,所以面向未來的創新是不足的。


如何做未來的投入和創新?華爲探索了很長時間,有幾個方面可以跟大家分享。

  • 第一,作爲視頻行業從業者、技術愛好者和關鍵力量,需要共同改變現狀,讓公司改變的前提是開發者的改變,所以改變行業,從你我做起。

  • 第二,加大基礎技術創新。除了做應用外,還要做基礎技術投入,尤其是行業基礎技術投入,前面也看到了行業的應用,在基礎的,尤其和自己公司相關的基礎技術專利,大家需要多投入一些.

  • 第三是在某些發展成熟的行業中,中國的技術實力存在一定差距,並且很難獲得顯著的突破,就像中國爲什麼不投入做燃油車而做電動車一樣,燃油車專利及整個產業鏈已經被日本、德國所壟斷。同樣在做視頻產業時,前面講到廣電媒資行業基本是美國專利、日本設備,所以我們要做創新,選擇的賽道應該是在雲上的技術創新和基於雲原生服務的創新。

  • 第四是要做好產業生態,要與學術界、高校及研究院所建立合作,將企業遇到的關鍵技術問題和高校共同進行突破,實際上這不只是華爲,其他許多大企業也在做。


3

  面對視頻行業,華爲在做些什麼

前面介紹了對行業的認知和看法,現在分享華爲是如何做的。


從1995年開始,華爲就投入ICT基礎設施和視頻相關行業,最初與廣電做IPTV,做一些技術的編解碼;2012年,在中國成立了媒體研究院及實驗室,有許多人物都是從這個實驗室走出來的,這就是行業的進步和發展。華爲的業務發展也很廣,比如終端上的攝像技術、雲原生技術,華爲投入的團隊和資源很大,在這個過程中有許多合作伙伴和開發者與我們一起。


3.1.  專注視頻基礎技術、戰略投入


面對視頻行業,基礎技術創新階段應該如何投入?


華爲的視頻技術佈局實際上是“四橫八縱”:“四橫”是硬件、網絡、計算/存儲和AI,“八縱”是從採集、生產、音頻、編解碼、到傳輸,這也是重點技術單點領域,它們是縱橫交錯的。從1995年到現在,華爲在基礎音視頻技術的投入超過100億,尤其現在是視頻產業的高速發展期,創新焦點很多,華爲每年在視頻創新投入的基礎研究超過20億美金,所以視頻的技術研究和應用開發需要耗費大量資源。


3.2.  主動擁抱雲,構建雲原生的視頻世界



從未來開發趨勢角度以及行業化角度,現在的創新焦點基本是聚焦於雲上,而且是原生於雲。 因爲雲上技術創新迭代很快,現在在雲上做技術創新和應用有幾個特點:第一,原生的視頻是Born in cloud,不用考慮怎麼上雲、可靠性等問題,因爲它是原生於雲的視頻。第二,Grow with cloud,大家知道雲的迭代發展速度是非常快的,雲用DevOps的開發方式,我們的視頻應用技術也是這樣迭代的。第三,Benefit from cloud,雲有許多比較好的特性,比如隨時隨地、彈性收縮、成本控制、業務指標的保證,這些都可以天然的爲視頻所利用。所以在雲上做業務的創新和應用會有非常好的收益。


3.3.  面向未來,主動佈局,持續創新



最後一點是面向未來。 前面講到了很多技術創新,其實VR、AR基本形成了共識,這兩個技術領域的基礎技術研究上有許多斷點,比如3D建模、光柵、渲染全視角6Dof,華爲也做了很多技術創新。

華爲一貫將技術創新轉化爲商業,如自由視角、VR、河圖AR等等。我們發現技術領域從最開始的實驗室驗證走向商業,這部分的進展比想象中更快。當然,在和產業鏈合作的同時,政府主導的力量很關鍵,尤其在最開始的技術引進孵化階段,這是高強度的投入,單從企業方面來說,商業化方式是不良好的,和政府合作可以幫助企業走過技術獵捕期。華爲在馬欄山視頻文創園和江西VR中心也做了產業園,歡迎各位開發者入駐。


最後,在VR、AR領域,發展剛剛起步,企業要吸取過去的經驗,無論成功或是失敗。我們要建立自己的產業聯盟和標準組織,如OpenXR、中國虛擬顯示聯盟等,提前做好業務佈局。

3.4.  積極參與國級/國內標準聯盟活動、貢獻力量



接下來是標準和制定。中國開發者非常關注標準,並且發現標準制定不好時會自己編改,但是我認爲將編改後的標準創新回饋給社區形成良好循環是非常重要的,我們呼籲大家更加關注標準和產業聯盟的創建,歡迎大家加入華爲在國內的標準和產業聯盟。


截止2020年,據統計華爲在全球的視頻相關標準專利貢獻約2.4萬件,其中9000多件在國內,10000多件在海外,我們也希望與大家一起構建技術專業的交流,這也是未來技術交換的籌碼。

3.5.  培養視頻產業人才



最後是人才,人才是視頻業務的關鍵,要從基礎抓起。視頻從業者只有20萬人,沒法支撐未來的發展。從行業內部感知來看,視頻人才是最難獲得的,大家都是招收人才、卻沒人培養人才。再看視頻的技術點,從光器件與Sensor、計算機視覺、計算機圖形學、計算機攝像學,高校和大廠在做培養人才的過程中都只是要會寫代碼的人,而實際上這和產業的要求差異很大,所以我們希望在基礎科學研究、基礎技術、技術創新方面可以和高校合作,與高校課程達成共創和研究。就此,華爲針對性同部分高校做研究,比如浙江大學、北京大學、清華大學等,也和行業的人才做基礎研究。希望大廠做基礎技術研究時可以考慮和高校合作,共同探討基礎技術領域,也希望各位工作之餘多培養人才,將視頻產業鏈規模做得更大,行業更加繁榮。


那麼今天相聚在這裏,相信大家都是熱愛技術,相信產業發展,心懷夢想的人。我們相信現在的投入一定會在未來取得收益,未來5年、10年的視頻行業一定相較於今天更有發展。希望與大家一起創新、推動產業發展,激發行業的新生,一路向前走向奔騰的時代。

4

  華爲雲原生視頻服務 — 重構體驗,加速創新


最後,也希望和大家分享華爲雲視頻服務做的事情,華爲雲原生視頻服務是基於華爲基礎ICT的創新,將過去30年的基礎領域積累作爲雲服務開放給大家,支持全行業、全場景、全雲化,歡迎大家訪問官網,獲取最新資訊信息,也歡迎大家變成華爲雲的開發者,共同推進行業的發展。謝謝大家!

本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章