音視頻技術開發週刊 | 226

每週一期,縱覽音視頻技術領域的乾貨。

新聞投稿:[email protected]



從體驗出發構建以增長爲目標的視頻服務體系
增長一直是業務的訴求,和增長相關的因素很多,內容、人羣、創意玩法、性能體驗等等,本次LiveVideoStackCon 2021 音視頻技術大會 北京站 我們邀請到了火山引擎點播技術研發負責人——浩銘老師。本次分享聚焦在字節跳動視頻通過性能體驗優化促進業務增長的實踐。包括在分析方法上的探討,如何衡量和預估體驗優化對業務增長的貢獻,以及具體的體驗優化實踐分享。


互動雲渲染——雲原生渲染的初步探索
隨着遊戲及軟件雲端化運行能力的支持,大型遊戲和軟件可以在瀏覽器、輕客戶端以及小程序中運行,在擴展了使用場景邊界的同時,也爲遊戲和軟件探索雲原生實現提供了基礎。騰訊云云渲染 PaaS 提供了基於 WebRTC 的萬人級互動交互的雲原生能力,包括操作權限轉移管理、多人語音會話等,在本次LiveVideoStackCon 2021北京站,騰訊雲專家工程師 雲渲染技術負責人——王超向我們分享了互動新玩法上的技術實現。



基於 SVT-AV1 的高效視頻點播應用解決方案
本次演講介紹了 SVT-AV1 編碼器針對 VOD 的高延遲恆定比特率編碼(CRF)編碼和可變比特率(VBR)編碼的最新改進。在對比實驗部分,進行了 SVT-AV1 與其他開源編碼器的複雜度與壓縮性能對比,SVT-AV1 新增的 VBR 模式 與 CRF 模式的性能對比, 以及 SVT-AV1 fast encoding 對比這 3 個對比實驗。


視頻通信中的碼率控制算法
碼率控制技術RC(Rate Control)是視頻編碼中一個非常重要的技術模塊。不同的應用場景對視頻編碼的碼率控制有不同的需求,離線編碼通常採用可變碼率(VBR),實時視頻系統通常採用恆定碼率(CBR)。本篇技術乾貨將深度剖析視頻編碼中的碼率控制算法,分析其背後的數學模型及理論,希望能幫助大家更好地理解視頻通信中的碼率控制算法。




聊聊QUIC協議的發展
QUIC(Quick UDP Internet Connections,快速UDP互聯網連接)是一種新的“更快”的通用網絡傳輸協議。相比於TCP和TLS,QUIC提供了許多改進來提升網絡傳輸的性能。隨着QUIC協議的標準化,QUIC之上的HTTP/3協議已經被衆多瀏覽器所支持,其中包括Chrome、Microsoft Edge(Chrome內核版本)、Firefox和Safari,除了瀏覽器,也有不少客戶端App也開始支持和使用HTTP/3。本篇文章就和大家一起聊聊QUIC協議的發展歷程,和我認爲的QUIC未來發展趨勢。



騰訊視頻雲直播推流再升級,支持多路徑傳輸
騰訊雲音視頻雲直播推出的多鏈路傳輸方案,通過多個鏈路層同時傳輸,提高整體端到端的傳輸可靠性和質量,進一步提升上行推流和最終的播放端體驗。


DirectX 12 發佈新功能——視頻編解碼
如今,DirectX 12 提供 API 以支持多個視頻應用程序的 GPU 加速,例如Direct3D 12 視頻概述 中詳述的視頻解碼、視頻處理和運動估計。我們很高興地宣佈,D3D12 爲現有的視頻 API 系列添加了新的視頻編碼功能,並帶有一組新的接口,允許開發人員使用 GPU 加速視頻引擎執行視頻編碼。此功能爲應用程序提供了一種新的方式來實現符合 DirectX 12 原則和風格的視頻編碼。
https://devblogs.microsoft.com/directx/announcing-new-directx-12-feature-video-encoding/

Spin Digital發佈新SDK,支持多功能視頻編碼(VVC)和增強型HEVC直播
Spin Digital 宣佈推出新版本的 Media SDK ( Spin SDK v4.0 )。此版本包括新功能和增強功能,例如超高分辨率視頻的 VVC/H.266 解碼,包括 8K、實時應用程序的 HEVC 播放、未壓縮播放、自定義分辨率的 SDI 捕獲、HEVC 實時編碼器的質量優化和完整的支持日本 8K 廣播標準 (ARIB STD-B32)。Spin SDK 包含一組用於視頻和音頻捕獲、編碼、流媒體、處理和播放的優化庫,有助於創建廣播、沉浸式媒體和大屏幕可視化領域的尖端媒體應用程序。
https://spin-digital.com/announcements/spin-sdk-v4-0/

視頻超分技術實踐與應用
視頻超分是通過深度學習技術,針對視頻畫面和場景進行分析,結合視頻降噪、去模糊、銳化、去抖動等畫質增強等處理,爲視頻場景帶來更好的畫質觀看體驗,同時有效的降低視頻的製作和傳輸成本。基於在視頻編解碼技術、算法、彙編優化等方面的技術積累,京東雲視頻雲近期正式推出移動端超分SDK產品,包括Android和IOS等主流端,並實際應用在京東商城APP中,經過長期數據迭代和數據監測的驗證,開啓超分後用戶平均播放時長提升80%,同時流量帶寬成本降低30%,有效提升了用戶體驗和GMV轉化。


流媒體播放的數學原理
當我們拋開繁雜的業務代碼,從純數學的角度去理解流媒體傳輸\播放的過程,會有全新的體會。首先,無論是傳統的漸進式下載(progressive download)還是現在流行的自適應傳輸(adaptive streaming),我們認爲二者都是基於塊(chunk)的下載模式。


微信圖片翻譯技術優化之路
微信(WeChat)作爲 12 億+用戶交流的平臺,覆蓋全球各個地區、不同語言的用戶,而微信翻譯作爲橋樑爲用戶間的跨語言信息交流提供了便利。目前微信翻譯每天爲千萬用戶提供數億次的翻譯服務,且團隊技術持續鑽研,累計發表數十篇頂會論文、奪得多項 WMT 冠軍。隨着翻譯質量的提升,微信翻譯的應用形態從文本逐步擴展到圖片、語音、網頁、文檔、視頻等衆多場景。本文以微信圖片翻譯爲例介紹近一年的技術優化。




視覺攝像頭vs激光雷達,高階自動駕駛的路線將傾向哪邊?
本文希望從技術角度客觀分析和回答以下問題:自動駕駛等級提升需要解決什麼關鍵問題?怎樣的自動駕駛方案更加具有實現大規模無人駕駛的可能性?自動駕駛作爲現實世界的AI問題,難點在哪裏?以上問題促使我們理性客觀地思考該如何去實現自動駕駛——這一承載了太多期望、不斷挑撥大衆神經的技術生產力變革,從而推動行業冷靜且務實地向前發展。




閱讀推薦



什麼是CDN?
CDN(Content Delivery Networks,內容分發網絡)是分佈在世界各地的服務器,它們是視頻直播和點播中至關重要的基礎設施。CDN位於視頻播放器和源服務器之間,負責跨地理區域分發視頻內容,並有效保障客戶端流暢的觀看體驗。在本文中,我們將學習CDN是如何工作的,如果不使用CDN會發生什麼,並瞭解什麼是Cache-Hit和Cache-Miss。讓我們開始吧!



活動推薦


【城市沙龍】LiveVideoStack Meet | 南京:

互聯網沙漠的音視頻發展



2021年LiveVideoStack Meet已成功在北京、蘇州、杭州、成都、西安、合肥與上海落地。這一路我們分享對於行業內卷的看法,探討技術發展方向,也瞭解到更多二線城市的音視頻環境。2022年第一站,將於1月8日南京與大家見面,本次分享內容涵蓋人工智能、實時音視頻、直播全鏈路監控、雲遊戲實踐等多方面,快來現場與嘉賓面對面交流吧。


活動時間:2022.01.08 14:00-16:00

活動地點:南京市雨花臺區鳳信路6號 南京金證科技園3棟1樓路演廳


報名地址:

https://8392623630544.huodongxing.com/event/5628086056100





即刻了解:

https://campaign.tencent.com/audiovideo/?c=30Kjpxdi




插圖源自Pexels


本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章