DCC2020：VVC幀間預測中的幾何劃分

原創

2021-01-30 09:16

本文來自DCC2020論文《Advanced Geometric-based Inter Prediction for Versatile Video Coding》

幾何劃分相較於三角劃分，能更好的貼合物體輪廓。

相關工作

VVC中的三角劃分TPM

三角劃分TPM是VVC幀間預測工具，通過主對角線或副對角線將塊劃分爲兩個三角區域，每個區域使用單向幀間預測分別只需要一個運動矢量，MV是需要傳輸其在merge list裏的索引。兩個MV都是通過運動補償得到，會產生兩個w x h的中間預測塊Pi，最終的預測塊P_B通過將兩個塊加權得到。

其中W0+W1=8,且都是整數權重。權重由像素值到分割線的曼哈頓距離決定，例如W0=clip(0,8, w_TMP0+4)。w_TMP0是距離，對於左上角到右下角的三角劃分，距離可由下式求得，

a，b是常數因子，由塊的寬高比決定。

AV1這的楔形預測

AV1定義了16種楔形劃分方式，楔形要麼是水平垂直，要麼是±2，±0.5（取決於形狀）。和TPM類似，最終也需要對兩個預測塊進行加權。

基於幾何劃分的幀間預測GIP

GIP（Geometric-based Inter Prediction）是對TPM的補充，它可以更好的適應物體的形狀，它們的MV的merge方法和編碼方法也都相同。GIP共支持82種劃分，只支持不小於8x8的塊。編碼端需要決定塊使用的GIP索引Si∈{0...81}，並通過截斷二元編碼傳到解碼端。GIP定義的邊界能更好的貼合物體輪廓，從而提高編碼效率。

分割邊界定義

分割邊界在極座標系中定義，需要兩個參數角度ϕ和偏移值ρ 確定。像素(x_c,y_c)到邊界的距離由下式計算（座標原點爲塊中心），

注：我推導的距離公式和論文中給出的不一致，通過查閱作者在TSCVT2020中的文章《Geometric Partitioning Mode in Versatile Video Coding: Algorithm Review and Analysis》找到對應公式，TCSVT中的公式和我推導一致，公式如下：

其中ϕ和ρ是定義分割邊界的參數，定義如下：

邊界參數量化

邊界參數ϕ和ρ需要量化處理，從而使82種劃分方式能對空間進行均勻劃分。

參數ϕ需要量化到預定義的ϕj,j∈{0...23}。ϕj對2π進行不均勻劃分使得tan(ϕj)保持固定，tan(ϕj)∈ { 0, ±1/4, ±1/2, ±1, ±2, ±4, ∞}。

參數ρ需要量化到預定義的ρk,k∈{0...3}。爲了避免對於不同尺寸塊的分界線分佈不均勻，ρk按下面方式求得，

其中j<12時ρx,k 和ρy,k取負值，否則取正值。

上圖是GIP部分劃分方式。GIP總共有NGIP = NϕNρ−Nϕ/2−2 = 82種劃分方式，Nϕ=24，Nρ=4，其中對稱的水平和垂直劃分由於和二叉樹劃分結果一樣所以去掉了。

GIP加權

對於幾何劃分後的兩個預測塊要進行加權生成最終預測塊，權重和像素到分割邊界的距離有關。

其中f_B函數如下圖所示，

下面是一個加權示例，

實驗結果

下表分別是RA和LD配置下的實驗結果，

下圖是RA配置下不同QP下使用TPM和GIP的像素的百分比。

感興趣的請關注微信公衆號Video Coding

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

RALB負載均衡算法的應用 | 京東雲技術團隊

一、背景搜索推薦算法架構爲京東集團所有的搜索推薦業務提供服務，實時返回處理結果給上游。部門各子系統已經實現了基於CPU的自適應限流，但是Client端對Server端的調用依然是RR輪詢的方式，沒有考慮下游機器性能差異的情況，無法最大化利

2023-06-09 11:50:40

帶老婆學習--進制

進制就是逢多少進位，人類常用的是十進制，就是逢十進一二進制計算機底層用的是二進制，只用“0，1“ 2個字符來表示，示例： 10進制的10用二進制來表示就是1010。在代碼中一般用0b開頭八進制用”0，1，2，3，4，5，6，7“ 8

2023-03-05 12:49:49

PaddleX訓練

添加數據集創建項目數據集配置訓練時可視化模型評估與測試發佈模型

2022-04-30 06:22:43

阿里P8面試題：Kafka如何做到發送端和接收端的順序一致性？

今天這篇文章，寫一個面試題的詳解。最近半個月在弄部門明年預算，弄的頭大。終於弄的差不多了，這幾天趕緊抽空學習充電。爲了帶着問題去學習，我特意找一個大廠朋友要了一份他們的面試題，公司名不說了，難度大概相當於 P8。面試題裏有這麼一道題：

2021-12-27 09:20:12

深入 HTTP/3（一）｜從 QUIC 鏈接的建立與關閉看協議的演進

文｜曾柯（花名：毅絲 ) 螞蟻集團高級工程師負責螞蟻集團的接入層建設工作主要方向爲高性能安全網絡協議的設計及優化本文 10279 字閱讀 18 分鐘 PART. 1 引言作爲系列文章的第一篇，引言部分就先稍微繁瑣一點，讓大家對這

2021-12-25 21:46:42

一起玩轉樹莓派（23）——DHT11溫溼度傳感器實踐

一起玩轉樹莓派（23）——DHT11溫溼度傳感器實踐一. 引言 DHT11是一款強大的複合傳感器，支持環境溫度和溼度的測量。其本身比較簡單，但是由於其採用串行時序的方式進行數據讀寫，非常適合我們練習時序編程。本次實驗我們使用的傳感器模塊如

2021-12-25 21:37:57

ProRes Codec、淺壓縮與產品經理

LiveVideoStackCon 2023上海正在招募講師對於蘋果或者攝影與後期重度用戶應該瞭解ProRes吧，這是一種蘋果私有的視頻編解碼標準，其提供卓越的圖像質量與可觀的壓縮比，支持實時編輯應用，因此主要用於高質量的視頻後期處理等

2023-05-09 11:39:02

音視頻技術開發週刊 | 226

每週一期，縱覽音視頻技術領域的乾貨。新聞投稿：[email protected]。從體驗出發構建以增長爲目標的視頻服務體系增長一直是業務的訴求，和增長相關的因素很多，內容、人羣、創意玩

2021-12-27 21:09:13

全項指標第一，騰訊V265與新一代VAV1自研編碼器登頂MSU視頻編碼器大賽

基於對編碼技術的持續深耕和創新突破，騰訊雲在MSU視頻編碼器大賽中拿下兩個重量級冠軍。 10月30日，莫斯科國立大學（Moscow State University）舉辦的2021年視頻編碼器大賽放榜，H.265和AV1這兩個賽道的結果被業

2021-12-25 21:31:57

字節跳動雙11電商直播技術大揭祕

點擊上方“LiveVideoStack”關注我們近幾年來，電商直播已經成爲了雙11促銷活動中的重要形式。作爲國內電商直播中的佼佼者，雙11剛過，抖音便公佈了“抖音雙11好物節數據報告”

2021-12-25 21:08:39

水下圖像質量評價與畫質增強研究

編者按海洋麪積佔據地球總面積的大部分，而且海洋世界蘊藏着豐富的資源，圍繞水下成像的相關研究和應用越來越重要。但是，收到水下光照散射

2024-02-06 00:14:09

關於遠程直接內存訪問技術 RDMA 的高性能架構設計介紹

編者按：傳統以太網方案存在系統調用消耗大量時間、增加數據傳輸延時、對 CPU 造成很重的負擔三個缺點，而 RDMA 技術可以解決以上三個缺點。那 RDMA 究竟是什麼？它的方案的設計思路是什麼？今天，浪潮信息驅動工程師劉偉帶大家深入理解 R

2023-08-01 00:21:05

細粒度視覺質量評價：回顧和思考

編者按：面向人眼感知的質量評價在許多視頻圖像處理算法和系統中發揮十分重要的作用。近年來學術界已經提出了許多質量評價方法，在已有數據集上取得了很高的性能，但是他們在實際應用中的表現仍然無法讓用戶滿意，以至於無法得到廣泛應用。LiveVideo

2023-01-04 23:26:12

網易雲信 NERTC 高清畫質體驗之 H.265的工程實踐 | 體驗共享技術專題

導讀：H.265是 ITU-T VCEG 繼 H.264之後制定的新一代視頻編碼標準，相比於 H.264，H.265能夠進一步提高壓縮效率，提升畫質，在當前的很多音視頻場景中，得到了越來越廣泛的應用，我們在網易雲信 NERTC 中對 H.2

2021-10-13 21:12:55

如何轉換列表<Integer>到 Java 中的 int[]？ [複製] - How to convert List<Integer> to int[] in Java? [duplicate]

問題： This question already has answers here : 這個問題在這裏已經有了答案： How to convert an ArrayList containing Integers to

2021-09-30 21:24:08

24小時熱門文章

最新文章

最新評論文章