DCC2020：色度分量子像素跨分支预测

原創

osc_rfe6nv2l

2021-01-30 10:05

本文来自DCC2020论文《Sub-sampled Cross-Component Prediction For Chroma Component Coding》

跨分支预测可以去除不同颜色分量间的冗余，最初在HEVC中就提出过CCLM来实现跨分支预测。

CCLM

CCLM（Cross-component linear prediction mode）使用一个线性模型来通过亮度来预测色度。该线性模型使用最小二乘法（ least square regression，LSR）利用邻域参考像素生成。

对于2Nx2N的亮度CB，其对应色度CB为NxN（4：2：0格式），若对色度CB使用CCLM则对应预测值通过下式获得，

Predc是色度预测值，RecL是对应亮度块重建值的降采样结果。alpha和beta是模型参数，利用邻域亮度和色度重建值通过LSR方法计算得到，

M是邻域像素数，RecC和RecL分别是色度块参考像素和亮度块降采样的参考像素，如Fig.1(a)所示。注意，为了降低复杂度除法操作通过乘法实现。上面计算共需要2M+4次乘法，7M+3次加法，除法2次。

通常来说乘法操作所需的时钟周期数高于加法操作和比较操作。为了减少乘法操作次数，VTM4.0使用max-min method替代LSR来求alpha和beta。它通过亮度最大和最小的两个点直接生成一条直线，如Fig.1(b)所示。alpha和beta通过下式求得，

xA和xB分别代表降采样亮度块最小和最大的亮度值，yA和yB是它们对应的色度值。在该方法中乘法操作变成搜索最大值和最小值的操作（比较操作）。

子像素跨分支预测和实现

子像素跨分支预测

在生成CCLM参数过程中包含了大量比较操作，这对应硬件和软件设计很不友好，尤其对于解码端不友好。因此，本文提出子像素方法生成模型参数，只需要利用四个邻域色度像素和对应的降采样亮度像素，如Fig.2(a)所示。

在该方法中，亮度块仅需对指定位置进行降采样操作，极大提高了内存访问效率。同时，比较次数也降为4次，获取两个较小的亮度值：xA0和xA1，获取两个较大的亮度值：xB0和xB1。对应的色度值分别是yA0,yA1,yB0,yB1。通过下式求得xA,xB,yA,yB，

然后通过max-min method可求得alpha和beta。此外，当上方或左侧参考像素不存在时，默认alpha=0,beta=1<<(bitDepth-1)。

VVC中实现细节

除了CCLM，VVC中还使用LM-Above和LM-Left模型来更好的进行分支预测。LM-Above仅使用上方像素，LM-Left仅使用左侧像素生成模型参数，CCLM既要使用上方也要使用左侧像素。

为了简化操作，本文提出的子像素模型适配所有LM模型。4个子像素由块尺寸、LM模式和邻域像素决定，假设当前色度CB尺寸为WxH，则根据下式求W'，H'，

上方邻域像素范围可表示为S[0,-1]到S[W'-1,-1]，左侧邻域像素范围可表示为S[-1,0]到S[-1,H'-1]。根据下面方法选择4个子像素，

如果使用CCLM模式，且上方和左侧邻域像素都可用，
如果使用LM-Above模式，或仅上方邻域像素可用，

如果使用LM-Left模式，或仅左侧邻域像素可用，

对于32x32的色度块，且上方和左侧邻域像素都可用时，该方法复杂度减少如下表所示，

AVS3中实现细节

AVS3帧内预测有5种色度预测模式，包括derived mode(DM), horizontal mode, vertical mode, DC mode 和bi-linear mode。基于子像素跨分支预测，本文提出Two-Step Cross-component Prediction Mode (TSCPM)。TSCPM和CCLM有些区别，线性模型可直接应用于重建的亮度像素，生成相同大小的临时色度预测块。随后，进行下采样，得到最终的色度预测块。

首先计算色度块的宽高比r，

根据下面方法选择4个子像素，

上方和左侧参考像素都可用，
仅上方参考像素可用，

仅左侧参考像素可用，

4个子像素选择如Fig.3所示。

当色度块尺寸为2，且仅一侧参考像素可用时，只选择2个子像素。

获得模型参数后，首先通过下式计算临时色度预测块（和亮度块尺寸相同），

然后，使用6抽头滤波器[1 2 1;1 2 1]对临时色度预测块进行下采样，

但是，对于色度块最左侧的列，使用2抽头平均滤波器。

需要在码流中传输一个标志位来表示是否开启TSCPM功能，标志位位于DM模式之后。详细的情况如下表，

实验结果

该方法在VTM4.0和AVS3测试模型HPM5.0中实现。

VTM4.0结果

在VTM4.0中AI和RA配置下的结果如下，

在AI配置下YUV分量BD-Rate增益分别为0.05%,0.30%,0.38%。在RA配置下YUV分量BD-Rate增益分别为0.05%,0.36%,0.63%。增益最大的是A1序列（4k序列）。

HPM5.0结果

可以看见对于所有序列尤其是4k序列，TSCPM表现良好。在AI配置下YUV分量BD-Rate增益分别为0.99%,9.18%,9。41%。在RA配置下YUV分量BD-Rate增益分别为0.50%,7.63%,7.80%。

感兴趣的请关注微信公众号Video Coding

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

DCC2020：色度分量子像素跨分支预测

CCLM

子像素跨分支预测和实现

子像素跨分支预测

VVC中实现细节

AVS3中实现细节

实验结果

VTM4.0结果

HPM5.0结果

[软件工具百科] 互联网资源历史快照归档站点与数字图书馆

网易面试：SpringBoot如何开启虚拟线程？

杭州的 IT 崩盘了么？

程序员常见的文本查看工具

VS2022 解决方案打不开 .NET Framework 4.0 、 4.5 等老项目

Vue3 运行可以，build 打包发布报错，app.config.globalProperties 用法坑

既然测试也要求写代码，那干脆让开发兼任测试不就好了吗？

ITSM落地经验之建设蓝图规划

PDF 补丁丁 1.0.2 版更新

奇怪！应用的日志呢？？

python判斷遠程文件是否存在

protobuf.js中enum的獲取

No.12 Linux配置http服務主要文件參數

JavaScript圖表工具FusionCharts縮放折線圖

i.MX6ULL終結者Linux設備樹什麼是設備樹

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結