局部聚合向量(Vector of Locally Aggregated Descriptors,VLAD)
一種編碼方法,廣泛用於基於音頻的人臉識別、動態場景識別、頭部姿態分類等。
(1) 歐式空間的VLAD:
具有非常高的辨別能力
僅利用常規的VLAD能夠使用初始向量的加法和減法。
常規的歐式空間上的VLAD:
分 給定一個局部描述子集合,假設他們是高斯混合模型
和VLAD有關的只有關於均值的梯度部分,可以寫成下面形式:
(1)
在VLAD中,輸入空間被K個碼本劃分成K部分(給定碼書C)
1.通過KDtree找到與x最近的碼本賦值給u.
2.計算每個區域(共K個區域的累計殘差)
(2)
VLAD框架就是FV算法的一個簡化版本。(VLAD是FV的一個特例)
從(1)和(2)中我們可以看出,VLAD的特點:
1) VLAD利用hard assignment scheme(硬分配方法)
2) VLAD混合部分的協方差矩陣是對角的,而且是固定的。
(2)擴展到黎曼流形上
給定局部描述子