向量相似度度量(三):科普-为什么度量方式很重要


同样,这个解释来自于前述文章提到的论文。可能初做这个技术领域的人不是很在乎如何度量,只是找一个差不多的把系统搭起来。其实度量的好坏直接影响着最后的效果。下面的图示可以很好的阐述这一点。

首先,我们看两组直方图,

  • 图(a)使用了bin-by-bin的直方图比较方式L1距离,即每个bin和另一个直方图的对应bin作比较,绝对值求和。左图的两个直方图距离为4,右图为2,显然L1距离显示左图中的两个直方图相似性要弱于右图。
  • 图(b)使用了cross-bin的直方图比较方式quadratic-form distance,这个距离考虑的bin之间的关系,公式如下。它的比较结果依然会认为左图相似性弱于右图。



但是,按照两种距离度量的机制,我们可以比较容易的思考到,下图比较方式会更加合理。图(c)显示,如果是bin和bin比较,那么稍微错一格进行比较,岂不是很完美?图(d)也同样,cross-bin的比较这样比会更加合理。

为什么左图的一对直方图是很相似呢?从图像的例子可以很容易的理解。大家知道图像的8bit灰度值是0-255,如果直方图是32个bin,代表对图像做量化,量化步长为8。如果有个图像像素值是128(灰不溜秋的颜色),量化后(这里方便起见直接除以8了)属于bin=16。但是如果另一个另一个图像的像素值是129,我们直观看起来都会觉得这俩像素长得太像了,但是直方图的结果却是归到了bin=17。这就带来了上述例子的结果,图像很相似,但是距离反而不小。



这篇文章很科普,很傻瓜,不过感觉很直观能表达一个道理,权当一片文章吧。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章