文章出處:
http://blog.csdn.net/smartempire/article/details/23168945
看關於LBP人臉識別的論文時提到了Histogram intersection這個方法,方法最初來自The Pyramid Match Kernel:Discriminative Classification with Sets of Image Features這篇論文,用來對特徵構成的直方圖進行相似度匹配,下面介紹下原理。
假設圖像或其他數據的特徵可以構成直方圖,根據直方圖間距的不同可以得到多種類型的直方圖:
論文裏是這麼設置的,假設H0(x)裏每個直方圖寬度爲a,那麼H1(x)爲2a,以此類推。舉個例子,假設有某計算機學院男生身高範圍在160cm-200cm,H0(x)寬度可以設置爲2cm,那H0(x)裏會有20個直方圖;類推H1(x)寬度則爲4cm,H1(x)會有10個直方圖。
兩個數據集的相似度可以用下式來匹配:
y和z分別代表不同的數據集,比如給了兩個學院男生身高,想看下這兩個學院是不是同一個學院(例子不恰當,湊合着用吧^_^),用上式他們的相似度就好了。其中w代表權重,論文裏將wi設置爲1/(2^i),N代表每兩層之間的新匹配的數目,可以通過下式計算:
上式裏面的L可以通過下式計算:
附圖解釋什麼意思。
(a)裏的y和z代表兩種數據分佈,三幅圖代表三層金字塔,每一層裏有間距相等的虛線,意思和我之前說的2cm,4cm的寬度一樣。可以看到紅點藍點的位置是固定的,但是根據直方圖寬度的不同可以劃到不同的直方圖裏,如(b)所示。(c)圖就是L的計算結果,是通過(b)裏兩種直方圖取交集得來的,不過直方圖的高度忽略不計,只計算交集後的數目,(c)圖每個圖的下方都給出了交集數目,比如x0=2,x1=4,x2=5。
L得到了,就算N就是通過,也就是通過Ni=Li-Li-1得到(看公式是能取負數的,比如上圖裏的N0=2,N1=2,N2=-1)。
由於wi之前設置爲1/(2^i)了,所以