SVM核函數形式
SVM核函數形式:
αmaxi=1∑mαi−21i=1∑mj=1∑mαiαjyiyjk(xi,xj)s.t.i=1∑mαiyi=0,αi≥0,i=1,2,…,m
求解後得到:
f(x)=wTϕ(x)+b=i=1∑mαiyiϕ(xi)Tϕ(x)+b=i=1∑mαiyik(x,xi)+b
其中k(.,.)是核函數。上式顯示出模型最優解可通過訓練樣本的核函數展開,這一展式亦稱“支持向量展式”。
Histogram intersection(SVM直方圖交叉核)
假設圖片的特徵可以構成直方圖,根據直方圖的間距不同可以得到多種類型的直方圖:
Ψ(x)=[H−1(x),H0(x),…,HL(x)]
上面是直方圖的集合,假設H0(x)裏每個直方圖寬度爲a,H1(x)爲2a,以此類推。假設某計算機學院男生身高都在160cm~200cm之間,最高和最低身高之間想差40cm,H0(x)寬度可以設置爲2cm,那麼H0(x)裏面會有20個直方圖,那麼類推H1(x)寬度則爲4cm,H1(x)就會有10個直方圖。
不同男生的身高分佈在不同的直方圖中,其中每個直方圖的高度就是統計的是在這個範圍內的男生的個數。這樣的直方圖表示的就是計算機學院男生身高的分佈情況。可以在之前設定的計算機學院身高上下限的基礎上生成會計院的男生身高直方圖,兩者相比較就可以看出兩個不同學院男生的身高差別(僅僅是舉例~,有師兄在面試時考到如何用c寫直方圖的題目)。這樣的概念引申一下,就會得到梯度直方圖(HOG),特徵直方圖(SIFT,HOG)等。
兩個數據集(計算機學院男生身高and會計系男生身高)之間的相似度可以用以下的公式來匹配:
KΔ(Ψ(y),Ψ(z))=i=0∑LwiNi
y和z分別代表不同的數據集,其中w代表權重,論文裏將wi設置爲1/(2^i),N代表每兩層之間新匹配的數目,計算公式如下:
Ni=L(Hi(y),Hi(z))−L(Hi−1(y),Hi−1(z))
上式裏面的L可以通過下式計算:
L(A,B)=j=1∑rmin(A(j),B(j))
(a)裏的y和z代表兩種數據的分佈,三幅圖代表三層金字塔(如圖像金字塔,這裏可以理解爲直方圖間距爲2cm,4cm,6cm)。
每一層裏有間距相等的虛線,紅藍點的位置是固定的,但是根據直方圖的寬度不同可以劃分到不同的區域裏面,如圖(b)所示。
(c)就是L的計算結果,是通過(b)裏兩種直方圖取交集得來的(直方圖的高度忽略不計,只計算交際後的數目),比如x0=2,x1=4,x2=3
(這是參考博客的解釋,個人覺得明顯(c)直方圖的高度是取的兩者交叉的最小!只不過第一行的紅藍色的高度一致吧了~,在selective search裏是考慮這個高度的。)
L得到了,N也就是通過Ni=Li-Li-1得到,N*W在求和得到K,K越大越相似。(看公式是能取負數的,比如上圖裏的N0=2,N1=2,N2=-1)。
K~Δ(Ψ(y),Ψ(z))=i=0∑L2i1(L(Hi(y),Hi(z))−L(Hi−1(y),Hi−1(z)))
參考鏈接:
[1] SVM、核方法、SVR基本原理介紹, crishawy,
[2] Histogram intersection(直方圖交叉核), Dachao_Xu,