機器學習中的函數間隔和幾何間隔

一、函數間隔

函數間隔
一般來說, 一個點距離分離超平面的遠近可以表示分類預測的確信程度。在超平面wx+b=0w\cdot x+b=0 確定的情況下,wx+b|w\cdot x+b|能夠相對地表示點距離超平面的遠近。wx+bw\cdot x+b 的符號與類標記 yy 的符號是否一致能夠表示分類是否正確。所以可用y(wx+b)y(w\cdot x+b)來表示分類的正確性及確信度,這就是函數間隔(functional margin)的概念。
定義
對於給定的訓練數據集 TT 和超平面 (w,b)(w,b),定義超平面 (w,b)(w,b) 關於樣本點 (xi,yi)(x_i,y_i)的函數間隔爲:
γi^=yi(wxi+b) \hat{\gamma_i}=y_i(w\cdot x_i+b)
定義超平面 (w,b)(w,b) 關於訓練數據集 TT 的函數間隔爲超平面 (w,b)(w,b) 關於 TT 中所有樣本點 (xi,yi)(x_i,y_i) 的函數間隔最小值,即:
γ^=mini=1,2,...,Nγi^ \hat{\gamma}=\mathop{min}\limits_{i=1,2,...,N}\hat{\gamma_i}

當選擇分離超平面時,只有函數間隔還不夠。因爲只要成比例地改變,例如將它們改爲 (2w,2b)(2w,2b),平面並沒有改變,但函數間隔卻成爲原來的兩倍。所以可以對分離超平面的法向量加某些約束,如規範化,w=1||w||=1,使得間隔是確定的 。這時函數間隔成爲幾何間隔 (geometric margin)

二、幾何間隔

定義
對於給定的訓練數據集 TT 和超平面 (w,b)(w,b),定義超平面 (w,b)(w,b) 關於樣本點 (xi,yi)(x_i,y_i)的幾何間隔爲:
γi=yi(wwxi+bw) \gamma_i=y_i({w\over||w||}\cdot x_i+{b\over||w||})
定義超平面 (w,b)(w,b) 關於訓練數據集 TT 的幾何間隔爲超平面 (w,b)(w,b) 關於 TT 中所有樣本點 (xi,yi)(x_i,y_i) 的幾何間隔最小值,即:
γ=mini=1,2,...,Nγi^ \gamma=\mathop{min}\limits_{i=1,2,...,N}\hat{\gamma_i}
超平面 (w,b)(w,b) 關於樣本點 (xi,yi)(x_i,y_i) 的幾何間隔 般是實例點到超平面的帶符號的距離 (signed distance) ,當樣本點被超平面正確分類時就是實例點到超平面的距離。

三、函數間隔和幾何間隔的關係

γi=γ^iw \gamma_i={\hat\gamma_i\over||w||}

γ=γ^w \gamma={\hat\gamma\over||w||}

w=1\|w\|=1,那麼函數間隔和幾何間隔相等,如果超平面參數成比例地改變(超平面沒有改變) ,函數間隔也按此比例改變,而幾何間隔不變

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章