《機器學習中的數學》—— 函數間隔與幾何間隔

1.函數間隔

在超平面wx+b=0w^*x+b=0確定的情況下,wx+b=0|w^*x+b=0|能夠表示點x到距離超平面的遠近,而通過觀察wx+b=0w^*x+b=0的符號與類標記yy的符號是否一致可判斷分類是否正確,所以,可以用wx+b=0w^*x+b=0)的正負性來判定或表示分類的正確性。於此,我們便引出了函數間隔(functional margin)的概念。
定義函數間隔(用γ^\widehat{\gamma}表示)爲:
γ^=y(wTx+b)=yf(x) \widehat{\gamma}=y(w^Tx+b)=yf(x)
而超平面(wb)(w,b)關於TT中所有樣本點(xiyi)(x_i,y_i)的函數間隔最小值(其中,xx是特徵,yy是結果標籤,ii表示第ii個樣本),便爲超平面(w, b)關於訓練數據集T的函數間隔:
γ^=minγ^i(i=1,...,n) \widehat{\gamma}=min\widehat{\gamma}_i(i=1,...,n)
但這樣定義的函數間隔有問題,即如果成比例的改變wwbb(如將它們改成2w2w2b2b),則函數間隔的值f(x)卻變成了原來的22倍(雖然此時超平面沒有改變),所以只有函數間隔還遠遠不夠。

2.幾何間隔

事實上,我們可以對法向量w加些約束條件,從而引出真正定義點到超平面的距離–幾何間隔(geometrical margin)的概念。
假定對於一個點 xx ,令其垂直投影到超平面上的對應點爲$ x_0$ ,ww 是垂直於超平面的一個向量,爲樣本xx到超平面的距離,如下圖所示:
在這裏插入圖片描述
根據平面幾何知識,有
x=x0+γww x=x_0+\gamma \frac{w}{||w||}
其中w||w||ww的二階範數(範數是一個類似於模的表示長度的概念),ww\frac{w}{||w||}是單位向量(一個向量除以它的模稱之爲單位向量)。
又由於x0x_0是超平面上的點,代入超平面方程wTx+b=0w^Tx+b=0,可得wTx0+b=0w^Tx-0+b=0,即wtx0=bw^tx_0=-b
x=x0+γwwx=x_0+\gamma \frac{w}{||w||} 兩邊同乘wTw^T,有wTx0=bw^Tx_0=-bwTw=w2w^Tw=||w||^2得到“
γ=wTx+bw=f(x)w \gamma=\frac{w^Tx+b}{|||w||}=\frac{f(x)}{|||w||}
爲了得到γ\gamma的絕對值,令γ\gamma乘上對應的類別 yy,即可得出幾何間隔(用表示)的定義:
γ~=yγ=γ^w \widetilde{\gamma}=y \gamma=\frac{\widehat{\gamma}}{|||w||}

3.兩者的關係

從上述函數間隔和幾何間隔的定義可以看出:幾何間隔就是函數間隔除以w||w||,而且函數間隔y(wx+b)=yf(x)y*(wx+b) = y*f(x)實際上就是f(x)|f(x)|,只是人爲定義的一個間隔度量,而幾何間隔γ^w\frac{\widehat{\gamma}}{|||w||}纔是直觀上的點到超平面的距離。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章