1.函數間隔
在超平面w∗x+b=0確定的情況下,∣w∗x+b=0∣能夠表示點x到距離超平面的遠近,而通過觀察w∗x+b=0的符號與類標記y的符號是否一致可判斷分類是否正確,所以,可以用w∗x+b=0)的正負性來判定或表示分類的正確性。於此,我們便引出了函數間隔(functional margin)的概念。
定義函數間隔(用γ表示)爲:
γ=y(wTx+b)=yf(x)
而超平面(w,b)關於T中所有樣本點(xi,yi)的函數間隔最小值(其中,x是特徵,y是結果標籤,i表示第i個樣本),便爲超平面(w, b)關於訓練數據集T的函數間隔:
γ=minγi(i=1,...,n)
但這樣定義的函數間隔有問題,即如果成比例的改變w和b(如將它們改成2w和2b),則函數間隔的值f(x)卻變成了原來的2倍(雖然此時超平面沒有改變),所以只有函數間隔還遠遠不夠。
2.幾何間隔
事實上,我們可以對法向量w加些約束條件,從而引出真正定義點到超平面的距離–幾何間隔(geometrical margin)的概念。
假定對於一個點 x ,令其垂直投影到超平面上的對應點爲$ x_0$ ,w 是垂直於超平面的一個向量,爲樣本x到超平面的距離,如下圖所示:
根據平面幾何知識,有
x=x0+γ∣∣w∣∣w
其中∣∣w∣∣爲w的二階範數(範數是一個類似於模的表示長度的概念),∣∣w∣∣w是單位向量(一個向量除以它的模稱之爲單位向量)。
又由於x0是超平面上的點,代入超平面方程wTx+b=0,可得wTx−0+b=0,即wtx0=−b。
讓x=x0+γ∣∣w∣∣w 兩邊同乘wT,有wTx0=−b和wTw=∣∣w∣∣2得到“
γ=∣∣∣w∣∣wTx+b=∣∣∣w∣∣f(x)
爲了得到γ的絕對值,令γ乘上對應的類別 y,即可得出幾何間隔(用表示)的定義:
γ=yγ=∣∣∣w∣∣γ
3.兩者的關係
從上述函數間隔和幾何間隔的定義可以看出:幾何間隔就是函數間隔除以∣∣w∣∣,而且函數間隔y∗(wx+b)=y∗f(x)實際上就是∣f(x)∣,只是人爲定義的一個間隔度量,而幾何間隔∣∣∣w∣∣γ纔是直觀上的點到超平面的距離。