支持向量機（一）——深入理解函數間隔與幾何間隔

原創

2018-08-27 07:33

1.支持向量機和logistic函數的有什麼區別

實踐發現，在所給的例子中，兩種方法線性劃分兩類事物時得到的線性分類器的效果差不多。那具體的差別在哪呢？
SVM更關心的是靠近中間分割線的點，讓他們儘可能地原理中間線，而不是在所有點上達到最優，因爲那樣的話，要使得一部分點靠近中間線來換取另外一部分點更加原理中間線。因此支持向量機和和邏輯斯蒂迴歸的不同點，一個是考慮局部（不關心已經確定遠離的點，更考慮靠近中間分割線的點），一個是考慮全局（已經原理的點可能通過調整中間線使其能夠更加遠離）

2. 函數間隔和幾何間隔

首先我們定義超平面的表達式爲y= $ω^{T} x + b$ ，然後熟悉一下一個點(x,y)到Ax+By+C=0，的距離公式是 $\frac{A x + B y + C}{\sqrt{A^{2} + B^{2}}}$ ，其次我們要清楚我們的任務是找到離超平面最近的點，並使它最遠。

2.1 函數間隔

接着來看函數間隔的定義：給定一個訓練樣本 $(x_{i}, y_{i})$ ，x是特徵，y是結果標籤，i表示第i個樣本。定義函數間隔爲：

\hat{γ_{i}} = y_{i} (w * x_{i} + b)

由於之前對g(z)進行了定義，當

y_{i} = 1

時，

w * x_{i} + b \geq 0

，所以函數間隔實際上是

| w * x_{i} + b |

。由於是一個訓練樣本，那麼爲了使函數間隔最遠（更大的信息確定該樣本是正例還是反例），所以，當

y_{i} = 1

時，我們希望

w * x_{i} + b

能夠非常大，反之是非常小。因此函數間隔代表了我們認爲特徵是正例還是反例的確信度。
函數間隔如果同時擴大w和b的話，例如將

w * x_{i} + b

乘個係數2，函數間隔會增大2倍，但是所求的超平面

w * x_{i} + b = 0

不會變化（注意這裏一個是超平面概念，一個是函數間隔概念）
剛剛我們定義個函數間隔是針對某一個樣本的，現在我們針對全局樣本的定義的函數間隔：

\hat{γ} = \underset{i = 1, . . ., N}{m i n} {\hat{γ}}_{i}

意思就是找到訓練樣本中函數間隔最小的那個樣本，並且要讓它的函數間隔最大。

2.2 幾何間隔

幾何間隔首先簡單一點說就是點到直線距離，如圖

假設我們有B點所在的 $w * x_{i} + b = 0$ ，任何其他一點，比如A到該面的距離以 $γ^{i}$ 表示，假設B就是A在分割面上的投影。W是法向量，則單位向量就是 $\frac{ω}{| | ω | |}$ 。A點座標是 $(x_{i}, y_{i})$ 。所以B點是 $x = x_{i} - γ^{i} * \frac{ω}{| | ω | |}$ （初中數學知識），帶入到所需要求的超平面 $w * x_{i} + b = 0$ ，就得到以下公式：

看吧，幾何距離實際上就是點到直接距離，換一種寫法：

當||w||等於1的時候，函數間隔就和幾何間隔一樣，可以理解爲函數間隔是幾何間隔沒有除以||w||的表達，幾何間隔是函數間隔歸一化的結果。這是爲什麼呢？因爲函數間隔是我們定義的，在定義的時候就有幾何間隔的色彩。幾何間隔最大的優勢就是不管將w和b擴大幾倍，幾何間隔都沒有影響。
同樣，定義全局的幾何間隔爲
幾何間隔與函數間隔的關係就是：

γ = \frac{\hat{γ}}{| | ω | |}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

支持向量機（一）——深入理解函數間隔與幾何間隔

1.支持向量機和logistic函數的有什麼區別

2. 函數間隔和幾何間隔

2.1 函數間隔

2.2 幾何間隔

P4編程環境搭建+實現tutorials中basic的案例

LeetCode Python3——5. 最長迴文數

LeetCode Python3——10. 正則表達式匹配

LeetCode Python3——6. Z字形變換

LeetCode Python3——8.字符串轉整數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結