最大间隔目标函数（Maximum Margin Objective Function）推导

原創

2020-04-20 13:57

基本思想：确保正样本计算得到的分数比负样本的高

假设由正、负样本计算得到的分数分别为 $s_{+}$ 和 $s_{-}$ ，那么我们的目标为最大化 $(s_{+}-s_{-})$ ，换一个角度，也就是最小化 $(s_{-}-s_{+})$ 。

事实上，当 $s_{+}>s_{-}$ 时，已经满足我们正例分数大于反例的目标，因此我们只考虑当 $s_{-}>s_{+}$ 的情况，此时会产生误差：

$J = max(s_{-}-s_{+}, 0)$

但是为了使分类结果更具有说服性，我们要求 $s_{+}$ 不仅仅比 $s_{-}$ 要大，而且要大于一定的阈值 $\Delta$ 才行。即当 $s_{+}-s_{-}<\Delta$ 时就要开始计算误差，于是误差的计算可以被修改为：

$J = max(\Delta + s_{-}-s_{+}, 0)$

为了简化，我们可以将 $\Delta$ 缩放为1（实际上，也就是将W和b都按照同比例缩放，即 $\frac W \Delta$ ， $\frac b \Delta$ ），于是得到我们最终需要优化的最大间隔目标函数：

$Loss = minimize {J= max(1 + s_{-}-s_{+}, 0)}$

注：可以在《统计学习方法》的SVM一章中了解关于最大间隔目标函数更为详细的推导

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.