最大间隔目标函数(Maximum Margin Objective Function)推导

基本思想:确保正样本计算得到的分数比负样本的高

假设由正、负样本计算得到的分数分别为s+s_{+}ss_{-},那么我们的目标为最大化(s+s)(s_{+}-s_{-}),换一个角度,也就是最小化(ss+)(s_{-}-s_{+})

事实上,当s+>ss_{+}>s_{-}时,已经满足我们正例分数大于反例的目标,因此我们只考虑当s>s+s_{-}>s_{+}的情况,此时会产生误差:

J=max(ss+,0)J = max(s_{-}-s_{+}, 0)

但是为了使分类结果更具有说服性,我们要求s+s_{+}不仅仅比ss_{-}要大,而且要大于一定的阈值Δ\Delta才行。即当s+s<Δs_{+}-s_{-}<\Delta时就要开始计算误差,于是误差的计算可以被修改为:

J=max(Δ+ss+,0)J = max(\Delta + s_{-}-s_{+}, 0)

为了简化,我们可以将Δ\Delta缩放为1(实际上,也就是将W和b都按照同比例缩放,即WΔ\frac W \DeltabΔ\frac b \Delta),于是得到我们最终需要优化的最大间隔目标函数:

Loss=minimizeJ=max(1+ss+,0)Loss = minimize {J= max(1 + s_{-}-s_{+}, 0)}

注:可以在《统计学习方法》的SVM一章中了解关于最大间隔目标函数更为详细的推导

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章