最大間隔目標函數(Maximum Margin Objective Function)推導

基本思想:確保正樣本計算得到的分數比負樣本的高

假設由正、負樣本計算得到的分數分別爲s+s_{+}ss_{-},那麼我們的目標爲最大化(s+s)(s_{+}-s_{-}),換一個角度,也就是最小化(ss+)(s_{-}-s_{+})

事實上,當s+>ss_{+}>s_{-}時,已經滿足我們正例分數大於反例的目標,因此我們只考慮當s>s+s_{-}>s_{+}的情況,此時會產生誤差:

J=max(ss+,0)J = max(s_{-}-s_{+}, 0)

但是爲了使分類結果更具有說服性,我們要求s+s_{+}不僅僅比ss_{-}要大,而且要大於一定的閾值Δ\Delta才行。即當s+s<Δs_{+}-s_{-}<\Delta時就要開始計算誤差,於是誤差的計算可以被修改爲:

J=max(Δ+ss+,0)J = max(\Delta + s_{-}-s_{+}, 0)

爲了簡化,我們可以將Δ\Delta縮放爲1(實際上,也就是將W和b都按照同比例縮放,即WΔ\frac W \DeltabΔ\frac b \Delta),於是得到我們最終需要優化的最大間隔目標函數:

Loss=minimizeJ=max(1+ss+,0)Loss = minimize {J= max(1 + s_{-}-s_{+}, 0)}

注:可以在《統計學習方法》的SVM一章中瞭解關於最大間隔目標函數更爲詳細的推導

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章