基本思想:確保正樣本計算得到的分數比負樣本的高
假設由正、負樣本計算得到的分數分別爲s+和s−,那麼我們的目標爲最大化(s+−s−),換一個角度,也就是最小化(s−−s+)。
事實上,當s+>s−時,已經滿足我們正例分數大於反例的目標,因此我們只考慮當s−>s+的情況,此時會產生誤差:
J=max(s−−s+,0)
但是爲了使分類結果更具有說服性,我們要求s+不僅僅比s−要大,而且要大於一定的閾值Δ才行。即當s+−s−<Δ時就要開始計算誤差,於是誤差的計算可以被修改爲:
J=max(Δ+s−−s+,0)
爲了簡化,我們可以將Δ縮放爲1(實際上,也就是將W和b都按照同比例縮放,即ΔW,Δb),於是得到我們最終需要優化的最大間隔目標函數:
Loss=minimizeJ=max(1+s−−s+,0)
注:可以在《統計學習方法》的SVM一章中瞭解關於最大間隔目標函數更爲詳細的推導