1. SVM概念
支持向量機(Support Vector Machine,SVM)屬於有監督學習模型,主要於解決數據分類問題。通常SVM用於二元分類問題,對於多元分類可將其分解爲多個二元分類問題,再進行分類,主要應用場景有圖像分類、文本分類、面部識別和垃圾郵件檢測等領域。
2. SVM 解決的問題
3. 模型基本思想
以一個二元分類問題爲例講解模型原理。首先假設有兩類數據,如圖需要找出一條邊界來將兩類數據分隔開來
下圖中列出一些可行的分隔方式。在當前的數據集的條件下,三種分隔方式都是可行的,我們該如何做選擇?
找到最優分類數據的分界線,使得對樣本數據的分類效果更好的方法就是要儘可能地遠離兩類數據點,即數據集的邊緣點到分界線的距離d最大,這裏虛線穿過的邊緣點稱作支持向量,分類間隔爲2d。如下圖所示
4. 支持向量機原理
SVM是從線性可分情況下的最優分類面發展而來的。