Multi class ovr or ovo

one-versus-rest和one-versus-one的不同
  SVM算法最初是爲二值分類問題設計的,當處理多類問題時,就需要構造合適的多類分類器。
  目前,構造SVM多類分類器的方法主要有兩類:一類是直接法,直接在目標函數上進行修改,將多個分類面的參數求解合併到一個最優化問題中,通過求解該最優化問題“一次性”實現多類分類。這種方法看似簡單,但其計算複雜度比較高,實現起來比較困難,只適合用於小型問題中;另一類是間接法,主要是通過組合多個二分類器來實現多分類器的構造,常見的方法有one-against-one和one-against-all兩種。
  a.一對多法(one-versus-rest,簡稱1-v-r SVMs, OVR SVMs)。訓練時依次把某個類別的樣本歸爲一類,其他剩餘的樣本歸爲另一類,這樣k個類別的樣本就構造出了k個SVM。分類時將未知樣本分類爲具有最大分類函數值的那類。
  假如我有四類要劃分(也就是4個Label),它們是A、B、C、D。於是我在抽取訓練集的時候,分別抽取A所對應的向量作爲正集,B,C,D所對應的向量作爲負集;B所對應的向量作爲正集,A,C,D所對應的向量作爲負集;C所對應的向量作爲正集, A,B,D所對應的向量作爲負集;D所對應的向量作爲正集,A,B,C所對應的向量作爲負集,這四個訓練集分別進行訓練,然後的得到四個訓練結果文件,在測試的時候,把對應的測試向量分別利用這四個訓練結果文件進行測試,最後每個測試都有一個結果f1(x),f2(x),f3(x),f4(x).於是最終的結果便是這四個值中最大的一個。
  p.s.: 這種方法有種缺陷,因爲訓練集是1:M,這種情況下存在biased.因而不是很實用.
  b.一對一法(one-versus-one,簡稱1-v-1 SVMs, OVO SVMs, pairwise)。其做法是在任意兩類樣本之間設計一個SVM,因此k個類別的樣本就需要設計k(k-1)/2個SVM。當對一個未知樣本進行分類時,最後得票最多的類別即爲該未知樣本的類別。Libsvm中的多類分類就是根據這個方法實現的。
  投票是這樣進行的.
A=B=C=D=0;
(A, B)-classifier 如果是A win,則A=A+1;otherwise,B=B+1;
(A,C)-classifer 如果是A win,則A=A+1;otherwise, C=C+1;

(C,D)-classifer 如果是A win,則C=C+1;otherwise,D=D+1;
The decision is the Max(A,B,C,D)
  p.s.: 這種方法雖然好,但是當類別很多的時候,model的個數是n*(n-1)/2,代價還是相當大的.
  c.層次支持向量機(H-SVMs)。層次分類法首先將所有類別分成兩個子類,再將子類進一步劃分成兩個次級子類,如此循環,直到得到一個單獨的類別爲止。
  d.其他多類分類方法。除了以上幾種方法外,還有有向無環圖SVM(Directed Acyclic Graph SVMs,簡稱DAG-SVMs)和對類別進行二進制編碼的糾錯編碼SVMs。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章