Improved Multilabel Classification with Neural Networks
2008 International Conference on Parallel Problem Solving from Nature
Rafał Grodzicki, Jacek Mańdziuk, and Lipo Wang,南洋理工
摘要
這裏提出了對現有神經網絡多標記分類算法BP-MLL的一些改進。這些修改涉及BP-MLL中使用的全局誤差函數的形式。
改進BP-MLL
簡要介紹
BP-MLL具有一個隱藏層以及來自輸入和隱藏層的額外偏差。輸入圖層的大小等於實例域維度(加上偏置神經元)。輸出層的大小等於標籤的數量(即Q)。訓練基於經典的BP算法,但爲了解決標籤之間的依賴關係,提出了以下形式的新的全局誤差函數和閾值訓練方法:
E=p=1∑mEp=i=1∑m∣Yp∣∣∣Yp∣∣1(r,s)∈Yp×Yp∑exp(−(crp−csp))
h(xp)={q∈Y:cq(xp)>t(xp)},cq(xp)=cqp
這裏把 t(x)看成是 c(x)的線性函數,t(x)=wT⋅c(x)+b,其中 c(x)=(c1(x),c2(x),…,cQ(x))。
誤差函數修改
- 在本文中,我們提出了[1]中使用的誤差函數的一些改進。第一個引入的修改是將閾值整合到BP-MLL中使用的誤差函數中。它導致以下形式的錯誤函數:
這種方法是多增加一個神經元,最後輸出神經元的值(CQp)被解釋爲閾值。剩餘輸出神經元的含義與使用BP-MLL方法的情況相同。建議的解決方案允許通過神經網絡學習期間的適應來確定閾值。
- 通過爲不同標籤引入獨立閾值,可以進一步推廣上述誤差函數:
這種方法增加一倍的神經元,考慮每個類別q的兩個輸出神經元(由2q和2q + 1索引)。它們中的第一個(數字2q)表示相應類別(標籤)的輸出,而另一個(數字2q + 1)定義第q類別的相應閾值。
-
考慮相關標籤(不相關標籤)集合中所有標籤和標籤閾值兩兩相比較
-
基於上式,考慮增加相關標籤的閾值和不相關標籤的閾值兩兩相比較