【論文筆記】《多視圖聚類算法研究》

作者:朱信忠

論文類型:算法研究 博士論文

論文頁面:http://gb.oversea.cnki.net/KCMS/detail/detail.aspx?filename=1019000270.nh&dbcode=CDFD&dbname=CDFDTEMP

論文時間:2017年

本篇論文的內容:

將每個核矩陣視爲一個視圖,主要工作集中於設計有效的多視圖聚類算法以提高聚類性能。四個方面:

  1. 提出了基於矩陣範數導出正則化的多視圖聚類算法。
  2. 提出了一種最優的鄰居核聚類算法來增強所學最優核表示能力。
  3. 提出了一種缺失多視圖 K-均值算法。
  4. 提出了一種矩陣範數正則化的局部缺失多視圖 K-均值算法。

第一章 緒論

多視圖聚類算法按照視圖的組合方式可以分爲兩大類:特徵級融合,決策級融合。

目前已有研究的問題:

  1. 沒有充分考慮視圖間的相關性。這容易造成選擇具有高冗餘性和低多樣性的
    視圖,從而影響最終的聚類性能。
  2. 假設最優核是一組基核的線性組合,簡化了最優核的可行解空間,也忽略了
    核學習和聚類這兩個過程之間的聯繫性,從而影響最終的聚類性能。
  3. 假設每個樣本的所有視圖數據都是可觀測的,這使得它們不能有效地處理視
    圖中含有缺失的問題。
  4. 現有具有缺失核的多核聚類算法忽略了數據間的局部特性,從而影響了後續
    的聚類性能。

本論文的研究目標是(對應上面的問題)(對應第二-五章內容):

  1. 設計有效的多視圖聚類算法以有效地處理視圖間的冗餘性與多樣性問題;
  2. 設計最優鄰居多視圖聚類算法以進一步提高算法的聚類性能;
  3. 設計有效的多視圖聚類算法以有效地處理數據中含有缺失的問題;
  4. 設計具有矩陣範數正則化的局部多視圖聚類算法以更有效地處理數據中含
    有缺失的問題;

第二章 矩陣範數導出正則化的多視圖聚類算法

【核聚類】是什麼:核聚類簡單描述(拓展)

核聚類步驟:(k-means舉例)核k-means首先通過特徵圖譜映數據到高維空間,然後在新的空間中進行k-means聚類。

現有的多核聚類算法的問題:(1) 通過低秩優化學習一個一致矩陣;(2) 另一種方式則通過使用多核學習框架優化一組核係數以組合不同的核(本文是第二種)

爲了減少冗餘,增強被選中核的多樣性,需要一個正則化項以描述每一對核的相關性。

評價指標:聚類準確度 (ACC) 和歸一化互信息 (NMI)

第三章 基於最優鄰居核的多視圖聚類算法

多視圖聚類利用一簇預先指定的核來學習最優核,進而改善聚類性。這些算法大致可以被分爲:(1)算法利用低秩優化構建一致矩陣;(2)假設最優核是基核的線性組合,通過優化基核的組合係數來最小化聚類指標(本文是第二種)

方法&優點:將最優鄰居核學習與現有的多核K-均值聚類(MKKM)算法結合來提高最優核的表示能力,並更好地平衡核學習過程與聚類過程。算法內容:在Kγ的鄰居中尋找最優核G,然後用它來聚類。

聚類矩陣明確地被用來學習最優核,反過來,它又被用來聚類。這兩個學習過程被無縫耦合同時相互協作來取得最好的聚類效果。

算法和現有大多數MKKM算法最大的不同在於最優核的形式。現有MKKM 算法採用的假設是最優核是基核的線性組合。此算法只要求最優核在基核組合的附近就行。

評價指標:精度、互信息和純度

第四章 缺失多視圖聚類算法

現有算法的假設/缺點:多核聚類算法並沒有考慮到基核之間的相關性,所有基核都是完整的,也就是說每個基核的行和列都沒有缺失。

一個直接的補救措施就是先用一種填補算法來填補缺失核,然後利用一種標準的聚類算法進行聚類。其缺點:它們分開了填充和聚類這兩個過程,這抑制了兩個過程之間的相互協調從而達到最優的聚類結果。

算法內容:每一輪迭代的聚類結果將指引缺失核元素的填補,這將用於後續進一步的聚類,這兩個流程交替進行直至收斂。優點:這樣填補和聚類過程可以無縫連接,從而達到最佳的聚類效果。

優點:(1)有效解決了多核聚類中出現的行列缺失的問題;(2)相比同類算法,取得了更好的實驗結果,特別是存在大量缺失的情況時;(3)通過考慮聚類目標,能夠更好地恢復缺失的基核。

評價指標:聚類精度(ACC)、歸一化互信息(NMI)

第五章 局部化缺失多視圖聚類算法

將缺失填充和聚類整合到單一的優化過程的缺點:(1)強制性地迫使更近和更遠的樣本對與相同的理想相似度相等,並且不適當地忽略同一類別中樣本的變化; 和 (2)沒有充分考慮到多核矩陣之間的相關性,這可能導致所選擇的內核存在高冗餘度和低樣性。這兩個因素使得這些預定義的核矩陣沒有得到有效的利用,反過來又不利地影響聚類表現(P.S.按這個說法那第四章也有這些缺點?沒有提到說是第四章的改進)

算法:基於矩陣引導的正則化(LI-MKKM-MR)的局部缺失多視圖k-means算法。

其優點:僅要求樣本與其k個最近的鄰居的相似性與理想的相似性矩陣對齊。引入矩陣引導的正則化能夠減少多核的冗餘並增強所選擇的核的多樣性,使多核能夠更好地用於聚類。

算法的改進:(1)遵循,引入矩陣引導的正則化項來減少冗餘並強制所選基核的多樣性,在正則化項中採用 Mpq = Tr(KpKq) 來度量 Kp 和 Kq 之間的相關性,充分利用更多的基核矩陣, 這是提高聚類性能(2)使用代替Mpq, Kp(0)是Kp的初始填充,滿足了我們對核係數的要求, 減少冗餘和提高多樣性。

評價指標:聚類精準度 (ACC)、歸一化互信息(NMI) 和純度

第六章 總結與展望

P.S.這篇有的算法不太看得懂,回頭多視圖聚類算法看多了再來看看。

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章