流形學習應用與展望

 一  流形學習典型應用

 1 可視化

人不能直觀感知高維度的數據集的內部結構,但對三維以下的數據集的內在規律有着很強的感知能力。流形學習可以將高維數據的內在關係在低於三維的空間中展示出來,使得人們能夠直觀地認識高維數據的內在規律,並瞭解影響數據集內在結構的主要因素的變化規律。

 

2 推理與半監督學習

由於流形表達了一個事物在不同狀態下的共通狀態,而沿流形的運動則表達事物狀態的變化,那麼我們可以利用流形上某些數據已知狀態參數(實質是其在隱空間中的座標),使用流形學習算法來學習推測出狀態參數未知的數據的狀態參數。流形學習的這種推理機制正是半監督學習所需要的,流形學習在推理和半監督學習方面的應用有估計手旋杯的旋轉度數[1]、推測視頻圖像中目標的位置[2]、半監督文本分類[3]等。

 

3 特徵提取

流形學習方法提取的特徵往往有利於後續聚類或者分類任務的進行,這是由於同一事物但不同種類的樣本可能位於表徵該事物的流形的不同區域。流形學習方法能夠有效地逼近表徵該事物的流形,從而使得流形上不同的區域的差別在特徵空間中得到體現。

 

4 分類

流形學習也在分類問題與監督特徵提取問題中得到應用。在分類問題中,如果每類樣本均能夠由一個流形很好地描述,那麼我們只需要對每類樣本學習一個流形,在分類時,計算樣本到每個流形的距離,將其分類到與其最近的流形所在的類即可。

 

5 數據描述

對於數據描述任務,流形學習的一個重要應用在圖像處理領域。圖像中物體的輪廓以及骨架等均可以看做是嵌入在二維平面中的一維流形或者由一組一維流形構成。流形學習有着強大的流形逼近能力,在圖像處理的輪廓描述、骨架提取等方面取得了成功的應用。

 

 

二研究展望

 

(1)       流形學習方法的參數選擇問題

目前大多數流形學習算法都涉及到近鄰數和本徵維數等參數的選擇問題。流形學習探測低維流形結構成功與否在很大程度上取決於近鄰數的選擇,然而近鄰數的選擇受數據分佈密度和空間結構等的影響,至今仍缺乏一個很好的理論指導,現實中往往只能通過經驗來選擇。本徵維數估計是流形學習的一個基本問題,它反映了隱藏在高維觀測數據中的潛在低維流形的拓撲屬性,本徵維數估計的準確與否對低維空間的嵌入結果有重要的影響。

(2)       流形學習算法性能評估問題

對於一個給定的高維數據集,利用流形學習算法將其嵌入到低維空間後將其嵌入到低維空間後,高維非線性數據的低維嵌入質量如何,即低維嵌入在多大程度上揭示了高維非線性數據集的內在規律和拓撲結構。這實際上涉及到流形學習算法映射結果的性能評估問題。目前,人們常用的方法是將數據集映射到二維或者三維可視化空間,通過肉眼觀察來評價不同流形學習算法的嵌入性能。

 

(3)       流形學習算法魯棒性和收斂性問題

目前基於譜圖理論的流形學習方法對噪聲和離羣值都比較敏感,也是導致流形學習方法產生顯著偏差的原因,因此研究各種噪聲模型對流形學習方法的影響方式和影響度是一項有意義的工作。

現在的流形學習方法依賴於要進行學習的數據本身,且其有效程度與算法本身相關,然而要使一種學習算法完備,需要考慮算法描述的幾何結構能否能逼近真實的內在幾何結構。因而,能夠構造出一種與數據無關的流形學習,並導出流形學習對真實的內在嵌入流形逼近的收斂性,是完善流形學習研究中十分重要的一步。

(4)       多子流形學習問題

目前大部分流形學習算法都假定高維輸入數據位於一個連通的流形中,然而現實中許多高維非線性數據集包含多個子流形,如不同的人臉數據和蛋白質相互作用數據等,現有的流形學習方法無法將數據集包含的所有子流形都映射到同一個低維空間中並保持各自的流形結構,這是將流形學習應用於模式識別和圖像處理等任務時需要解決的一個問題,因此有必要深入研究不連通流形上的高維數據的維數約簡問題。

(5)       流形學習的應用研究問題

目前流形學習的應用對象主要侷限矩靜態的圖像數據,如人臉、手寫體數據、掌紋數據等。通常數據流是一種實時、連續、有序的數據組成的序列,它廣泛存在與現實世界和工程實驗中,如網絡監控和通信工程、Web服務產生的日誌記錄、傳感器監控、視頻流監控、金融市場上股票交易波動分析、天氣或環境監督等都能產生大量的數據流。如何將流形學習方法應用於各種數據流,仍值得進一步的深入研究。

 

參考文獻:

[1]  張軍平, 王珏. 流形學習及應用 [D][D]. , 2003.

[2] Yang X, Fu H, Zha H, et al. Semi-supervised nonlinear dimensionality reduction[C]//Proceedings of the 23rd international conference on Machine learning. ACM, 2006: 1065-1072.

[3]  Belkin M, Niyogi P. Using manifold stucture for partially labeled classification[C]//Advances in neural information processing systems. 2002: 929-936.

[4] 黃啓宏. 流形學習方法理論研究及圖像中應用[J]. 學位論文. 成都: 電子科技大學, 2007.

[5] 黃鴻. 圖嵌入框架下流形學習理論及應用研究[D]. 重慶: 重慶大學, 2008.

[6] 雷迎科. 流形學習算法及其應用研究[D]. 中國科學技術大學, 2011.

[7] 張興福.基於流形學習的局部降維算法研[D].哈爾濱工程大學,2012

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章