零樣本學習綜述 Zero-Shot Learning(一):定義

機器學習中的大多數方法是通過有標籤的訓練集進行學習,側重於對已經在訓練中出現過標籤類別的樣本進行分類。然而在現實場景中,許多任務需要對以前從未見過的實例類別進行分類,這樣就使得原有訓練方法不在適用。零樣本學習因此孕育而生,該方法的訓練實例所涉及的類與測試集中要分類的類是不相交的,完全不同,即根據訓練集中的可見類別數據, 通過相關先驗知識, 實現對未見類別的數據,進行類別預測和識別。

定義:(零樣本學習 Zero-Shot Learning
給定有標籤的訓練集合 XtrX^{tr},均屬於可見類SS,零樣本學習是指學習一個分類器 fu():XUf^u( \cdot):X\rightarrow U 使得分類器可以對均屬於未見類別的測試集實例 XteX^{te} 進行分類,得到預測值 YteY^{te}

2019年冀中等人在綜述文章中將零樣本分類的定義分爲廣義和狹義兩種:

零樣本分類的技術目前正處於高 速發展時期, 所涉及的具體應用已經從最初的圖像分類任務擴展到了其他計算機視覺任務乃至自然語言處理等多個相關領域. 對此, 本文將其稱爲廣義零樣本分類. 相應地, 我們將針對圖像分類任務的零樣本分類任務稱爲狹義零樣本分類。

在冀中和 WEI WANG的文章中,零樣本學習均被視爲遷移學習的一個特例。零樣本學習中,源特徵空間是訓練樣本的特徵空間和目標特徵空間是測試樣本的特徵空間,這兩者是相同的。但是源標註空間和目標標註空間分別是可見類別和未見類別,兩者是不同的。因此零樣本學習屬於異質遷移學習(heterogeneous transfer learning)。

由於在零樣本學習中的目標標註空間是未見類別,因此學習這些實例的類別需要額外的輔助信息(Auxiliary Information)作爲支撐。這些輔助信息應當滿足以下兩個標準:1、包含所有不可見類別的信息;2、和特徵空間相互關聯。

人類學習的過程包含了大量零樣本學習的思路,比如被廣泛引用的人類識別斑馬的例子:假設一個人沒有見過斑馬,即斑馬對這個人來說是未見類別, 但他知道斑馬是一種身上有黑白條紋的外形像馬的動物,即馬是可見類別。那麼當他第一次看到斑馬的時候, 可以通過先驗知識和已經見過的類別認出這是斑馬。人類通過語義知識作爲輔助信息,識別了未見類,零樣本學習基於人類學習過程進行算法的研究。

具體的零樣本學習方法可分爲:基於分類器的方法和基於樣本實例的方法。

綜述文章可參考:

[1] Wang W, Zheng V W, Yu H, et al. A survey of zero-shot learning: Settings, methods, and applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2019, 10(2): 1-37.
[2] 冀中, 汪浩然, 於雲龍, 等. 零樣本圖像分類綜述: 十年進展[J]. 中國科學: 信息科學, 2019 (10): 5.
[3] 張魯寧, 左信, 劉建偉. 零樣本學習研究進展[J]. 自動化學報, 2020, 46(1): 1-23.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章