機器學習基礎概念

什麼是監督學習、無監督學習、強化學習、弱監督學習、半監督學習、多示例學習?

監督學習(supervised learning): 已知數據和其一一對應的標籤,訓練一個智能算法,將輸入數據映射到標籤的過程。監督學習是最常見的學習問題之一,就是人們口中常說的分類問題。比如已知一些圖片是豬,一些圖片不是豬,那麼訓練一個算法,當一個新的圖片輸入算法的時候算法告訴我們這張圖片是不是豬。

無監督學習(unsupervised learning): 已知數據不知道任何標籤,按照一定的偏好,訓練一個智能算法,將所有的數據映射到多個不同標籤的過程。相對於有監督學習,無監督學習是一類比較困難的問題,所謂的按照一定的偏好,是比如特徵空間距離最近,等人們認爲屬於一類的事物應具有的一些特點。舉個例子,豬和鴕鳥混雜在一起,算法會測量高度,發現動物們主要集中在兩個高度,一類動物身高一米左右,另一類動物身高半米左右,那麼算法按照就近原則,75釐米以上的就是高的那類也就是鴕鳥,矮的那類是第二類也就是豬,當然這裏也會出現身材矮小的鴕鳥和身高爆表的豬會被錯誤的分類。

強化學習(reinforcement learning): 智能算法在沒有人爲指導的情況下,通過不斷的試錯來提升任務性能的過程。“試錯”的意思是還是有一個衡量標準,用棋類遊戲舉例,我們並不知道棋手下一步棋是對是錯,不知道哪步棋是制勝的關鍵,但是我們知道結果是輸還是贏,如果算法這樣走最後的結果是勝利,那麼算法就學習記憶,如果按照那樣走最後輸了,那麼算法就學習以後不這樣走。

弱監督學習(weakly supervised learning): 已知數據和其一一對應的弱標籤,訓練一個智能算法,將輸入數據映射到一組更強的標籤的過程。標籤的強弱指的是標籤蘊含的信息量的多少,比如相對於分割的標籤來說,分類的標籤就是弱標籤,如果我們知道一幅圖,告訴你圖上有一隻豬,然後需要你把豬在哪裏,豬和背景的分界在哪裏找出來,那麼這就是一個已知若標籤,去學習強標籤的弱監督學習問題。

半監督學習(semi supervised learning) : 已知數據和部分數據一一對應的標籤,有一部分數據的標籤未知,訓練一個智能算法,學習已知標籤和未知標籤的數據,將輸入數據映射到標籤的過程。半監督通常是一個數據的標註非常困難,比如說醫院的檢查結果,醫生也需要一段時間來判斷健康與否,可能只有幾組數據知道是健康還是非健康,其他的只有數據不知道是不是健康。那麼通過有監督學習和無監督的結合的半監督學習就在這裏發揮作用了。

多示例學習(multiple instance learning) : 已知包含多個數據的數據包和數據包的標籤,訓練智能算法,將數據包映射到標籤的過程,在有的問題中也同時給出包內每個數據的標籤。多事例學習引入了數據包的概念,比如說一段視頻由很多張圖組成,假如1000張,那麼我們要判斷視頻裏是否有豬出現,一張一張的標註每一幀是否有豬太耗時,所以人們看一遍說這個視頻裏有豬或者沒豬,那麼就得到了多示例學習的數據,1000幀的數據不是每一個都有豬出現,只要有一幀有豬,那麼我們就認爲這個包是有豬的,所有的都沒有豬,纔是沒有豬的,從這裏面學習哪一段視頻(1000張)有豬哪一段視頻沒有就是多事例學習的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章