吳恩達機器學習系列(一)——引言及入門

1 前言

前幾日回學校與實驗室老師進行了短暫交流,研究生備考這兩年實驗室發生了好多變化,據老師說目前實驗室差不多已經全部轉型爲人工智能實驗室了,還起了個洋氣的名字“π實驗室”。
備考這兩年,很多東西差不多都快斷層了。想必研究生階段應該也是要學習機器學習相關的理論知識了,想來先下手爲強。據老師推薦,決定從斯坦福大學吳恩達老師的機器學習視頻課入門。(老師對吳老師的這套課評價很高)

2 機器學習入門

2.1 吳恩達機器學習系列課程目錄

根據視頻,我對整套視頻課的理論體系進行了簡單的整理,以求一個清晰的理論目錄。圖2.1 吳恩達機器學習課程目錄

2.2 機器學習分類

1 分類圖示

圖2.2 機器學習分類

2 幾個概念理解

  1. 機器學習
    將很多數據丟給計算機分析,以此來訓練該計算機,培養計算機給數據分類的能力。換句話說,學習指的就是找到特徵(數據的特徵,例如一本書的內容)與標籤(數據的標籤,例如書所屬的類別)的映射(mapping)關係。這樣當有特徵而無標籤的未知數據輸入時,我們就可以通過已有的關係得到未知數據標籤。
  2. 監督學習
    監督學習是指:利用一組已知類別的樣本調整分類器的參數,使其達到所要求性能的過程,也稱爲監督訓練或有教師學習。換句話說,監督學習不僅把訓練數據丟給計算機,而且還把分類的結果(數據具有的標籤)也一併丟給計算機分析。
    計算機進行學習之後,再丟給它新的未知的數據,它也能計算出該數據導致各種結果的概率,給你一個最接近正確的結果。
  3. 無監督學習
    現實生活中常常會有這樣的問題:缺乏足夠的先驗知識,因此難以人工標註類別或進行人工類別標註的成本太高。很自然地,我們希望計算機能代我們完成這些工作,或至少提供一些幫助。根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之爲無監督學習。換句話說,無監督學習只給計算機訓練數據,不給結果(標籤),因此計算機無法準確地知道哪些數據具有哪些標籤,只能憑藉強大的計算能力分析數據的特徵,從而得到一定的成果,通常是得到一些集合,集合內的數據在某些特徵上相同或相似。
  4. 監督迴歸問題
    定量輸出稱爲迴歸,或者說是連續變量預測。即根據給出的數據預測出一個準確的輸出值。例如:房價預測問題
  5. 監督分類問題
    定性輸出稱爲分類,或者說是離散變量預測。即根據給出的數據預測該數據所屬類別。例如:腫瘤預測問題

3 參考材料

1 https://www.jianshu.com/p/33f3dda41554
2 https://baike.baidu.com/item/%E7%9B%91%E7%9D%A3%E5%AD%A6%E4%B9%A0
3 https://baike.baidu.com/item/%E6%97%A0%E7%9B%91%E7%9D%A3%E5%AD%A6%E4%B9%A0/810193

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章