機器學習(吳恩達)-1 概論、監督學習與無監督學習——學習筆記

機器學習(Machine Learning)是從人工智能(AI)中發展出來的一個領域,機器學習的幾個比較重要的應用有:

  1. 數據挖掘(Database mining)
  2. 我們無法手動編寫的程序(Application can't by hand)(如自然語言處理、計算機視覺、直升機自動駕駛)
  3. 量身定製的程序(self-customizing programs)(網易雲音樂的喜好推薦)
  4. 理解人類的學習過程和大腦(understanding human learning)

 

對於機器學習的定義如下:

Tom Mitchell(1998):

Well-posed Learning problem:A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience E.

即:計算機程序從經驗E中學習,解決某一任務T,進行某一性能度量P,通過P測定在T上的表現因經驗E而提高。

用跳棋遊戲來舉例,一個跳棋程序通過幾千幾萬次與自己進行跳棋遊戲,根據每次與對手對弈時贏的概率得出最好的下棋策略,那麼

E——程序與自己進行幾萬次遊戲

T——玩跳棋

P——與新對手玩跳棋贏的概率 

 

機器算法可分爲:監督學習(supervised learning)與無監督學習(unsupervised learning)。

 

監督學習(supervised learning)指:通過已知的(正確的)數據,來使用算法預測並得出“正確答案”。

而監督學習較典型的問題有:迴歸問題(regression problem)與分類問題(classification problem)。

其中迴歸問題的迴歸是指我們的目標是預測一個連續值輸出,而分類問題的目的是預測離散值的輸出。

 

無監督學習(unsupervised learning)指:通過給大量無類型、無歸類的數據,要求找出數據的類型結構。

例如聚類算法(clustering algorithm),使用聚類算法的目的是將同類型的數據放在一起,如社交網絡分析(social network analysis)——用來分析某用戶聯繫最頻繁的人,從而找出同一朋友圈的人。

 

監督學習與無監督學習的區別在於,監督學習已給出的數據有確定的類型(如某腫瘤爲良性腫瘤或惡性腫瘤),通過大量的已知數據,來判定某一未知數據的性質;而無監督學習只給出了數據的特點,並沒有確定其性質的劃分,目的是通過給出的大量無類型數據,將這些數據根據特點劃分到適合的羣組中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章