機器學習基石

轉自:http://www.douban.com/note/319636155/

課程地址:https://class.coursera.org/ntumlone-001/class

一,什麼是機器學習?


使用Machine Learning 方法的關鍵:
1, 存在有待學習的“隱含模式”
2, 該模式不容易準確定義(直接通過程序實現)
3, 存在關於該模式的足夠數據
 


這裏的f 表示理想的方案,g 表示我們求解的用來預測的假設。H 是假設空間。
通過算法A, 在假設空間中選擇最好的假設作爲g。
選擇標準是 g 近似於 f。

 

上圖增加了"unknown target function f: x->y“, 表示我們認爲訓練數據D 潛在地是由理想方案f 生成的。
機器學習就是通過DATA 來求解近似於f 的假設g。

二, 機器學習與數據挖掘、人工智能、統計學的關係

1, Machine Learning vs. Data Mining
數據挖掘是利用(大量的)數據來發現有趣的性質。
1.1 如果這裏的”有趣的性質“剛好和我們要求解的假設相同,那麼ML=DM。
1.2 如果”有趣的性質“和我們要求的假設相關,那麼數據挖掘能夠幫助機器學習的任務,反過來,機器學習也有可能幫助挖掘(不一定)。
1.3 傳統的數據挖掘關注如果在大規模數據(數據庫)上的運算效率。
目前來看,機器學習和數據挖掘重疊越來越多,通常難以分開。

2, Machine Learning vs. Artificial Intelligence(AI)
人工智能是解決(運算)一些展現人的智能行爲的任務。
2.1 機器學習通常能幫助實現AI。
2.2 AI 不一定通過ML 實現。
例如電腦下棋,可以通過傳統的game tree 實現AI 程序;也可以通過機器學習方法(從大量歷史下棋數據中學習)來實現。

3,Machine Learning vs. Statistics
統計學:利用數據來做一些位置過程的推斷(推理)。
3.1 統計學可以幫助實現ML。
3.2 傳統統計學更多關注數學假設的證明,不那麼關心運算。
統計學爲ML 提供很多方法/工具(tools)。
發佈了7 篇原創文章 · 獲贊 13 · 訪問量 17萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章