機器學習基石

原創

Kylin-Xu

2020-02-20 17:03

轉自：http://www.douban.com/note/319636155/

課程地址：https://class.coursera.org/ntumlone-001/class

一，什麼是機器學習？

使用Machine Learning 方法的關鍵：
1，存在有待學習的“隱含模式”
2，該模式不容易準確定義（直接通過程序實現）
3，存在關於該模式的足夠數據

這裏的f 表示理想的方案，g 表示我們求解的用來預測的假設。H 是假設空間。
通過算法A，在假設空間中選擇最好的假設作爲g。
選擇標準是 g 近似於 f。

上圖增加了"unknown target function f: x->y“，表示我們認爲訓練數據D 潛在地是由理想方案f 生成的。
機器學習就是通過DATA 來求解近似於f 的假設g。

二，機器學習與數據挖掘、人工智能、統計學的關係

1， Machine Learning vs. Data Mining
數據挖掘是利用（大量的）數據來發現有趣的性質。
1.1 如果這裏的”有趣的性質“剛好和我們要求解的假設相同，那麼ML=DM。
1.2 如果”有趣的性質“和我們要求的假設相關，那麼數據挖掘能夠幫助機器學習的任務，反過來，機器學習也有可能幫助挖掘（不一定）。
1.3 傳統的數據挖掘關注如果在大規模數據（數據庫）上的運算效率。
目前來看，機器學習和數據挖掘重疊越來越多，通常難以分開。

2， Machine Learning vs. Artificial Intelligence(AI)
人工智能是解決（運算）一些展現人的智能行爲的任務。
2.1 機器學習通常能幫助實現AI。
2.2 AI 不一定通過ML 實現。
例如電腦下棋，可以通過傳統的game tree 實現AI 程序；也可以通過機器學習方法（從大量歷史下棋數據中學習）來實現。

3，Machine Learning vs. Statistics
統計學：利用數據來做一些位置過程的推斷（推理）。
3.1 統計學可以幫助實現ML。
3.2 傳統統計學更多關注數學假設的證明，不那麼關心運算。
統計學爲ML 提供很多方法/工具（tools）。

Kylin-Xu

發佈了7 篇原創文章 · 獲贊 13 · 訪問量 17萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習基石

AI模型 Llama 3體驗筆記

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

CIFAR dataset

What is the Best Multi-Stage Architecture for Object Recognition?

Deep learning筆記

機器學習基石

單層非監督學習網絡分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結