專欄【機器學習】
【機器學習】林軒田《機器學習基石》課程學習筆記 總目錄
——————————————————————————————————————————————————————
一、What is Machine Learning
Course Design
主要是四個方面:
- when
- why
- how
- better
From Learning to Machine Learning
-
學習:通過觀察積累經驗獲得技能
-
機器學習:根據數據積累/計算經驗獲得技能
A More Concrete Definition
Yet Another Application: Tree Recognition
“定義”樹和手工編程識別一個樹,這是相當困難的。
- 從數據(觀察)中學習並認識到:一個3歲的孩子可以這樣做。
- “基於ML的樹識別系統”比手工編程系統更容易構建。
Key Essence of Machine Learning
什麼情況下使用ML來解決問題呢?三種情況:
- 事物本身存在某種潛在規律
- 某些問題難以使用普通編程解決
- 有大量的數據樣本可供使用
二、Applications of Machine Learning
Daily Needs: Food, Clothing, Housing, Transportation
ML在很多方面都有着應用,比如衣、食、住、行,簡單總結爲ML is everywhere!
- 1、食品(Sadilek等人,2013)
- 數據:Twitter數據(字+位置)
- 技能:正確地告訴食物中毒的可能性或餐館
- 2、服裝(阿布-莫斯塔法,2012)
- 數據:銷售數字+客戶調查
- 技能:向客戶提供良好的時尚建議
- 3、住房(Tsanas和Xifara,2012年)
- 數據:建築物特徵及其能量負荷
- 技能:密切預測其他建築的能源負荷
- 4、交通運輸(Stallkamp等人,2012年)
- 數據:一些交通標誌圖像和含義
- 技能:準確識別交通標誌
Education
ML在教育方面也有應用。
- 數據:學生關於數學輔導系統測驗的記錄
- 技能:預測學生是否可以對另一個測驗問題給出正確的答案
Entertainment: Recommender System
ML在娛樂方面也有應用。
- 數據:有多少用戶對某些電影進行了評級
- 技能:預測用戶對未分級電影的評價
從而引發了一個具體的ML方向:推薦系統。
三、Components of Machine Learning
Formalize the Learning Problem
基本術語:
- 輸入x
- 輸出y
- 目標函數f
- 訓練樣本D
- 假設g
Learning Flow for Credit Approval
- 目標f未知(即無可編程定義)
- 假設,但可能不同於(未知時“不可能”完美)
The Learning Model
Practical Definition of Machine Learning
對於理想的目標函數f,我們是不知道的,手上拿到的是一些訓練樣本D,假設是監督式學習,其中有輸入x,也有輸出y。
機器學習的過程,就是根據先驗知識選擇模型,該模型對應的hypothesis set(用H表示),H中包含了許多不同的hypothesis,通過演算法A,在訓練樣本D上進行訓練,選擇出一個最好的hypothes,對應的函數表達式g就是我們最終要求的。一般情況下,g能最接近目標函數f,這樣,機器學習的整個流程就完成了。
四、Machine Learning and Other Fields
Machine Learning and Data Mining
Machine Learning and Artificial Intelligence
Machine Learning and Statistics