機器學習課程總結
1. 基本任務
- 迴歸
- 線性迴歸
- 任務:迴歸&多元迴歸
- 思想:最小化所有數據點到分類平面的均方誤差
- 模型:凸優化問題
- 算法:梯度下降法
- 決策樹
- 支持向量機
- 線性迴歸
- 分類
- 邏輯迴歸
- 任務:線性分類
- 思想:最大化數據點的似然函數
- 模型:凸優化問題
- 算法:數值方法–>近似解(梯度下降法、牛頓法)
- 決策樹
- 任務:迴歸&分類
- 思想:利用分而治之的思想對數據集進行遞歸劃分
- 模型:樹形結構,利用特定準則選取屬性
- 算法:ID3, C4.5, CART等
- 感知機
- 任務:線性二分類
- 思想:最小化誤分類點到分類平面的距離
- 模型:
- 算法:梯度下降法
- 支持向量機
- 任務:分類&迴歸
- 思想:最大化數據點到分類超平面的最短距離
- 模型:凸約束優化問題
- 算法:
- 凸二次規劃可解:效率低
- 拉格朗日乘子法–>對偶問題
- 對偶模型:分類&迴歸
- 算法:SMO算法–>每次迭代都有閉式解
- 對偶模型:分類&迴歸
- 貝葉斯分類
- 神經網絡
- 任務:線性分類&非線性分類
- 思想:利用多層神經網絡對非線性可分的數據進行分類
- 模型:
- 算法:誤差逆傳播(BP)算法 = 梯度下降 + 鏈式法則
- 邏輯迴歸
- 監督學習
- 聚類
- K-means
- 任務:球狀數據聚類
- 思想:通過尋找合適的聚類中心對數據進行聚類
- 模型:非凸組合優化模型
- 算法:Lloyd算法(貪婪算法)–>局部最優
- 譜聚類
- 任務:任意形狀數據聚類
- 思想:通過對圖切問題進行鬆弛後求解
- 模型:非凸矩陣優化模型
- 算法:瑞麗商問題–>閉式解
- 層次聚類
- K-means
- 降維
- 主成分分析
- 任務:非監督降維
- 思想:最大化投影后數據的方差,最小化重建誤差
- 模型:非凸優化模型
- 算法:特徵值問題
--> 閉式解
- 線性判別分析
- 任務:監督降維
- 思想:最大化類間散度矩陣Sb,最小化類內散度矩陣Sw
- 模型:非凸優化模型
- 算法:廣義特徵值
問題 --> 閉式解
- 主成分分析
2. 要求
- 基礎知識
- 基本概念
- 數據集劃分
- 性能度量
- 描述各個任務之間的關係
- 線性迴歸
- 簡述線性迴歸問題
- 對簡單數據進行計算
- 可以編程實現線性迴歸算法
- 邏輯迴歸
- 簡述,以及與線性迴歸的異同點
- 梯度下降法、牛頓法的基本原理和迭代公式
- 編程實現
- 決策樹
- 簡述
- 會用三種算法(ID3, C4.5, CART)對數據進行分類
- 對生成的決策樹進行剪枝處理
- 感知機
- 簡述
- 解決邏輯分類問題
- 神經網絡
- 簡述
- 與感知機的關係
- BP算法的基本原理和迭代公式
- 支持向量機
- 簡述
- 與其他分類算法的異同
- 使用拉格朗日乘子法對約束優化問題進行求解,理解使用拉格朗日乘子法求解SVM問題的原因
- 簡述軟間隔支持向量機,與常規支持向量機的關係與區別
- 理解SMO算法
- K-means
- 簡述
- 簡述Lloyd算法的流程
- 理解模型的矩陣形式
- 譜聚類
- 簡述兩種圖切問題
- 簡述算法流程
- 掌握工作原理
- 與K-means的關係
- 主成分分析
- 簡述算法
- 簡述PCA算法的流程
- 核化PCA與PCA的異同
- 線性判別分析
- 簡述
- 與PCA的異同
- 簡述LDA算法的流程