批量梯度下降和隨機梯度下降matlab 實現

原創

2020-02-26 01:02

文章出處：

【Machine Learning實驗1】batch gradient descent（批量梯度下降）和 stochastic gradient descent（隨機梯度下降）

http://blog.csdn.net/pennyliang/article/details/6998517

上面是作者的blog，代碼採用的是C的，我這裏採用了比較簡便的matlab方式。

批量梯度下降是一種對參數的update進行累積，然後批量更新的一種方式。用於在已知整個訓練集時的一種訓練方式，但對於大規模數據並不合適。

隨機梯度下降是一種對參數隨着樣本訓練，一個一個的及時update的方式。常用於大規模訓練集，當往往容易收斂到局部最優解。

詳細參見：Andrew Ng 的Machine Learning的課件（見參考1）

可能存在的改進

1）樣本可靠度，特徵完備性的驗證

例如可能存在一些outlier，這種outlier可能是測量誤差，也有可能是未考慮樣本特徵，例如有一件衣服色彩評分1分，料子1分，確可以賣到10000萬元，原來是上面有一個姚明的簽名，這個特徵沒有考慮，所以出現了訓練的誤差，識別樣本中outlier產生的原因。

2）批量梯度下降方法的改進

並行執行批量梯度下降

3）隨機梯度下降方法的改進

找到一個合適的訓練路徑（學習順序），去最大可能的找到全局最優解

4）假設合理性的檢驗

H（X)是否合理的檢驗

5）維度放大

維度放大和過擬合問題，維度過大對訓練集擬合會改善，對測試集的適用性會變差，如果找到合理的方法？

下面是我做的一個實驗

假定有這樣一個對衣服估價的訓練樣本，代碼中matrix表示，第一列表示色彩的評分，第二列表示對料子質地的評分，例如第一個樣本1,4表示這件衣服色彩打1分，料子打4分。我們需要訓練的是theta，其表示在衣服的估價中，色彩和料子的權重，這個權重是未知量，是需要訓練的，訓練的依據是這四個樣本的真實價格已知，分別爲19元，...20元。

通過批量梯度下降和隨機梯度下降的方法均可得到theta_C={3,4}T

/*
Matrix_A
1 4
2 5
5 1
4 2
theta_C

?
Matrix_A*theta_C
19
26
19
20
*/

批量梯度下降法：

隨機梯度下降法：

參考文獻：

【1】http://www.stanford.edu/class/cs229/notes/cs229-notes1.pdf

【2】http://www.cnblogs.com/rocketfan/archive/2011/02/27/1966325.html

【3】http://www.dsplog.com/2011/10/29/batch-gradient-descent/

【4】http://ygc.name/2011/03/22/machine-learning-ex2-linear-regression/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

批量梯度下降和隨機梯度下降matlab 實現

文章出處：

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

java由於越界導致的報錯

線性轉化與座標軸收縮(linear transform and ollapsed on some axis)

淺談矩陣乘法與矩陣二次型

Representive learning: A review and New respective

Correlation Filter in Visual Tracking系列一

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置說明

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結