梯度下降(BGD/SGD/MBGD)的实现

原創

2019-04-11 04:35

梯度下降法，也称最速下降法，用当前位置负梯度作为搜索方向，靠近目标值的时候收敛速度会下降；

如果为凸函数，则目标值为全局最优值，否则，会陷入局部最优的情况


import  numpy as np
from random import sample

#y_hat=theta1*x1+theta2*x2+theta3*x3
x = np.array([[1,4], [2,5], [5,1], [4,2]]  )
y = np.array([19,26,19,20] )  #实际值

w=np.array([1,1])  #初始化两个个参数,w=[theta1,theta2]

max_iter_cnt=10000 #最大迭代次数，总不能一直循环下去吧
cnt,cnt1,cnt2=0,0,0  #用于统计bgd／sgd／mbgd的迭代次数


'''evaluation function: 0.5*(y-y_hat)^2=0.5*(y-x1*theta1-x2*theta2-x3*theta3)^2 # 这里不考虑线性函数的常数项c了，对求导没啥影响
BGD / SGD / MBSG 的区别主要用于在于更新theta的样本量上，一个是全量样本都参与，一个是随机选取一个，一个是选取少量样本； bgd的缺点在于样本量比较大的时候，计算复杂度比较高；sgd的缺点在于迭代次数会增加，饶远路；所以，mbsg是比较可取的；
这里还会涉及到学习率的问题，一一般的思路是：初始设置一个较大的值，加快迭代速度；等误差小到一定程度后，减少学习率；如下代码不进行考虑了！！
'''

m=x.shape[0]
rate=0.001

#BGD
print("BGD！！")
while( cnt<max_iter_cnt ):
    cnt+=1
    for i in range(m):
        diff=w.dot(x[i,:])-y[i]
        w=w-rate*diff*x[i,:]
    error1=0
    for i in range(m):
        error1+=abs(w.dot(x[i,:])-y[i])
    if error1<0.01:
        print(w)
        print(cnt)
        print(error1)
        break;

'''
输出：
[3.00081678 3.99916927]
331
0.009885054833915774
'''

#SGD：

print("SGD！！ ")
while( cnt1<max_iter_cnt ):
    cnt1+=1
    i=sample(range(m),1)[0]
    diff=w.dot(x[i,:])-y[i]
    w=w-rate*diff*x[i,:]
    error1=0
    for i in range(m):
        error1+=abs(w.dot(x[i,:])-y[i])
    if  error1<0.01:
        print(w)
        print(cnt1)
        print(error1)
        break;

'''
输出：
SGD！！ 
[3.00083151 3.99916536]
1279
0.009996922972455025
'''

#MBGD：
print("MSGD！！ ")
while( cnt2<max_iter_cnt ):
    cnt2+=1
    sets=sample(range(m),3)
    for i in sets:
        diff=w.dot(x[i,:])-y[i]
        w=w-rate*diff*x[i,:]
    error1=0
    for i in range(m):
        error1+=abs(w.dot(x[i,:])-y[i])
    if  error1<0.01:
        print(w)
        print(cnt2)
        print(error1)
        break;

'''输出：
MSGD！！ 
[3.0008586  3.99920255]
452
0.009936281035848538
'''

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

梯度下降(BGD/SGD/MBGD)的实现

2024年DataOps趋势预测：AI不会取代数据工程师

云原生周刊：K8s 中的服务和网络｜ 2024.4.29

通过Http链接地址爬取有赞微信商城商品信息及下载至EXCEL

多人同时导出 Excel 干崩服务器！新来的阿里大佬给出的解决方案太优雅了！

[转帖]cpupower

今天，昨天，近七天，近30天，近90天，js封装

华为云云原生FinOps解决方案，释放云原生最大价值

Spark同步mysql數據到hive

Pytorch autoencoder降維

Pytorch-基於colab對中文評論使用LSTM進行情感分析

RNN的幾種結構

Isolation Forest 孤立森林的理解

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結