梯度下降原理代碼學習----師從李宏毅

原創

2020-07-01 08:28

貼出最後的用Adagrad方法原理做出來的代碼

import numpy as np
import matplotlib.pyplot as plt

x_data = [338., 333., 328., 207., 226., 25., 179., 60., 208., 606.]
y_data = [640., 633., 619., 393., 428., 27., 193., 66., 226., 1591.]
x = np.arange(-200, -100, 1)
y = np.arange(-5, 5, 0.1)
Z = np.zeros((len(x), len(y)))
X, Y = np.meshgrid(x, y)
for i in range(len(x)):
    for j in range(len(y)):
        b = x[i]
        w = y[j]
        Z[j][i] = 0
        for n in range(len(x_data)):
            Z[j][i] = Z[j][i] + (y_data[n] - b - w * x_data[n])**2
        Z[j][i] = Z[j][i]/len(x_data)
b = -120
w = -4
lr = 1
iteration = 100000
b_history = [b]
w_history = [w]
lr_b = 0
lr_w = 0
for i in range(iteration):
    b_grad = 0.0
    w_grad = 0.0
    for n in range(len(x_data)):
        b_grad = b_grad - 2.0*(y_data[n]-b-w*x_data[n])*1.0
        w_grad = w_grad-2.0*(y_data[n]-b-w*x_data[n])*x_data[n]
    lr_b = lr_b + b_grad**2
    lr_w = lr_w + w_grad**2
    b = b - lr/np.sqrt(lr_b) *b_grad
    w = w - lr/np.sqrt(lr_w) * w_grad
    b_history.append(b)
    w_history.append(w)
plt.contourf(x, y, Z, 50, alpha=0.5, cmap=plt.get_cmap('jet'))
plt.plot([-188.4], [2.67], 'x', ms=12, markeredgewidth=3, color='orange')
plt.plot(b_history, w_history, 'o-', ms=3, lw=1.5, color='black')
plt.xlim(-200, -100)
plt.ylim(-5, 5)
plt.xlabel(r'$b$', fontsize=16)
plt.ylabel(r'$w$', fontsize=16)
plt.show()

學習視頻鏈接Gradient Descent Demo

現在說一下我對代碼不懂的地方：

我覺得應該是Z[i][j]吧，第0維是len(x), 第1維是len(y).

另外，對於梯度下降微分那一點的總體處理還是不全懂。

貼一下最後結果的圖。

plt.plot(x_data, y_data, 'o')
x_result = np.array([np.min(x_data), np.max(x_data)])
y_result = x_result*w+b
plt.plot(x_result, y_result)
plt.show()

比較一下原數據和訓練之後的擬合直線。

另外幾個參數值貼一下：

w, b, lr_w, lr_b分別值爲2.669264， -188.366839， 660518642492627.125000， 6340738968.172809

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

梯度下降原理代碼學習----師從李宏毅

貼出最後的用Adagrad方法原理做出來的代碼

學習視頻鏈接Gradient Descent Demo

現在說一下我對代碼不懂的地方：

我覺得應該是Z[i][j]吧，第0維是len(x), 第1維是len(y).

另外，對於梯度下降微分那一點的總體處理還是不全懂。

貼一下最後結果的圖。

比較一下原數據和訓練之後的擬合直線。

另外幾個參數值貼一下：

w, b, lr_w, lr_b分別值爲2.669264， -188.366839， 660518642492627.125000， 6340738968.172809

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

做B站up主相薄爬蟲

【轉載】找工作經驗系列貼：實習轉正也要有思慮

windows下源碼編譯opencv+contrib庫

windows下搭建boost和PCL環境

梯度下降原理代碼學習----師從李宏毅

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結