【深度學習】logistic regression 中的反向傳播 (Back Propagation)

原創

2020-06-19 18:40

logistic regression 中的反向傳播 (back propagation)

梯度下降

在《深度學習中的 logistic regression》一文中，最後我們得到了 logistic regression 的 cost function :
$J(\omega,\beta)={1\over m}\sum_i\mathscr{L}(\hat y, P(y|x))$
接下來只需要用梯度下降求解 cost function 的極小值。

現在我們在 logistic regression 中有兩個參數， $z=x^T\omega+\beta$ ，權重 $\omega$ ，偏置 $\beta$ 。
因此梯度下降爲：
$\begin{aligned}\\ \{&\\ &\quad\quad\quad\quad\omega:=\omega-\alpha{\partial J(\omega,\beta)\over\partial\omega}\\ \\ &\quad\quad\quad\quad\beta:=\beta-\alpha{\partial J(\omega,\beta)\over\partial\beta}\\ \}&\\ \end{aligned}$

其中 $\alpha$ 爲學習率（超參數）。
接下來的未知量只有 ${\partial J(\omega,\beta)\over\partial\omega}$ 和 ${\partial J(\omega,\beta)\over\partial\beta}$ 。所以接下來的問題就是求解這兩個值，這兩個值我們會把它叫做 $J(\omega,\beta)$ 的梯度，記爲 $\nabla J(\omega,\beta)$ 。即：
$\nabla J(\omega,\beta)=\begin{bmatrix}\\ {\partial J(\omega,\beta)\over\partial\omega}\\ {\partial J(\omega,\beta)\over\partial\beta}\\ \end{bmatrix}$

因此我們把這個算法叫做梯度下降。

現在我們要求解梯度，就需要用到 反向傳播 求梯度下降。

反向傳播

我們先來看一個普遍的正向傳播。

那它的反向傳播長什麼樣呢？

紅色線就是表示的反向傳播，每條線代表
我們先看一下在 loss function 前的反向傳播。

這個是正向的傳播，有目前的 $\omega$ 和 $\beta$ 計算 $z$ ，然後通過 $\sigma(z)$ 計算 $\hat y$ ，其中 $\hat y$ 表示 $P(y = 1 | x)$ ，然後通過 $loss function$ 計算出 loss。
接下來如果我們已經求出 loss 了，我們要對 $\omega$ 和 $\beta$ 進行修正。
也就是要求反向傳播。

先把舊稿發出，未完待續。(或許沒有後續？？？)
~~想被催更~~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【深度學習】logistic regression 中的反向傳播 (Back Propagation)

logistic regression 中的反向傳播 (back propagation)

梯度下降

反向傳播

電子科技大學計算機科學與技術就讀體驗

Golang爬蟲代理接入的技術與實踐

【深度學習】logistic regression 中的反向傳播 (Back Propagation)

【深度學習】Grad-CAM 使用 MNIST + LeNet 基於 tensorflow 生成分類器對於數據的位置權重(熱圖 HeatMap)

【深度學習】GoogLeNet 中 inception v2 (filter: 33，1n) 的 tensorflow 的簡單實現(沒有使用 slim)

【深度學習】CNN + CIFAR10 學習筆記(數據輸入 mini-batch)(基於 TENSORFLOW)

【機器學習】用 tensorflow 實現隨機森林 RandomForest in tensorflow (mnist 示例)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結