机器学习-吴恩达 p51 笔记

话不多说,先粘上几个比较重要的图

       这里有个推导g'(z^{(3)})=a^{(3)}.*(1-a^{(3)})

       因为

                                                                         g(z^{(3)})=a^{(3)}

                                                           g(z^{(3)})=\frac{1}{1+e^{-z^{(3)}}}=a^{(3)}

       那么

                         g'(z^{(3)})=\frac{1+e^{-z^{(3)}}-1}{(1+e^{-z^{(3)}})^2}=\frac{1}{1+e^{-z^{(3)}}}*(1-\frac{1}{1+e^{-z^{(3)}}})=a^{(3)}.*(1-a^{(3)})

 

 

      个人觉得这份伪代码的i容易给人造成歧义。其中的x^{(i)}y^{(i)}中的i表示第i组数据。而\Delta _{ij}^{(l)}中的i表示第l​​​​​​​层的第i行第j列的元素。

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章