softmax損失函數的求導

可以參考:https://blog.csdn.net/qian99/article/details/78046329

第一篇博客中:

將   C=-\sum_{i} y_{i} \ln a_{i}      定義成:

 

   L_{i}=-\sum_{j=1}^{k} 1\left\{y_{(i)}=j\right\} \log \frac{e^{\tilde{z}_{j}}}{\sum_{l=1}^{k} e^{\dot{z}_{k}}}=-\hat{y}_{i} \ln y_{i}  

或者:   

  L=-\frac{1}{m}\left[\sum_{i=1}^{m} \sum_{j=1}^{k} 1\left\{y_{(i)}=j\right\} \log \frac{e^{z_{j}}}{\sum_{t=1}^{k} e^{z_{k}}}\right]

                 =-\frac{1}{m}\left[\sum_{i=1}^{m} \hat{y}_{i} \log \frac{e^{z_{i}}}{\sum_{t=1}^{k} e^{z_{k}}}\right]=-\frac{1}{m}\left[\sum_{i=1}^{m} \hat{y}_{i} \log y_{i}\right]

將會更加容易理解

 

 

https://www.cnblogs.com/zongfa/p/8971213.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章