關於交叉熵的理解

我覺得下面的文章講得不錯,通過穿衣服和天氣例子的引入,一步步講述編碼長度等理論,引入交叉熵是爲了表徵預測結果與真實結果的差異

最重要的公式:
Hp(q)=xq(x)log2(1p(x)) H_p(q)=\sum_{x}q(x)log_2(\frac{1}{p(x)})
以及
Dq(p)=Hq(p)H(p) D_q(p)=H_q(p)-H(p)

原文鏈接(注:英文版):
http://neuralnetworksanddeeplearning.com/chap3.html#softmax

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章