tensorflow下怎麼解決語義分割交叉熵損失總是nan

本次訓練一個帶有語義分割任務的網絡,發現語義分割的交叉熵損失一直是nan,而且是從剛開始迭代就是nan,檢查了網絡一直沒發現問題,學習率調小也不起作用,推測是損失函數計算中log傳入了0,考慮到用的激活函數是tanh,會產生0值,所以考慮將激活函數換成不帶0的sigmoid函數,換完之後發現立馬就是正常損失值開始迭代了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章