問題描述: 訓練了大概6個epoch 模型在cpu上的loss開始出現nan,在gpu上表現正常
經查找資料https://www.oschina.net/question/3683714_2266089 這位兄臺和我遇到了同樣的問題,然而他並沒有解決
https://www.zhihu.com/question/62441748
這位兄臺給出了一個解釋,但是和我的模型問題應該不相同,因爲我的RNN模型的換了激活函數(relu-->sigmoid)後表現正常,因此應該不是標籤的問題
問題仍未解決,懇請各位大佬不吝賜教