model checkpoint保存模型出錯問題分析

問題描述:

model在訓練的時候不斷調用 checkpoint 進行模型的報錯,但是在調用的時候回報錯:TypeError: No conversion path for dtype: dtype(’<U49’),當設置只保存模型權重的時候又會報錯:RuntimeError: Unable to create link (name already exists),綜合應該是H5文件讀寫的問題

問題分析:

針對只保存模型權重時的報錯:RuntimeError: Unable to create link (name already exists) 認爲應該是模型命名的問題(callback的使用沒有問題),因爲該模型使用了多個輸入,獲取多個輸出,類似siamese一樣,裏面有一個共同的網絡結構,有兩個輸入,有兩個輸出,因此在模型保存的時候會出現類似的情況,但是使用 model.save的時候不會出現類似的情況

解決方案:

1、自定義 callback ,重寫checkpoint進行模型的保存
2、不使用checkpoint,使用循環的方式進行model的save

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章