https://github.com/tensorflow/models/issues/4881
問題二:
GPU訓練對顯存與內存使用是基於貪心算法,它會一直嘗試獲取更多內存,大概訓練了100左右step就會爆出如下的錯誤:
tensorflow.python.framework.errors_impl.InternalError: Dst tensor is not initialized.
網絡使用GPU訓練時,一般當GPU顯存被佔滿的時候會出現這個錯誤
解決的方法,就是在訓練命令執行之前,首先執行下面的命令行:
Windows SET CUDA_VISIBLE_DEVICES=0
Linux export CUDA_VISIBLE_DEVICES=0
然後訓練就會很順利的執行下去