當使用tensorflow-gpu進行模型訓練時,出現的"CUDA_ERROR_LAUNCH_TIMEOUT"的報錯,解決思路如下:
- 檢查CUDA, CuDNN, Tensorflow版本是否對應以及兼容
- 運行簡單代碼
import tensorflow as tf
zeros= tf.zeros([10,10,3])
sess = tf.Session()
print(sess.run(zeros))
如果以上代碼可以運行,則表明可能是模型過大導致的報錯,可以嘗試減小batchsize