英偉達
GTX 1080TI Pascal™ 結構
T4卡 基於Turing架構
P4卡 Pascal™ 結構
V100 基於Volta架構
在某一個架構上進行序列化, 就應該在這個架構上測試, 否則會報錯
tensorRT:NVIDIA TensorRT是一種高性能神經網絡推理(Inference)引擎,用於在生產環境中部署深度學習應用程序,應用有圖像分類、分割和目標檢測等,可提供最大的推理吞吐量和效率。TensorRT是第一款可編程推理加速器,能加速現有和未來的網絡架構。TensorRT需要CUDA, libnvinfer的支持
cudnn/libnvinfer
cuda8/9/10
參考:https://www.zhihu.com/question/60161133
https://blog.csdn.net/fengbingchun/article/details/78469551