cuda的cublas庫

cublas庫是在NVIDIA CUDA上實現blas(基本線性代數子程序),該庫是已經封裝好的,可以利用該庫進行向量和矩陣的多種操作
cuBLAS包含了三部分:

  • cuBLAS API(從cuda6.0開始)
  • CUBLASXT API(從cuda6.0開始)
  • cuBLASLt API(從cuda10.1開始)

cuBLASLt API是一個輕量的矩陣-矩陣運算庫(GEMM),且句柄可以複用(類似於cuFFT的句柄可以在相同大小和數據類型的數據上覆用句柄)。
想要使用cuBLAS API,必須按照以下步驟:

  • 在GPU端建立矩陣或向量,並用初始化數據填充;
  • 調用需要使用的cuBLAS函數;
  • 將在GPU端結果傳輸回HOST端;
    ref
    https://docs.nvidia.com/cuda/cublas/index.html

https://blog.csdn.net/Binbin_Sun/article/details/80977237?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章