cublas庫是在NVIDIA CUDA上實現blas(基本線性代數子程序),該庫是已經封裝好的,可以利用該庫進行向量和矩陣的多種操作
cuBLAS包含了三部分:
- cuBLAS API(從cuda6.0開始)
- CUBLASXT API(從cuda6.0開始)
- cuBLASLt API(從cuda10.1開始)
cuBLASLt API是一個輕量的矩陣-矩陣運算庫(GEMM),且句柄可以複用(類似於cuFFT的句柄可以在相同大小和數據類型的數據上覆用句柄)。
想要使用cuBLAS API,必須按照以下步驟:
- 在GPU端建立矩陣或向量,並用初始化數據填充;
- 調用需要使用的cuBLAS函數;
- 將在GPU端結果傳輸回HOST端;
ref
https://docs.nvidia.com/cuda/cublas/index.html
https://blog.csdn.net/Binbin_Sun/article/details/80977237?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase