CUDA的編程模型

Cuda 程序的執行流程如下:

  1. 分配host內存,進行數據初始化
  2. 分別devices 內存,並從host 將數據拷貝到device上
  3. 提供cuda 的核函數,在device上完成指定計算
  4. 將device 上的運算結果拷貝到host上
  5. 釋放device 和host 上分配的內存

未完,待續。。。。

發佈了57 篇原創文章 · 獲贊 23 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章