cuda编程(2):软硬件编程模型以及高效策略

原视频

一、相关概念

多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:

CPU和GPU硬件对比:

CPU和GPU编程:

二、高效策略

根据公式,有以下五种方式:

高效策略-合并全局内存

其他方式-避免线程发散:

其他方式-避免循环长度不一样

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章