一、相关概念
多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:
CPU和GPU硬件对比:
CPU和GPU编程:
二、高效策略
根据公式,有以下五种方式:
高效策略-合并全局内存
其他方式-避免线程发散:
其他方式-避免循环长度不一样
多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:
CPU和GPU硬件对比:
CPU和GPU编程:
根据公式,有以下五种方式:
高效策略-合并全局内存
其他方式-避免线程发散:
其他方式-避免循环长度不一样
01 背景介紹 GPU 目前大量應用在了愛奇藝深度學習平臺上。GPU 擁有成百上千個處理核心,能夠並行的執行大量指令,非常適合用來做深度學習相關的計算。在 CV(計