一、相關概念
多個線程組成線程塊,多個線程塊組成網格,網絡約等於kernel。而kernel是GPU處理的最小單元,可以理解成是一個函數。如下圖:
CPU和GPU硬件對比:
CPU和GPU編程:
二、高效策略
根據公式,有以下五種方式:
高效策略-合併全局內存
其他方式-避免線程發散:
其他方式-避免循環長度不一樣
多個線程組成線程塊,多個線程塊組成網格,網絡約等於kernel。而kernel是GPU處理的最小單元,可以理解成是一個函數。如下圖:
CPU和GPU硬件對比:
CPU和GPU編程:
根據公式,有以下五種方式:
高效策略-合併全局內存
其他方式-避免線程發散:
其他方式-避免循環長度不一樣
01 背景介紹 GPU 目前大量應用在了愛奇藝深度學習平臺上。GPU 擁有成百上千個處理核心,能夠並行的執行大量指令,非常適合用來做深度學習相關的計算。在 CV(計