原创 基於CUDA的GPU優化建議

l GPU硬件特性 n 存儲層次 u Global memory: l 大小一般爲幾GB l chip-off的DRAM介質存儲器 l 訪問速度慢(是shared memory的上百倍) l 對於是否對齊和連續訪問敏感(由DRAM的性質