B

1.G
- 存儲器 可見性(顯存【訪問速度慢】 片上寄存器、緩存)
寄存器 當前線程
局部存儲器 線程私有
共享存儲器 可被同一block中多有線程訪問的可讀寫存儲器
全局存儲器 CPU/GPU都可讀寫訪問【合併訪問,避免分區衝突】
常數存儲器 顯存、只讀、緩存加速【緩存命中,half-warp同一數據,一個週期】【無緩存一致性問題】
紋理存儲器 只讀,非專門存儲器,顯存+兩級紋理緩存、紋理拾取單元的紋理流水線;1 2 3維數組,緩存加速,大量數據的隨機或者非對齊訪問有良好加速效果
各種架構圖 p127
活動的block少,原因:爲什麼線程數>core 原因:
最大活動線程數=core,某block線程佔用的資源多
分配太多線程>>core:解決辦法:一個線程多個任務,較少使用線程總數。
硬件 軟件概念映射 grid block thread/ SM SP core
2.算法
合併有序鏈表
臺階 count[n]=count[n-1]+count[n-2]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章