開始有CUDA 2.2 Beta版了!

從CUDA英文官方網站上看到以下信息:

 

CUDA 2.2 Beta is now available to registered CUDA Developers. Sign up here to get access.

 

可惜,還不是正式發佈。呵呵。

 

由於沒有註冊成開發者,只搞到了一份編程指南,發現其中還是有不少新鮮功能的:

 

最好新功能的就是kernel可以訪問"不可移動"的主機內存了!而且,指南中建議用這一功能取代以前的
cudaMemcpy函數。因爲,第一隻有kernel用到時才啓動實際傳送;第二,對host而言,是完全異步的,
不用再等待傳送結束。
但實際數據估計還是要按以下方式傳送:HOST->PCI-E->GMEM->KERNEL。
這就帶來幾個疑問,要實際試驗後才能確定:(目前沒有找到任何資料說明。V.V )
1)GMEM->KERNEL還該有衝突問題存在。
2)PCI-E->GMEM一次傳送多少字節?是正好要用的字節數,還是有"預讀取"的功能。
3)PCI-E->GMEM是一次啓動還是多次啓動?是否影響傳送性能?

 

另外說一句,訪問主機內存功能在Stream中早已提供,這次CUDA也總算有了。呵呵。

 

其次,就是2.2版本實現了一個內存訪問柵欄,可以保證在柵欄前寫入內存的數據可以"完整地"在柵欄後被
(同一block/所有)其他線程正確讀取。(即線程到柵欄後等待其他線程的內存訪問全部結束後再向下走)
想法不錯,不過,因爲是所有線程同步,而線程往往不是都在活動狀態,故對處理流水線該有一次清空和重
啓動過程,對性能該有一定的影響,還要謹慎使用。
這點可以參考cyrosly的blog中所提到的試驗:
《完全GPU化的reduce算法實現以及性能評估》
http://blog.csdn.net/Cyrosly/archive/2009/03/31/4038474.aspx

 

這次版本比2.1版給我們帶來了更多的新功能,期待其正式release的那天。

發佈了23 篇原創文章 · 獲贊 2 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章