開始有CUDA 2.2 Beta版了！

從CUDA英文官方網站上看到以下信息：

CUDA 2.2 Beta is now available to registered CUDA Developers. Sign up here to get access.

可惜，還不是正式發佈。呵呵。

由於沒有註冊成開發者，只搞到了一份編程指南，發現其中還是有不少新鮮功能的：

最好新功能的就是kernel可以訪問"不可移動"的主機內存了！而且，指南中建議用這一功能取代以前的
cudaMemcpy函數。因爲，第一隻有kernel用到時才啓動實際傳送；第二，對host而言，是完全異步的，
不用再等待傳送結束。
但實際數據估計還是要按以下方式傳送：HOST->PCI-E->GMEM->KERNEL。
這就帶來幾個疑問，要實際試驗後才能確定：(目前沒有找到任何資料說明。V.V )
1)GMEM->KERNEL還該有衝突問題存在。
2)PCI-E->GMEM一次傳送多少字節？是正好要用的字節數，還是有"預讀取"的功能。
3)PCI-E->GMEM是一次啓動還是多次啓動？是否影響傳送性能？

另外說一句，訪問主機內存功能在Stream中早已提供，這次CUDA也總算有了。呵呵。

其次，就是2.2版本實現了一個內存訪問柵欄，可以保證在柵欄前寫入內存的數據可以"完整地"在柵欄後被
(同一block/所有)其他線程正確讀取。(即線程到柵欄後等待其他線程的內存訪問全部結束後再向下走)
想法不錯，不過，因爲是所有線程同步，而線程往往不是都在活動狀態，故對處理流水線該有一次清空和重
啓動過程，對性能該有一定的影響，還要謹慎使用。
這點可以參考cyrosly的blog中所提到的試驗:
《完全GPU化的reduce算法實現以及性能評估》
http://blog.csdn.net/Cyrosly/archive/2009/03/31/4038474.aspx

這次版本比2.1版給我們帶來了更多的新功能，期待其正式release的那天。

無心人_過過小日子

發佈了23 篇原創文章 · 獲贊 2 · 訪問量 4萬+

私信關注

開始有CUDA 2.2 Beta版了！

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

sql求連續值問題

cs01 CSS Syntax

sql server sp_executesql 中使用表變量進行查詢

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

看了N篇cuda相關文章，好累！

終於安裝完CUDA開發(硬件)平臺了

開始有CUDA 2.2 Beta版了！

使用CUDA驅動API的簡單例子

2014年年末感想

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結