這個是CUDA裏面最基本最重要的問題了,一定要非常清楚:
函數定義的時候不需要加上這個符號,只有在調用函數的時候才需要——它被用於指定函數在GPU中具體怎樣去執行(分多少block,block是多少維度;每個block分多少thread,維度,幾行幾列多少深度等等;需要多少shared memory):
函數名<<<第一個參數,第二個參數,第三個參數>>>(...);
第一個參數:grid裏有多少個塊,是怎樣組織的(維度,幾行幾列多深)
第二個參數:每個block裏有多少個thread,是怎樣組織的(維度,幾行幾列多深)
第三個參數:shared memory大小,可以省略。
參見“深入淺出”P10,和"指南"的P5,以及本人的系列文章: