线程束洗牌指令

对一个给定线程计算其线程束-束内索引和线程束索引的公式如下

laneID = threadIdx.x % 32

warpID = threadIdx.x / 32

有两组洗牌指令,分为整数型和浮点型,每组有4种形式的洗牌指令

1.

int __shf1(int var, int srcLane, int width=warpSize);

2.

int __shf1_up(int var, unsigned int delta, int width=warpSize);

3.

int __shf1_down(int var, unsigned int delta, int width=warpSize);

4.

int __shf1_xor(int var, int laneMask, int width=warpSize);

 

 

在本节讨论的所有洗牌函数还支持单精度浮点值。浮点洗牌函数采用浮点型的var参 数,并返回一个浮点数。否则,浮点洗牌函数就与整型洗牌函数相同了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章