OpenCL 笔记




cl_mem, program, kernel 都是在context下创建, 可用于这个context下的所有device上;

一个OpenCL kernel, 大概可以分为两类, 一类是对workgroup属性没有要求的,这种kernel就相当于不划分workgroup也一样,每个workitem计算的执行完全一样;

另一类是对workgroup的大小和个数有要求的, 或这对其中之一有要求,比如是某整数倍等;

后面这种情况下的划分, 同时也就决定了输入 cl_mem 和 输出cl_mem 对实际要计算数据的布局 (因为选定了workgroup个数后, 所有workitem覆盖的计算范围一定大于等于输入和输出cl_mem), 布局比如说是 实际计算的数据在cl_mem的中间,或靠左靠右靠上靠下,或靠一个角,都有可能;

单不管是哪一种, 数据大小和cl_mem的留白大小也是各种可能;

因此 一般情况下, 一个kernel的参数大概可以分为三类, 一类似是输入输出cl_mem 和 local cl_mem;  二是描述比如留白决定的比如跨距等一类的信息,具体决定item怎么取操作cl_mem; 三就是计算类的参数, 比如循环次数,固定的传参等等;

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章