opencl中原子鎖的使用

原創

2019-09-17 04:49

opencl的核函數執行的是並行操作，因爲每一個核函數執行的是一個細粒度的操作，所以當核函數執行的時候，相當於多個線程同時執行一個函數，區別就是這些線程輸入給函數的參數不一樣，比如對於一個圖像10*10的圖像，同時有100個線程操作，每一個線程操作一個像素，當然必須是不同的像素，所以不能有併發寫的情況發生。

比如下面的核函數：

__kernel void sync_write(__global unsigned char * rgbImage, 
                              __global float * result)
{
    int x = get_global_id(0);
    int y = get_global_id(1);
    result[x-y] += 100;
}

我們對result數組進行寫操作，因爲對於不同的線程，x-y的值可能相同，比如x=0,y=0和x=100,y=100寫入的是同一個地方，所以不能直接這樣寫。

opencl提供了原子鎖的機制，只允許同時有一個線程進入：

atomic_add(result + y - x, 100);

第一個參數是地址，第二個參數是要往這個地址增加的值。

atomic_add官方的解釋如下：

這就是說，它只支持整型元素的相加，對於浮點型和其它的類型不支持

如果遇到浮點型的相加，我們可以通過乘法將浮點型轉換爲整型，然後在cpu裏面再將整型數組轉回去，這樣的話還是比單純的cpu運算要快

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

讀書筆記-OpenCL編程指南簡介

OpenCL是Open Computing Language（開放語言的縮寫）。設立OpenCL的目的就是爲日益龐大的並行計算市場提供一個開放的、免費的行業標準。它讓開發人員能夠利用CPU、GPU等計算設備內部巨大的並行計算能力。

2020-07-05 19:57:40

讀書筆記-OpenCL編程指南 HelloWorld

main函數會實現或調用一組函數，完成以下操作：可以和OpenCL入門二：OpenCL基礎概念中的代碼進行對比 OpenCL內核 __kernel void vector_add(global const float *a,

2020-07-05 19:57:40

OpenCL - clGetPlatformIDs - clGetPlatformInfo

OpenCL - clGetPlatformIDs - clGetPlatformInfo 1. clGetPlatformIDs https://www.khronos.org/registry/OpenCL//sdk/1.2/

Yongqiang Cheng

2020-07-01 18:07:36

Windows 10 - Visual Studio 2015 - OpenCL - CUDA Toolkit 10.1 - 環境配置

Windows 10 - Visual Studio 2015 - OpenCL - CUDA Toolkit 10.1 - 環境配置 NVIDIA OpenCL SDK Code Samples https://develope

Yongqiang Cheng

2020-07-01 18:07:36

OpenCL - OpenCL Reference Pages

OpenCL - OpenCL Reference Pages OpenCL https://www.khronos.org/opencl/ Khronos OpenCL Registry https://www.khronos.

Yongqiang Cheng

2020-07-01 18:07:36

OpenCL - clGetDeviceIDs - clGetDeviceInfo

OpenCL - clGetDeviceIDs - clGetDeviceInfo 1. clGetDeviceIDs https://www.khronos.org/registry/OpenCL/sdk/1.2/docs/ma

Yongqiang Cheng

2020-07-06 03:09:13

openCL緩存對象的傳輸與映射

用GPU進行加速運行運算時，通常首先將數據copy（clEnqueueWriteBuffer）到GPU緩存對象，運算結束後，再將數據copy（clEnqueueReadBuffer）到內存；OpenCL提供了內存映射機制，無需讀寫操作，將

2020-07-04 02:51:24

安卓Opencl的環境搭建以及HelloWorld demo

最近要在安卓環境下搞搞Opencl,剛搭建成功環境,總結一下. 首先opencl是要基於JNI的,所以NDK環境必然要配好,但是君子善假於物也, 利用一些已有的東西做省時又省力. 相信大家網上找的很多教程都是基於.mk配置的教程, 202

2020-07-03 18:14:19

在NVIDIA GPU 上開發 openCL

在網上查瞭如何在 NVIDIA GPU上來運行openCL ，結果大部分都是介紹在AMD GPU上開發的。所以在此寫篇簡單例子，介紹在NVIDIA GPU 上開發。 NVIDIA的顯卡上，cuda裝好opencl就自然有了，所以裝cu

2020-07-01 22:28:19

Heterogeneour Computing with OpenCL 2.0 - OpenCL 2.0 異構計算 (中文)

Heterogeneour Computing with OpenCL 2.0 - OpenCL 2.0 異構計算 (中文) Heterogeneour Computing with OpenCL 2.0 (Thrid Editi

Yongqiang Cheng

2020-07-01 18:07:36

《Mali OpenCL SDK v1.1.0》教程樣例之二“程序模板”

　　在OpenCL SDK根目錄下的samples/template，存有程序的模板，其中“template.cpp”是宿主機代碼模板，“assets/template.cl”是內核代碼模板。“template.cpp”使用了commo

2020-06-28 09:37:44

《Mali OpenCL SDK v1.1.0》教程樣例之四“圖像對象”

介紹　　紋理(圖像)是現代圖像應用的很大一部分。正因爲如此，圖形硬件已經發展到允許高訪問性能地對紋理進行訪問和操作。爲充分使用這一硬件，OpenCL包括了一個可選的圖像數據類型。這些"圖像對象"在所有Mali-T600系列GPU上受

2020-06-28 09:37:44

高通平臺下安卓opencl小例子

1、從高通官網下載Adreon SDK（需要註冊爲會員） 2、解壓以後，把文件夾Development/Inc/內的CL文件夾拷貝到：android-ndk-r9d/platforms/android-19/arch-arm/usr/in

2020-06-28 02:19:12

用OpenCL實現HEVC中ME模塊的測試數據分析

使用opencl來實現編碼算法中運動搜索模塊！下面測試數據時在GTX570上的測試結果： LCU爲32x32, 100幀720P, CPU上純C算法使用搜索時間是67s, GPU上是0.915s LCU爲16x16, CPU 是

2020-06-26 15:08:01

opencl

1、CUDA和OpenCL的區別 http://blog.sina.com.cn/s/blog_6fb9f559010101bx.html 2、理解OpenCL中的工作組、工作項的索引 https://blog.csdn.net/zhou

2020-06-23 17:34:31

24小時熱門文章

最新文章

最新評論文章