GPU（CUDA）學習日記（十）------ Kernal 內核函數參數的傳遞

原創

2018-08-29 16:32

之前做了一個項目，內核函數什麼的編寫都沒有問題，但是處理完的圖片就是會產生條紋，這個問題困擾了我很長時間（真的很長時間。。。），我的內核函數傳入的參數有很多，我做過實驗，在host函數中給所有的參數都cudamalloc顯卡空間（當初以爲這樣處理會更省顯存一些，畢竟是開闢的線性存儲器globle memory空間），但是實驗結果是每一個參數都開闢cudamalloc的話，速度會降低，顯卡的顯存也沒有實質性的節省（反而感覺少了~）。不明白其中的道理，後來查了一下，看了許多大家的看法，最後得出的結論是：

1、在fermi架構之前的參數都是在shared mem中的，而fermi這代則全都放在了constant memory裏，內核參數在global memory裏沒有副本。

2、反覆對constant memory中的數值進行賦值與調用會發生意外錯誤，因爲你不知道內部具體的線程的執行順序，尤其是一個線程中for循環的時候。

3、內核函數中申請的變量都會存儲在寄存器中，所以參數如果過多的話，會大大降低寄存器的效率。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

cuda編程（7）：實現LK稀疏光流算法--完整的cuda程序

一、原理二、算法的假設（其實這樣的條件比較苛刻）三、具體實現 main.cc #include <opencv2/opencv.hpp> #include <opencv2/core/core.hpp> #include <o

2020-07-08 04:59:53

cuda編程（6）：實現knn算法

暴力實現的複雜度：實現分析：完整的代碼： Ubuntu運行命令： nvcc -o knn_cuda_with_indexes.exe knn_cuda_with_indexes.cu -lcuda -D_CRT_SECURE_

2020-07-08 04:59:52

MNIST數據集手寫數字識別

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

Linux 安裝Nvidia GPU顯卡驅動

文章目錄安裝Nvidia GPU驅動什麼是nouveau驅動？Centos7.7安裝Nvidia GPU驅動Ubuntu 18.04安裝Nvidia GPU驅動準備工作開始安裝安裝cuda檢測NVIDIA驅動是否成功安裝集顯與獨顯

2020-07-07 23:16:19

GPU查看指令

1、nvidia-smi 2、gpustat 首先要確定已安裝 pip install gpustat

2020-07-07 19:01:29

關於Texture Cache簡單總結

Texture Cache是一個存儲圖片數據的只讀cache 按照正常uv順序讀貼圖tex cache有高命中率 Texture Cache在 shader processor附近，所以它有高吞吐率，並且低延遲上圖可見有許多 shad

2020-07-07 12:30:42

cuda編程可以使用的庫函數

一、NPP 它是NVIDIA公司針對GPU加速圖像、視頻、信號處理庫（NPP全稱是NVIDIA Performance Primitives）。事實上，NPP和IPP（Integrated Performance Primitives）庫

2020-07-08 04:59:52

cuda編程（5）：優化理論

一、優化原則最大化算術強度；減少內存操作花費時間；合併全局內存訪問；避免線程發散；把高頻使用數據移動到共享內存；二、縱向優化的流程與步驟一般包括如下步驟： 1.1 分析分析程序的瓶頸、什麼地方需要做並行、能夠提供資源。不要

2020-07-08 04:59:52

cuda編程（4）：常見的例程

一、直方圖在Ubuntu系統的運行命令： nvcc -o histo histo.cu #include <cuda_runtime.h> #include <device_launch_parameters.h> #include

2020-07-08 04:59:52

CUDA3.1 X32 + Windows 7 32bit + Visual Studio 2005 + Visual assist安裝指南

1. 安裝CUDA Driver，toolkit，SDK a) 建議driver，toolkit，SDK的順序，默認路徑安裝 b) 如果筆記本用戶，可以選擇強行安裝3.1的驅動包（選擇對應臺式機的型號），但是會有部分遊戲隨機花屏等問題。可

2020-07-08 02:16:14

Installing CUDA Toolkit 5.0 on CentOS 6.4

1、Verify You Have a CUDA-Capable GPU lspci | grep -i nvidia 2、Verify Yo

2020-07-08 01:36:18

“no cuda-capable device is detected”問題解決方法

僅供本人蔘考！原因：安裝好cuda5.0的centOS6.4系統重啓以後，執行原來的cuda代碼，提示找不到cuda-device。經過度娘、谷哥，stack overflow一陣查找，大致知道問題出在哪裏？但是好像百分百安裝別人的提供

2020-07-08 01:36:18

基於細胞自動機Cellular Automata(CA)的區域生長

本來沒想研究這個，但Nvidia NPP的《NVIDIA 2D Image And Signal Performance Primitives》這個模塊的NPP Image Processing部分的Filtering Functions

元气少女缘结神

2020-07-08 01:22:24

Docker部署yolact中編譯DCNv2的問題

yolact部署到Docker中，需要單獨編譯DCNv2 cd external/DCNv2 python setup.py build develop 但是這個DCNv2的編譯需要依賴GPU，總是編不過。失敗1：使用python

2020-07-07 17:43:03

CUDA的庫和VC的庫有衝突

正在執行自定義生成步驟testcu.cuc:/cuda/include/common_functions.h(56): warning: dllexport/dllimport conflict with "clock"E:/Progra

2020-07-07 12:09:29

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章