原创 CUDA Fortran不必要數據拷貝

首先請看下面的代碼: module add use cudafor contains attributes(global) subroutine call_global(a) integer :: a(:) integer

原创 PowerVR 6系列架構分析

     Imagination Technologies公司的PowerVR GPU在移動GPU端,還是老大位置。從PowerVR 6系列開始,越來越向GPU的通用計算靠齊了。以魅族MX4,蘋果6的手機開始,6系列的GPU在市場上也慢慢

原创 OpenCL2.0特性之SVM

      在OpenCL2.0中,增加了SVM(shared virtual memory)的特性。在開始講解SVM之前,我們先用圖片來看下OpenCL1.2中主機與設備端的地址空間:                        

原创 安卓平臺ARM Mali OpenCL例子-灰度轉換

     手頭一塊RK3288的板子,在板子上測試了一張1080p的彩色圖灰度轉換的OpenCL例子。OpenCL沒有任何優化。例子請移步這裏。 該例子是編譯成安卓平臺下的可執行程序。     進入jni文件夾,進行如下操作:      

原创 賬號被盜

幾天沒上博客,發現有幾篇莫名其妙的文章,一一刪除之後發現,我自己寫的關於CUDA靜態庫的博客被刪了,唯一慶幸的是用有道雲筆記保存下來了。

原创 GNU ARM彙編僞指令之循環

GNU ARM彙編中,支持如下形式的循環結構: .rept times code .endr  code 表示一段代碼,.rept和.endr都是彙編僞指令,times是一個數字,表示code這段代碼要重複執行的次數。 另一種循環

原创 linxu下CUDA靜態庫-下

    本機系統環境:  lucas@lucas-wellcom:/usr/local/cuda/lib64$ cat /proc/version Linux version 3.13.0-40-generic (buildd@comet

原创 ARM C嵌套匯編&NEON運算小例子

#include <stdio.h> #include <stdlib.h> #include <arm_neon.h> int main() { int x[10]={0}; int *x_value; x_value=x;

原创 linux下CUDA動態庫

代碼在這裏,現在從靜態庫換成動態庫 修改生成庫的Makefile文件,修改如下: INCLUDEFLAG =/usr/local/cuda/include LDFLAGS=-L /usr/local/cuda/lib64 -lcudart

原创 Qt繪製圓

最近開始折騰Qt了,手頭上的一個項目需要用到Qt來繪製一些簡單圖像。 記錄下Qt繪製圓的過程: 對於以A爲圓心,半徑爲R的圓,外部有一個外切的正方形,正方形上有B點。如下圖所示: 對於void QPainter::drawArc(int