原创 OpenACC與CUDA C交互(1)

目前大家對於openacc的使用還是比較獨立,也就是程序中要不就是使用openacc,要不就是使用cuda。但是結合openacc和cuda使用目前還是比較少。剛好看到幾個好的案例,這就把例子搬過來。 /*openacc_c_main.

原创 OpenACC與CUDA C交互(2)

在《OpenACC與CUDA交互(1)》中,舉了一個openacc中嵌套cuda的例子。現在舉一個cuda中嵌套openacc的例子。上代碼: /*cuda_main.cu*/ #include <stdio.h> #include <

原创 OpenACC與cublas交互-c版本

比較簡單,通俗易懂,就直接上代碼了: /*openacc_c_cublas.c*/ #include <stdio.h> #include <stdlib.h> #include <unistd.h> extern void cubl

原创 FFTW安卓平臺下編譯

借用這裏的內容。自己加以實踐。  編譯命令:(個人保存爲test.sh)         INSTALL_DIR=/home/lucas/fftw SRC_DIR=/home/lucas/fftw-3.3.4/ cd $SRC_DIR

原创 android NDK調試

今天狀態很一般,在寫OpenCL代碼時,總是各種小問題。百度了下android NDK調試問題,但是似乎有點複雜,今天狀態不行,所以也就不去折騰了。最後百度到了一種比較簡單的調試辦法,那就是在LogCat中打印信息。 添加頭文件: #i

原创 OpenACC2.0標準中文版

       OpenACC2.0標準中文版下載地址,請移步這裏       昨天晚上睡前突然想到這茬,然後又從網盤裏找出自己翻譯的版本,上傳至CSDN上。       自己應該是2012年2~3月份開始接觸的OpenACC,其實自己在看

原创 linxu下CUDA靜態庫-上

項目需要把CUDA打包成靜態庫,弄了一個小程序測試了 測試的小程序包含三個文件:main.cpp, cuda_dll.cu, cuda_dll.h main.cpp內容如下: cuda_dll.h內容如下: cuda_dll.cu內容

原创 Qt導出圖片到Excel中

手頭一個石油項目,需要把管柱序列中的工具信息導出到Excel中,遇到的難點是導出圖片。現在給出自己的實現例子: QString filename = QFileDialog::getSaveFileName(this, t

原创 博客不更新

CSDN博客不更新了,請移步個人站點:www.gpu-computing.cn

原创 編譯原理-0-編譯過程概述

     一直以來,都想好好學習學習編譯原理。但是一直各種理由沒有靜下心來好好看看。現在就用博客的形式,記錄自己學習編譯原理的點點滴滴。如有錯誤之處,還請指出。     習慣糗事百科的分割,咱就先來一個華麗麗的分隔符     ======

原创 安卓NDK下讀取文件

      這幾天一直在弄模板生成算法移植到手機GPU上。先期OpenCL代碼是在PC上驗證,cl文件到手機上之後NDK讀取就遇到問題,所以研究下安卓NDK下讀取文件的問題。         把OpenC

原创 編譯原理-1-詞法分析

在上一篇文章中,大致介紹了下編譯過程。從這篇文章開始,我們就開始逐步慢慢深入的學習編譯過程中的步驟。今天我們就來具體看看詞法分析到底是怎麼回事。 ========================華麗麗的分割線===============

原创 安卓手機GPU OpenCL總結

 前段時間,把市面上手機GPU OpenCL支持情況做了一個總結。總結如下: 目前,手機 GPU 市面有四個公司產品:Qualcomm, Imagination Technologies,ARM, Vivante,分別對應的產品如下: (

原创 安卓平臺下ARM Mali OpenCL編程-GPU信息檢測

      對於ARM Mali GPU,目前是支持OpenCL1.1,所以我們可以利用OpenCL來加速我們的計算。               一直以來,對於Mali GPU的OpenCL編程,一直沒有環境來測試。好不容易弄到一個華爲

原创 巧用CUDA中的pinned memory

      這幾天看別人的論文,發現一個比較有意思的實現方式。巧用pinned memory,在GPU中實現類似pipeline的功能。在論文中pipeline中,有四個操作:地址生成,數據組裝,數據拷貝和計算。對於地址生成和計算是在GP