原创 CUDA: 程序優化的15個策略

在《CUDA程序優化策略》這篇文章中,我們介紹過CUDA優化的常見策略。今天我們會對CUDA優化策略進行詳細講解。具體策略如下:   1. memory coalescing,保證內存融合。因爲global memory在CC爲1.x

原创 AMD OpenCL 大學課程

<span style="font-family: Consolas; color: rgb(0, 0, 0);">AMD OpenCL大學課程是非常好的入門級OpenCL教程,通過看教程中的PPT,我們能夠很快的瞭解OpenCL機制以及

原创 取模、乘法和除法運算在CPU和GPU上的效率

問題:     將整數n分解爲i和j,滿足下面關係: n  =  j * idim + i     其中idim爲常量。     以下爲三種算法實現:     1) i = n % idim,j = (n - i) / idim

原创 C語言實現FIFO算法與LRU算法

 在操作系統中,當程序在運行過程中,若其所要訪問的頁面不再內存中而需要把他們調入內存,但內存已無空閒空間時,爲了保證該進程能正常運行,系統必須從內存調出一頁程序或數據送磁盤的兌換區中。但哪一個頁面調出,須根據一定的算法確定。通常,把選

原创 理解虛基類、虛函數與純虛函數的概念

引言     一直以來都沒有寫過一篇關於概念性的文章,因爲我覺得這些概念性的東西書本上都有並且說的也很詳細寫來也無用,今天突發奇想想寫 一寫,下面就和大家討論一下虛基類、虛函數與純虛函數,一看名字就讓人很容易覺得混亂。不過不要緊待看完本文

原创 scanf,getchar,gets,cin用法

轉:問題描述一:(分析scanf()和getchar()讀取字符)       scanf(), getchar()等都是標準輸入函數,一般人都會覺得這幾個函數非常簡單,沒什麼特殊的。但是有時候卻就是因爲使用這些函數除了問題,卻找不出其

原创 OpenStack 的 metadata 服務機制

OpenStack 的 metadata 服務機制 在雲計算 IaaS(Infrastructure as a service)平臺中,虛擬機啓動時的自定義配置是非常重要的功能。作爲目前主流 IaaS 產品 OpenStac

原创 在CUDA如何使用二維數組(**[M][N])

總有些童鞋想知道怎麼在CUDA中使用二維數組([M][N]這種類型),其實這個很簡單,不過你要完全弄明白,必須對指針,地址等概念非常清楚才行。寫這篇博客解決下大家這個問題: 1、首先講述一下在一般C語言中如何使用二維數組。 [c

原创 並行細化算法

http://hi.baidu.com/conglingks/blog/item/1ee6aade65d2015dcdbf1a22.html 細化算法的分類:          依據是否使用迭代運算可以分爲兩類:第一類是非迭代算

原创 進程同步機制及優缺點

1.信號量機制:一個信號量只能置一次初值,以後只能對之進行p操作或v操作。 由此也可以看到,信號量機制必須有公共內存,不能用於分佈式操作系統,這是它最大的弱點。2.自旋鎖:旋鎖是爲了保護共享資源提出的一種鎖機制。 調用者申請的資源如果被

原创 灰度圖像的腐蝕算法和細化算法(C#代碼)

    最近做一些圖像處理,需要將圖像中的一些像素過濾一下,有網友給提了個名詞:腐蝕算法。我不是學圖像學的,乍一聽,覺得很神奇。後來從網上收集了一些VC代碼,研究了一下,發現其它也就是那麼回事。尤其是腐蝕算法,我在以前的驗證碼圖片去噪聲的

原创 CUDA與OpenGL交互開發

最近在學習OpenGL,過程中需要使用CUDA進行並行計算。因此,需要解決OpenGL與CUDA的交互問題。學習記錄如下: Step1. 共享數據區 想到交互,不難想到通信,數據共享等詞語。這裏使用的是共享數據的方式來完成OpenG

原创 IPC 三種通信機制

最近看了,IPC三種通信機制,OK,小寫自己的收穫吧。 IPC三種通信機制是指:信號量、共享內存、消息隊列,一開始看得時候感覺有點吃力,當我模仿書上的程序寫了寫代碼之後,就慢慢的理解了。 信號量:通過操作系統中的PV操作來實現

原创 CUDA: 程序優化的15個策略

在《CUDA程序優化策略》這篇文章中,我們介紹過CUDA優化的常見策略。今天我們會對CUDA優化策略進行詳細講解。具體策略如下:   1. memory coalescing,保證內存融合。因爲global memory在CC爲1.x

原创 邊緣斷裂處理算法-邊緣連接算法

讀研的時候寫過一篇文本定位相關的論文,當時有一個處理步驟是對斷裂的邊緣進行連接,當時的程序已經不知道扔哪兒去了,最近又要用到這個程序,把論文翻出來,把程序寫了一遍。這個邊緣連接的方法我也不知道叫什麼名字,隨便寫寫吧。 對所有的端點