[cuda]unified memory測試

原創

2020-06-13 17:44

unified memory 在被 kernel 函數訪問的時候，如果同事被 host 函數訪問，那麼host 得到的結果可能是錯誤的，測試程序如下

#include <cuda_runtime.h>
#include <cassert>

__global__ void umem_test(int* cnt){
    atomicAdd(cnt,1);
}

int main(){
    int *cnt;
    assert(cudaMallocManaged(&cnt,sizeof(*cnt))==cudaSuccess);
    for(int i=0;i<1000;++i){
        *cnt = 0;
        umem_test<<<128,128>>>(cnt);
        assert(*cnt==128*128);
    }
    return 0;
}

unified memory，如果此時正被kernel使用，那麼在host訪問時並不觸發cudaMemcpy
把上述程序改成一下形式，結果是正確的

#include <cuda_runtime.h>
#include <cassert>

__global__ void umem_test(int* cnt){
    atomicAdd(cnt,1);
}

int main(){
    int *cnt;
    assert(cudaMallocManaged(&cnt,sizeof(*cnt))==cudaSuccess);
    for(int i=0;i<1000;++i){
        *cnt = 0;
        umem_test<<<128,128>>>(cnt);
        int resutl;
        cudaMemcpy(&resutl,cnt,sizeof(resutl),cudaMemcpyDeviceToHost);
        assert(*cnt==128*128);
    }
    return 0;
}

新插入的cudaMemcpy和umem_test都是在默認的stream上執行的，而且cudaMemcpy是同步操作，所以必須等待umem_test執行完成才能執行，此時訪問*cnt時，umem_test已經完成，所示此時能夠得到正確結果

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

今天！通義靈碼在北京、成都、杭州三城開講啦

通義靈碼自從入職阿里雲以來備受行業關注。5 月 24 日，阿里雲工程師奔赴北京、成都、杭州三城，向企業和開發者介紹並演示通義靈碼，通義靈碼依然是大家話題的C位，並收穫了衆多粉絲。 @杭州阿里雲金融創新峯會今天，2024 阿里雲金融創新峯

2024-05-27 21:13:46

OSS_PIPE：Rust編寫的大規模文件遷移工具

‍ 隨着業務的發展，文件數量和文件大小會急劇增加，文件遷移的數量和難度不斷攀升。oss_pipe 是rust編寫的文件遷移工具，旨在支撐大規模的文件遷移場景。編寫 oss_pipe 的初衷 •同類產品面臨的問題 •rust 語

京東雲開發者

2024-05-15 23:59:27

OSS_PIPE：Rust編寫的大規模文件遷移工具| 京東雲技術團隊

文盤rust 好久沒有更新了。這段時間筆者用rust寫了個小東西，跟各位分享一下背景隨着業務的發展，文件數量和文件大小會急劇增加，文件遷移的數量和難度不斷攀升。oss_pipe 是rust編寫的文件遷移工具，旨在支撐大規模的文件遷移場

2024-05-13 23:59:27

通義靈碼企業版正式發佈，滿足企業私域知識檢索、數據合規、統一管理等需求

5 月 9 日阿里雲 AI 峯會，阿里雲智能集團首席技術官周靖人宣佈，通義靈碼企業版正式發佈，滿足企業用戶的定製化需求，幫助企業提升研發效率。通義靈碼是國內用戶規模第一的智能編碼助手，基於 SOTA 水準的通義千問代碼模型 Code-Qw

2024-05-11 21:15:01

華爲雲開發者桌面全新發布CodeArts IDE for Python，極致優雅雲原生開發體驗

本文分享自華爲雲社區《華爲雲發佈CodeArts IDE for Python，極致優雅雲原生開發體驗》，作者：華爲雲頭條。近日，華爲雲正式發佈CodeArts IDE for Python，這是一款內置華爲自主創新的Python語

2024-05-08 10:34:25

我們團隊來了一位新同事，主動要求幫忙敲代碼！歡迎 AI 001號

通義靈碼｜7X24的AI智能編程助手工號：AI001 他叫通義靈碼，一個硅基生命。出生在0101星球，沒有性別，但有人格類型。他是INTJ，建築師型人格，艾薩克·牛頓和甘道夫同款。他會寫一點代碼，但不如我們會得多。我看了下他的簡歷，

2024-05-07 21:12:06

西安站開營！AI 編碼助手通義靈碼幫大學生“整活兒”

如何更好地與 AI 爲伴，做時代的先進開發者？4 月 17 日，阿里雲推出的 AI 編程助手通義靈碼與雲工開物“高校訓練營”走進西安多所高校開啓實操培訓，結合 AI 輔助編程的發展背景、通義靈碼的具體能力和應用實操，幫助在校大學生了解人工智

2024-04-24 21:12:06

數組和鏈表的適用場景

簡介在計算機中要對給定的數據集進行若干處理，首要任務是把數據集的一部分（當數據量非常大時，可能只能一部分一部分地讀取數據到內存中來處理）或全部存儲到內存中，然後再對內存中的數據進行各種處理。例如，對於數據集 S{1，2，3，4，5，6

2024-04-24 09:31:34

Xmake v2.9.1 發佈，新增 native lua 模塊和鴻蒙系統支持

Xmake 是一個基於 Lua 的輕量級跨平臺構建工具。它非常的輕量，沒有任何依賴，因爲它內置了 Lua 運行時。它使用 xmake.lua 維護項目構建，相比 makefile/CMakeLists.txt，配置語法更加簡潔直觀，

2024-04-23 12:10:57

下載量超 200 萬，最近頻繁登上熱搜的 AI 程序員，大家怎麼看

人狠話不多，會熟練使用 200 多種編程語言，寫得了代碼，做得了測試，7 天 24 小時隨叫隨到…… 硅基程序員通義靈碼首次入職阿里雲，有網友說：終於不穿格子衫了！還有網友說：這簡歷，作爲一個 HR 我很難不心動！人狠話不多的通義靈碼，

2024-04-22 21:12:06

通義靈碼走進武漢大學：讓 AI 編碼助手激活大學生的創造力

阿里雲面向全國大學生正式啓動雲工開物“高校訓練營“，計劃在 15 座城市、70 所全國高校巡迴開營，幫助學生用雲計算與 AI 工具進行雲上開發及應用創新。首期高校訓練營-通義靈碼專場在武漢大學開營。本次分享，以阿里雲通義靈碼爲核心，聚焦代

2024-04-02 21:12:12

讓 AI 幫你寫代碼，開發提效神器來了

如今，大量程序員已經習慣在 AI 輔助下進行編程。據調研，AI 編碼工具將程序員工作效率提升 50% 以上。通義靈碼是目前國內最受開發者喜愛的 AI 編碼助手，可以提供行級/函數級實時續寫、自然語言生成代碼、單元測試生成、代碼優化、註釋生

2024-03-27 21:14:11

GPU 硬件指標說明

流處理器：也叫渲染管、着色器。畫面都是由一個又一個像素點組成的，而流處理器就負責這些像素點的渲染工作； RT核心：光追核心，用作於光線追蹤效果； CUDA 核心和Tensor 核心：CUDA Core和Tensor Core，爲G

2024-05-13 22:35:43

Qt/C++音視頻開發70-無感切換通道/無縫切換播放視頻/多通道流暢切換/不同視頻打開無縫切換

一、前言之前就寫過這個方案，當時做的是ffmpeg內核版本，由於ffmpeg內核解析都是代碼實現，所以無縫切換非常完美，看不到絲毫的中間切換過程，看起來就像是在一個通道畫面中。其實這種切換隻能說是取巧辦法，最佳的辦法應該是公用一個open

2024-04-18 10:40:53

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

2024-04-10 23:29:41

24小時熱門文章

最新文章

最新評論文章