關於CUDA 分配固定內存

原創

2019-04-03 17:18

可以使用

float *h_a;
    CHECK(cudaMallocHost ((float **)&h_a, nbytes));

來直接分配固定的追內存，而不是虛擬分頁中的內存，好處就是速度會稍微快一些。缺點就是可能內存利用率下降。

// allocate pinned host memory
    float *h_a;
    CHECK(cudaMallocHost ((float **)&h_a, nbytes));

    // allocate device memory
    float *d_a;
    CHECK(cudaMalloc((float **)&d_a, nbytes));

    // initialize host memory
    memset(h_a, 0, nbytes);

    for (int i = 0; i < isize; i++) h_a[i] = 100.10f;

    // transfer data from the host to the device
    CHECK(cudaMemcpy(d_a, h_a, nbytes, cudaMemcpyHostToDevice));

    // transfer data from the device to the host
    CHECK(cudaMemcpy(h_a, d_a, nbytes, cudaMemcpyDeviceToHost));

    // free memory
    CHECK(cudaFree(d_a));
    CHECK(cudaFreeHost(h_a));

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

關於CUDA 分配固定內存

LEETCODE刷題 69. x 的平方根

Leetcode刷題 70. 爬樓梯

小工具：找出下一層的子節點

小工具-合併兩個有序的數組-

一個挺多源的網址GMP，GNU

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結