原创 CUDA異步並行

異步函數使得主機端與設備端並行執行:控制在設備還沒有完成前就被返回給主機線程;     包括:       kernel啓動; 以Async爲後綴的內存拷貝函數; device到device內存拷貝函數;存儲器初始化函數,比如cudaMe