nvprof 使用筆記

1

nvprof --metrics gld_efficiency,gst_efficiency ./myproc

檢測內存加載存儲效率

 

2

nvprof --query-metrics

# 查看所有能用的參數命令

 

nvprof --metrics stall_sync ./myproc

檢測核函數的線程束阻塞情況

 

4

nvprof --metrics gld_throughput ./myproc

檢測內存加載吞吐量

 

5

nvprof --metrics inst_per_warp ./myproc

檢測每個線程束上執行指令數量的平均值,越少越好

 

6

nvprof --metrics branch_efficiency  ./myproc

檢測分支分化性能

 

 

7

nvprof ./a.out

profiling result中顯示的是kernel執行的time情況 api calls則顯示的是程序調用的api所耗費的time情況

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章