1
nvprof --metrics gld_efficiency,gst_efficiency ./myproc
檢測內存加載存儲效率
2
nvprof --query-metrics
# 查看所有能用的參數命令
3
nvprof --metrics stall_sync ./myproc
檢測核函數的線程束阻塞情況
4
nvprof --metrics gld_throughput ./myproc
檢測內存加載吞吐量
5
nvprof --metrics inst_per_warp ./myproc
檢測每個線程束上執行指令數量的平均值,越少越好
6
nvprof --metrics branch_efficiency ./myproc
檢測分支分化性能
7
nvprof ./a.out
profiling result中顯示的是kernel執行的time情況 api calls則顯示的是程序調用的api所耗費的time情況