CUDA command Profiler
扫描二维码
随时随地手机看文章
这里我不使用默认设置:
timestamp gpustarttimestamp gpuendtimestamp gridsize threadblocksize dynsmemperblock stasmemperblock regperthread memtransferdir memtransfersize memtransferhostmemtype streamid localblocksize
将上面的内容添加到一个新的文本文件中。假设这个文件叫prof.cfg
假设你的程序是a.exe
用下面的命令启动执行
CUDA_PROFILE=1 CUDA_PROFILE_CONFIG=prof.cfg ./a.exe
此时会有一个文件产生在你的目录下,打开看看吧。