找回密码
 新注册用户
搜索
查看: 8700|回复: 8

[分享] 利用CUDA Visual Profiler对F@H进程进行解剖

[复制链接]
发表于 2009-6-7 18:17:56 | 显示全部楼层 |阅读模式
CUDA Visual Profiler是nVidia公司推出的一款CUDA编程辅助工具,可在nVidia官方主页上免费下载。该软件可以精确地统计CUDA程序中各kernel函数的调用次数以及所占用的CPU/GPU时间,精度可以达到惊人的纳秒量级。这些统计信息对于程序员分析改进CUDA程序的瓶颈非常有帮助。

对于F@H进程我们虽然没有源代码,但是利用该软件也可以看到一些有用的信息,有助于我们了解GPU在跑F@H的时候具体都在做些什么。

下图就是利用CUDA Visual Profiler对一个分值为353的F@H任务进行分析的结果(使用的CPU和GPU分别为i7 920以及GTX 295),从中可以看到该进程最耗时的函数是memcopy,占用了60%左右的GPU时间,而其他kernel函数的GPU用时之和只有约40%。这说明该任务对显存带宽要求比较高,而实际GPU利用率并不高。也许这就是跑该任务GPU温度比较低的原因之一?

p1.GIF

[ 本帖最后由 cuda 于 2009-6-7 18:24 编辑 ]

评分

参与人数 4基本分 +26 收起 理由
zglloo + 3 精品文章
cicikml + 10 精品文章
caozhonghua + 3 原创内容
金鹏 + 10 精品文章

查看全部评分

回复

使用道具 举报

发表于 2009-6-7 18:43:48 | 显示全部楼层
兄弟不是一般的强大,而是相当的强大

感谢兄弟对353包进行解刨,希望兄弟空了还能对1888、472的低温包,还有384、768这样的中温包,以及511和430这样的高温毒包进行更详细的解刨

最好专门出个评测滴说

[ 本帖最后由 金鹏 于 2009-6-7 18:44 编辑 ]
回复

使用道具 举报

发表于 2009-6-8 01:07:46 | 显示全部楼层
佩服 佩服
回复

使用道具 举报

发表于 2009-6-8 05:28:06 | 显示全部楼层
也就是说算353的包9600GT比9600GSO快?
回复

使用道具 举报

发表于 2009-6-8 08:49:47 | 显示全部楼层
高级高级
回复

使用道具 举报

发表于 2009-6-9 14:26:37 | 显示全部楼层
原来有种说法,显存频率对FAH没有影响,我去年通过调整显存频率发现,对PPD有些影响,不过比较小,那时还没有353分的任务,哪天碰上再试试。
回复

使用道具 举报

发表于 2009-6-11 11:54:05 | 显示全部楼层
牛人
回复

使用道具 举报

发表于 2009-6-11 15:48:11 | 显示全部楼层
我也给楼主加点分,希望你的发言能引起更多人的热心参与!
回复

使用道具 举报

发表于 2009-12-21 17:56:58 | 显示全部楼层
原先是一块9600gts在跑,今天又加了一块9600gt,呵呵
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-11 20:22

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表