找回密码
 新注册用户
搜索
查看: 17769|回复: 31

[分享] 4*GTX295上跑Folding@home的功耗、温度与性能测试(多图)

[复制链接]
发表于 2009-5-29 18:20:39 | 显示全部楼层 |阅读模式
在4*GTX295机器上同时跑8个Folding@home,对功率、温度等情况作了一些初步的测试。机器的具体配置见http://www.equn.com/forum/viewthread.php?tid=21706&page=3#pid289599。操作系统为Windows 2003 32位版, 基本设置参考了本版baibaipangpang网友的"多GPU参与Folding@Home项目攻略"一文。

首先在FAH官方网站上下载最新的安装程序,然后按照baibaipangpang网友的方法建立8个数据文件目录,并在每个目录建立一个Folding@home.exe的快捷方式。然后修改每个目录下client.cfg中的machineid以及快捷方式中的-gpu参数,使得不同目录下的文件分配在不同的gpu上运行。

点击快捷方式运行,结果除了gpu0以外其他gpu都提示找不到。多桌面扩展以后gpu0-gpu7均可正常运行,但运行时有一块显卡出现了刺耳的高频啸叫,不知是否和多桌面扩展有关(运行其他cuda程序时不需要多桌面扩展,也未出现高频啸叫)。此外多桌面扩展以后reboot就进不了系统,取消后恢复正常。不知其他人有没有遇到过这个问题。

测试中使用了万方多功能计量插座测量整机的功率情况,这个东西网上很多人说不准,不过我个人感觉还不错。首先测量的是待机时的情况,此时整机功率为410W左右,已经超过了普通电脑的满载功率。
(因没有权限在本论坛上载附件,以下图片使用的均为poco的外链)


待机时的温度情况,8个GPU温度都不超过60度,具体数值分别为55, 57, 58, 60, 57, 60, 58, 60度。


然后是满负荷测试,同时在8个gpu上跑8个FAH进程。结果发现FAH似乎并没有让GPU满载,运行40分钟以后温度基本达到稳定,此时系统功耗、温度都不算太高,系统也还算比较流畅。测试结果8个FAH运行时的功率稳定在1010瓦左右,这个值离真正的满载功率还有一定差距,在该机器上测试其他cuda程序时最高实测功率达到过1350瓦左右。


8个FAH跑40分钟以后的GPU的温度在75-79度之间分布(室温22度),8个GPU温度的具体数值为75, 77, 77, 78, 77, 79, 75, 77度。这个温度比以前看过的几个同类测试的温度要低不少。GTX295最高可以在105度正常工作,因此70几度可以说是一个很理想的温度。


8个FAH跑40分钟以后的风扇转速和工作电流情况,可以看到风扇转速还比较低,还不到70%,8个GPU的VRM电流都稳定在33A左右,而GTX295满载时VRM电流应该在45A左右,这也从另一个侧面表明此时GPU负荷没有满载。


用FahMon查看PPD的情况。各GPU的PPD都在7000左右,整机PPD可达到60K左右。


然后停掉4个FAH进程,测试只跑4个FAH的情况,此时整机功率降至770W左右,比8个FAH时少了240W左右,这样算起来每个FAH功率为约60W。


4个FAH运行时的VRM电流情况,从中可以看到工作中的GPU和空闲中的GPU的VRM电流有很大差别。此时GPU1, GPU3, GPU5, GPU8在工作。这几个GPU的VRM电流在32A左右,而其他几个空闲GPU的VRM电流只有8A左右。


然后再停掉3个FAH进程,测试只跑1个FAH时的情况,此时整机功率降至610W左右,比4个FAH时减少160W,算起来也是接近60W/FAH。


然后关闭所有FAH进程,让系统空闲。奇怪的是,此时系统虽然完全空闲,但整机功率却维持为557W左右,比前面的待机功率410W超出了150W之多。


经过分析发现,此时显卡功耗还没有降到最低,8个gpu的VRM电流均为7.26A。


几分钟以后显卡会自动降频,VRM电流变小,降到3A左右,此时整机功率就会回到410W。


小结:以上只是一个十分初步的测试。测试结果表明FAH似乎并没有让GPU完全满载,运行功率和温度都比满载时有一定差距。不过和国外一些类似平台上的测试结果相比,以上测得的工作功率(1010W)明显偏小。也可能是我测试中有什么地方弄错了,欢迎各位指正。

补充: 21楼更新测试结果.

[ 本帖最后由 cuda 于 2009-5-30 22:39 编辑 ]

评分

参与人数 3基本分 +23 收起 理由
caozhonghua + 3 原创内容
cicikml + 10 欢迎加入FAH大家庭!
金鹏 + 10 精品文章

查看全部评分

回复

使用道具 举报

发表于 2009-5-29 18:48:30 | 显示全部楼层
兄弟机器只能用--那是相当的强大来形容

目前来看机器调整相当完美,特别是佩服兄弟把四张卡每个核心温度控制在80度以内,风扇转速还没超过70%

兄弟的机器是裸跑还是空调降温,或者使用了其他降温措施?
回复

使用道具 举报

发表于 2009-5-29 18:58:43 | 显示全部楼层
另外如果八个核心全跑511的毒包,应该说是FAH系统负载最大,
那时兄弟可以在注意一下功耗,特别注意一下显卡温度和散热
回复

使用道具 举报

 楼主| 发表于 2009-5-29 19:28:03 | 显示全部楼层
散热问题折腾了很久,现在也没有完全解决。目前采用的方法是敞开机箱,放在窗户旁边,然后在显卡上方放置一块12cm风扇(见图1)。
曾经试过用家用台扇直接对着显卡吹,结果完全没有效果。后来发现可能是因为台扇无法太靠近显卡,因此显卡缝隙中风吹不进去。后来改用更小些的12cm风扇紧贴显卡放置,结果发现有效,温度大约能降低5-10度。不过即使这样,跑一些高负荷CUDA程序时GPU温度还是会接近100度,甚至导致当机。以上测试中温度比较低也可能是因为这些包的GPU负荷正好不是太高,511毒包以后有机会也打算尝试一下。构想中的一个更好散热方案是像图2这样,做几个档风板,把风导入显卡缝隙,这样也许可以完全解决4*295的散热问题。

图1:


图2:

评分

参与人数 1基本分 +10 收起 理由
金鹏 + 10 我很赞同

查看全部评分

回复

使用道具 举报

发表于 2009-5-29 20:06:21 | 显示全部楼层
新地主?
回复

使用道具 举报

发表于 2009-5-29 20:21:34 | 显示全部楼层
一两个12CM风扇不能完全抵御有5个以上核心跑511毒包时带来的热量,
最简单的方法建议兄弟用你的方法外加使用18寸或以上家用电风扇距离50-100CM正对着四张卡直吹,为整个平台散热

显卡之间如果要加快空气流动,在进风面积有限时必须要高风压,
兄弟的漏斗思路目前来说是比较好的方法

[ 本帖最后由 金鹏 于 2009-5-29 20:26 编辑 ]
回复

使用道具 举报

发表于 2009-5-29 21:38:47 | 显示全部楼层
天,这配置。。。
回复

使用道具 举报

发表于 2009-5-29 21:56:08 | 显示全部楼层
看了楼主的配置总是让偶有想关机的冲动
回复

使用道具 举报

发表于 2009-5-29 22:11:17 | 显示全部楼层
现在我们使用的Folding计算核心还是针对G92设计的,基本没有调用GT200显卡的双精度单元,同时占芯片面积庞大的Texture也没有使用。所以功耗上不去。
楼主自己写的CUDA程序可能优化程度非常高,所以温度和功耗也上去了。

现在散热问题可能只有用楼主设计的风漏斗解决了,否则没有别的办法。
希望楼主以后空闲时,也用这套机器来支持一些FAH,支持3213团队。
回复

使用道具 举报

发表于 2009-5-30 02:36:43 | 显示全部楼层
强大 希望LZ经常来玩
回复

使用道具 举报

发表于 2009-5-30 03:15:49 | 显示全部楼层
好BT的配置···
回复

使用道具 举报

发表于 2009-5-30 07:36:08 | 显示全部楼层
好帖!强大!
加分
希望LZ这套机器能真正加入3213,哪怕每天算个几小时也很可观了。
回复

使用道具 举报

发表于 2009-5-30 08:16:19 | 显示全部楼层
多上几张图,看看用的什么配置?
回复

使用道具 举报

发表于 2009-5-30 08:26:46 | 显示全部楼层
原帖由 caozhonghua 于 2009-5-30 07:36 发表
好帖!强大!
加分
希望LZ这套机器能真正加入3213,哪怕每天算个几小时也很可观了。


人家配机是拿来挣钱或者科研的,不是用来治疗蛋疼的~~~
回复

使用道具 举报

发表于 2009-5-30 08:43:38 | 显示全部楼层
原帖由 zxy0714 于 2009-5-30 08:26 发表


人家配机是拿来挣钱或者科研的,不是用来治疗蛋疼的~~~


哈哈,谁排名最高谁蛋最疼。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-22 20:51

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表