|
在4*GTX295机器上同时跑8个Folding@home,对功率、温度等情况作了一些初步的测试。机器的具体配置见http://www.equn.com/forum/viewthread.php?tid=21706&page=3#pid289599。操作系统为Windows 2003 32位版, 基本设置参考了本版baibaipangpang网友的"多GPU参与Folding@Home项目攻略"一文。
首先在FAH官方网站上下载最新的安装程序,然后按照baibaipangpang网友的方法建立8个数据文件目录,并在每个目录建立一个[email protected]的快捷方式。然后修改每个目录下client.cfg中的machineid以及快捷方式中的-gpu参数,使得不同目录下的文件分配在不同的gpu上运行。
点击快捷方式运行,结果除了gpu0以外其他gpu都提示找不到。多桌面扩展以后gpu0-gpu7均可正常运行,但运行时有一块显卡出现了刺耳的高频啸叫,不知是否和多桌面扩展有关(运行其他cuda程序时不需要多桌面扩展,也未出现高频啸叫)。此外多桌面扩展以后reboot就进不了系统,取消后恢复正常。不知其他人有没有遇到过这个问题。
测试中使用了万方多功能计量插座测量整机的功率情况,这个东西网上很多人说不准,不过我个人感觉还不错。首先测量的是待机时的情况,此时整机功率为410W左右,已经超过了普通电脑的满载功率。
(因没有权限在本论坛上载附件,以下图片使用的均为poco的外链)

待机时的温度情况,8个GPU温度都不超过60度,具体数值分别为55, 57, 58, 60, 57, 60, 58, 60度。

然后是满负荷测试,同时在8个gpu上跑8个FAH进程。结果发现FAH似乎并没有让GPU满载,运行40分钟以后温度基本达到稳定,此时系统功耗、温度都不算太高,系统也还算比较流畅。测试结果8个FAH运行时的功率稳定在1010瓦左右,这个值离真正的满载功率还有一定差距,在该机器上测试其他cuda程序时最高实测功率达到过1350瓦左右。

8个FAH跑40分钟以后的GPU的温度在75-79度之间分布(室温22度),8个GPU温度的具体数值为75, 77, 77, 78, 77, 79, 75, 77度。这个温度比以前看过的几个同类测试的温度要低不少。GTX295最高可以在105度正常工作,因此70几度可以说是一个很理想的温度。

8个FAH跑40分钟以后的风扇转速和工作电流情况,可以看到风扇转速还比较低,还不到70%,8个GPU的VRM电流都稳定在33A左右,而GTX295满载时VRM电流应该在45A左右,这也从另一个侧面表明此时GPU负荷没有满载。

用FahMon查看PPD的情况。各GPU的PPD都在7000左右,整机PPD可达到60K左右。

然后停掉4个FAH进程,测试只跑4个FAH的情况,此时整机功率降至770W左右,比8个FAH时少了240W左右,这样算起来每个FAH功率为约60W。

4个FAH运行时的VRM电流情况,从中可以看到工作中的GPU和空闲中的GPU的VRM电流有很大差别。此时GPU1, GPU3, GPU5, GPU8在工作。这几个GPU的VRM电流在32A左右,而其他几个空闲GPU的VRM电流只有8A左右。

然后再停掉3个FAH进程,测试只跑1个FAH时的情况,此时整机功率降至610W左右,比4个FAH时减少160W,算起来也是接近60W/FAH。

然后关闭所有FAH进程,让系统空闲。奇怪的是,此时系统虽然完全空闲,但整机功率却维持为557W左右,比前面的待机功率410W超出了150W之多。

经过分析发现,此时显卡功耗还没有降到最低,8个gpu的VRM电流均为7.26A。

几分钟以后显卡会自动降频,VRM电流变小,降到3A左右,此时整机功率就会回到410W。

小结:以上只是一个十分初步的测试。测试结果表明FAH似乎并没有让GPU完全满载,运行功率和温度都比满载时有一定差距。不过和国外一些类似平台上的测试结果相比,以上测得的工作功率(1010W)明显偏小。也可能是我测试中有什么地方弄错了,欢迎各位指正。
补充: 21楼更新测试结果.
[ 本帖最后由 cuda 于 2009-5-30 22:39 编辑 ] |
评分
-
查看全部评分
|