中国分布式计算论坛

 找回密码
 新注册用户
搜索
查看: 9016|回复: 16

PCI-e 1x延长线对FAH PPD的影响实测(8楼新增780Ti测试)

[复制链接]
发表于 2013-11-24 21:05:59 | 显示全部楼层 |阅读模式
本帖最后由 cuda 于 2013-11-25 13:46 编辑

使用PCI-e 1x延长线对显卡的FAH性能到底有没有影响?答案众说纷纭,有人说对PPD有10%左右的影响,也有人说基本没有影响。网上这方面的实际对比测试比较少,今天趁着周末对此问题进行了一个简单测试,希望结果能对大家有所帮助。
为保证结果的可靠性,测试使用同一块660Ti跑硬盘上的同一个P8900存包的同一部分(60%~64%),操作系统为Linux,FAH v7客户端,分别测试了直插(16x, PCI-e 2.0 模式)、1x转接线(PCI-e 1.0模式)以及1x转接线(PCI-e 2.0模式)三种情况。具体测试结果如下:

1、直插(16x, PCI-e 2.0模式):
11:09:23:WU03:FS00:0x17:Project: 8900 (Run 151, Clone X, Gen XX)
11:11:48:WU03:FS00:0x17:Completed 1500000 out of 2500000 steps (60%)
11:16:58:WU03:FS00:0x17:Completed 1525000 out of 2500000 steps (61%)
11:22:01:WU03:FS00:0x17:Completed 1550000 out of 2500000 steps (62%)
11:27:14:WU03:FS00:0x17:Completed 1575000 out of 2500000 steps (63%)
11:32:18:WU03:FS00:0x17:Completed 1600000 out of 2500000 steps (64%)
[60% - 61% TPF=5m10s, ppd= 7.17万]
[61% - 62% TPF=5m03s, ppd= 7.42万]
[62% - 63% TPF=5m13s, ppd= 7.07万]
[63% - 64% TPF=5m04s, ppd= 7.39万]

平均TPF=5m7.5s, PPD=7.26万

2、1x转接线(PCI-e 1.0模式):
09:26:17:WU03:FS00:0x17:Project: 8900 (Run 151, Clone X, Gen XX)
09:28:44:WU03:FS00:0x17:Completed 1500000 out of 2500000 steps (60%)
09:34:08:WU03:FS00:0x17:Completed 1525000 out of 2500000 steps (61%)
09:39:26:WU03:FS00:0x17:Completed 1550000 out of 2500000 steps (62%)
09:44:52:WU03:FS00:0x17:Completed 1575000 out of 2500000 steps (63%)
09:50:11:WU03:FS00:0x17:Completed 1600000 out of 2500000 steps (64%)
[60% - 61% TPF=5m24s, ppd= 6.71万]
[61% - 62% TPF=5m18s, ppd= 6.90万]
[62% - 63% TPF=5m26s, ppd= 6.65万]
[63% - 64% TPF=5m19s, ppd= 6.87万]

平均TPF=5m22s, PPD=6.78万

3、1x转接线(PCI-e 2.0模式):
08:39:49:WU03:FS00:0x17:Project: 8900 (Run 151, Clone X, Gen XX)
08:42:15:WU03:FS00:0x17:Completed 1500000 out of 2500000 steps (60%)
08:47:30:WU03:FS00:0x17:Completed 1525000 out of 2500000 steps (61%)
08:52:38:WU03:FS00:0x17:Completed 1550000 out of 2500000 steps (62%)
08:57:56:WU03:FS00:0x17:Completed 1575000 out of 2500000 steps (63%)
09:03:06:WU03:FS00:0x17:Completed 1600000 out of 2500000 steps (64%)
[60% - 61% TPF=5m15s, ppd= 7.00万]
[61% - 62% TPF=5m08s, ppd= 7.24万]
[62% - 63% TPF=5m18s, ppd= 6.90万]
[63% - 64% TPF=5m10s, ppd= 7.17万]

平均TPF=5m13s, PPD=7.07万

这个测试结果应该是可靠的,可以看到三次测试中每个百分比的TPF起伏波动都非常一致。
从这个结果看1x延长线对PPD确实有一定影响,特别是在PCI-e 1.0模式下影响比较严重,PPD比16x时下降了近7%;而PCI-e 2.0模式下就要好得多,PPD比16x只下降不到3%。因此只要1x延长线工作在PCI-e 2.0状态,感觉基本上可以接受。
此外估计不同的包测出来的结果也会有不同,数据传输量越大的包影响应该越大;不同的显卡测出来可能也会不同(8楼有补充测试结果),速度快的显卡影响应该更大些。因此有人看到10%以上的性能损失以及有人几乎看不到性能损失都是有可能的。

点评

很给力!: 5.0
很给力!: 5
加入置顶资料帖,供兄弟们参考  发表于 2013-11-25 14:50
2.0&3.0下基本可以忽略  发表于 2013-11-25 10:01

评分

参与人数 6基本分 +63 收起 理由
dutian_007 + 5 赞一个!
cicikml + 10 很给力!
CCCP0081 + 15 辛苦了!
金鹏 + 8 赞一个!
zhouxiaobo + 15 大赞
guihuo + 10 辛苦了!

查看全部评分

发表于 2013-11-24 21:12:09 | 显示全部楼层
强帖留名
发表于 2013-11-24 21:17:29 | 显示全部楼层
Very Good!
发表于 2013-11-24 21:29:28 来自手机 | 显示全部楼层
厉害 测试这么快就出了
发表于 2013-11-24 22:05:15 | 显示全部楼层
如何确定工作在2.0模式下?
发表于 2013-11-24 22:24:35 来自手机 | 显示全部楼层
支持下。
 楼主| 发表于 2013-11-24 22:53:43 | 显示全部楼层
muclemanxb 发表于 2013-11-24 22:05
如何确定工作在2.0模式下?


一般只要主板和显卡支持PCI-e 2.0,就会自动工作在此模式下。
很多系统检测软件可检查是1.0还是2.0,但是结果并不可靠,常常出错。推荐用CUDA SDK中的bandwidthTest实测带宽比较靠谱,200MB/s左右说明是PCI-e 1.0 1x,400MB/s左右则是PCI-e 2.0 1x。
 楼主| 发表于 2013-11-25 13:21:52 | 显示全部楼层
本帖最后由 cuda 于 2013-11-25 13:49 编辑

前面提到1x转接线对更快的显卡影响可能更大,为了验证这一猜想,特找一土豪借来一块780Ti,同样测试了同一个P8900包在PCI-e 1.0 1x, PCI-e 2.0 1x, PCI-e 2.0 16x三种情况下的表现。
测试中780Ti采用全默认参数,实际睿频频率1019MHz,未超频(Linux下也无法超频)。跑的时候温度有点高,维持在80度左右。
结果发现,与660Ti相比780Ti的差别果然要更大一些,1x 2.0模式下的PPD比16x下降4.5%,1x 1.0模式的PPD则下降9%
可见对于高端的显卡1x转接线的影响还是比较明显的,此时建议尽量使用4x, 8x转接。

此外,这次测试中780Ti表现令人惊喜,默频的PPD达到了20.0万(更长时间的平均PPD是19.9万),这也是一个非常不错的成绩。和之前网上最早传出的780Ti的PPD做个比较:
http://hardforum.com/showthread.php?p=1040370768
1120MHz, PPD=21.0万,等效默频(1019MHz)PPD=18.2万
1099MHz, PPD=18.4万,等效默频(1019MHz)PPD=16.4万

其中原作者后来补充说第一个成绩高估了,应以第2个成绩为准。但即使和他的第一个成绩相比,本次测试的PPD也高出了9.9%,和他的第2个成绩相比更是高出了22%。
此外,本次测试比另一处网上的780Ti PPD也高出了11%:
http://forums.evga.com/tm.aspx?m=2047656
1196MHz, PPD=22.9万,等效默频(1019MHz)PPD=18.0万

产生这一差异的原因我估计主要还是驱动和OS,Linux下的core17效率看来是很不错的,大家有条件的话不妨转移到Linux平台试试。

附详细log结果:
1、(1x, PCI-e 1.0模式)
01:00:45:WU00:FS00:0x17:Project: 8900 (Run 237, Clone X, Gen XX)
01:05:46:WU00:FS00:0x17:Completed 1275000 out of 2500000 steps (51%)
01:08:30:WU00:FS00:0x17:Completed 1300000 out of 2500000 steps (52%)
01:11:23:WU00:FS00:0x17:Completed 1325000 out of 2500000 steps (53%)
01:14:07:WU00:FS00:0x17:Completed 1350000 out of 2500000 steps (54%)
01:17:00:WU00:FS00:0x17:Completed 1375000 out of 2500000 steps (55%)
01:19:44:WU00:FS00:0x17:Completed 1400000 out of 2500000 steps (56%)
[51% - 52% TPF=2m44s]
[52% - 53% TPF=2m53s]
[53% - 54% TPF=2m44s]
[54% - 55% TPF=2m53s]
[55% - 56% TPF=2m44s]

平均TPF=2m47.6s, PPD=18.0万

2、(1x, PCI-e 2.0模式)
04:00:49:WU00:FS00:0x17:Project: 8900 (Run 237, Clone X, Gen XX)
04:05:58:WU00:FS00:0x17:Completed 1275000 out of 2500000 steps (51%)
04:08:37:WU00:FS00:0x17:Completed 1300000 out of 2500000 steps (52%)
04:11:24:WU00:FS00:0x17:Completed 1325000 out of 2500000 steps (53%)
04:14:03:WU00:FS00:0x17:Completed 1350000 out of 2500000 steps (54%)
04:16:49:WU00:FS00:0x17:Completed 1375000 out of 2500000 steps (55%)
04:19:26:WU00:FS00:0x17:Completed 1400000 out of 2500000 steps (56%)
[51% - 52% TPF=2m39s]
[52% - 53% TPF=2m47s]
[53% - 54% TPF=2m39s]
[54% - 55% TPF=2m46s]
[55% - 56% TPF=2m37s]

平均TPF=2m41.6s, PPD=19.1万

3、(16x, PCI-e 2.0模式)
03:27:13:WU00:FS00:0x17:Project: 8900 (Run 237, Clone X, Gen XX)
03:32:23:WU00:FS00:0x17:Completed 1275000 out of 2500000 steps (51%)
03:34:56:WU00:FS00:0x17:Completed 1300000 out of 2500000 steps (52%)
03:37:37:WU00:FS00:0x17:Completed 1325000 out of 2500000 steps (53%)
03:40:11:WU00:FS00:0x17:Completed 1350000 out of 2500000 steps (54%)
03:42:53:WU00:FS00:0x17:Completed 1375000 out of 2500000 steps (55%)
03:45:26:WU00:FS00:0x17:Completed 1400000 out of 2500000 steps (56%)
[51% - 52% TPF=2m33s]
[52% - 53% TPF=2m41s]
[53% - 54% TPF=2m34s]
[54% - 55% TPF=2m42s]
[55% - 56% TPF=2m33s]

平均TPF=2m36.6s, PPD=20.0万

评分

参与人数 1基本分 +8 收起 理由
金鹏 + 8 赞一个!

查看全部评分

发表于 2013-11-25 14:46:01 | 显示全部楼层
本帖最后由 金鹏 于 2013-11-25 14:47 编辑
cuda 发表于 2013-11-25 13:21
前面提到1x转接线对更快的显卡影响可能更大,为了验证这一猜想,特找一土豪借来一块780Ti,同样测试了同一 ...

看来PPD在8万以上的显卡在1X 4X 8X 16X下的PPD影响要比以前影响大了很多

考虑到走线和通风散热及PPD,用4X及以上延长线是必需的了

PS:1X延长线面临下岗除非是在PCIE 3.0的1X下?
发表于 2013-11-25 15:25:57 | 显示全部楼层
大家的延长线都在哪买的 求pm地址
发表于 2013-11-25 16:09:55 | 显示全部楼层
zflowers 发表于 2013-11-25 15:25
大家的延长线都在哪买的 求pm地址

我以前都是在和信达 定制的PCIE延长线
发表于 2013-11-25 18:05:57 | 显示全部楼层
很有价值的参考结果。
发表于 2014-1-5 11:53:04 | 显示全部楼层
本帖最后由 金鹏 于 2014-1-5 12:04 编辑
cuda 发表于 2013-11-25 13:21
前面提到1x转接线对更快的显卡影响可能更大,为了验证这一猜想,特找一土豪借来一块780Ti,同样测试了同一 ...

如果EVGA GTX780Ti Classified超到1300+是否能突破2:15秒的25万+大关呢?
(780在1228下TPF为2:52)
================
貌似EVGA 780 Ti ACX在1200下可以2:21秒的23万+
http://forums.evga.com/FindPost/2058441


 楼主| 发表于 2014-1-5 17:47:51 | 显示全部楼层
金鹏 发表于 2014-1-5 11:53
如果EVGA GTX780Ti Classified超到1300+是否能突破2:15秒的25万+大关呢?
(780在1228下TPF为2:52)
======== ...

按此推算应该没问题。
发表于 2014-1-5 18:27:19 | 显示全部楼层
cuda 发表于 2014-1-5 17:47
按此推算应该没问题。

嗯,主要2.17的BA16下线,一台12T伪装16T的机器不能BA24了
损失9万PPD,准备用EVGA GTX780Ti Classified方案替代


看来以后2P机器跑BA也无大的性价比了,期待N卡的CUDA JIT跑BA方案了
您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

小黑屋|手机版|Archiver|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2019-10-21 01:28

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表