标题: [分享] Einstein@Home 官方优化程序!(S5R3, 多平台, 更新于08/05/15)
  本主题由 Youth 于 2008-7-16 15:29 置顶 
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-3 22:37  资料  主页 短消息  加为好友 
据说SSE3对目前的计算程序不会有什么帮助





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
[广告] NV版FAH客户端已出,附简单教程!
cnchina
资深顾问
Rank: 5Rank: 5
放假了~


UID 12674
精华 3
积分 1112
帖子 949
阅读权限 10
注册 2007-3-10
来自 EY☆汕頭
发表于 2008-4-4 08:06  资料  短消息  加为好友 
T2450,SAH使用SSE3 r2.4v优化,EAH使用4.36的优化,结果是EAH得分速度是SAH的1.3倍
EAH每个包238分,时间在6万秒左右。

[ 本帖最后由 cnchina 于 2008-4-4 08:07 编辑 ]





顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-4 11:49  资料  主页 短消息  加为好友 
主要原因是seti的官方程序已经优化不少了,后出的优化程序提升幅度就相对小一些。





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
DrLingCN
新手上路
Rank: 1


UID 16743
精华 0
积分 22
帖子 22
阅读权限 10
注册 2008-4-4
发表于 2008-4-4 13:45  资料  短消息  加为好友 
希望会出酷睿2支持的SSSE3的优化~

顶部
ctroom
新手上路
Rank: 1



UID 8931
精华 0
积分 5
帖子 5
阅读权限 10
注册 2005-11-25
发表于 2008-4-7 22:13  资料  短消息  加为好友  QQ
有支持64位么/

顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-8 08:43  资料  主页 短消息  加为好友 
没有,貌似也没这方面的计划





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-28 11:36  资料  主页 短消息  加为好友 
@ 更新了MAC-PPC的优化,比4.41大概提速10%





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
sakeki
资深顾问
Rank: 5Rank: 5


UID 10232
精华 0
积分 1147
帖子 933
阅读权限 10
注册 2006-1-20
来自 广东-汕头
发表于 2008-4-28 13:25  资料  短消息  加为好友  QQ
还停留在SSE,失望啊…………





顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-28 13:59  资料  主页 短消息  加为好友 
呵呵,没什么好失望的啊,在务必保证计算结果可靠性的前提下,项目方在优化程序方面已经很努力了,翻译几个帖子吧。

http://einstein.phys.uwm.edu/for ... p;nowrap=true#81998

有人问:
Since we're talking about feature detection now, are there any plans to go up to SSE2, or would the costs of doing so outweigh the benefits?
既然现在能够自动检测指令集了,有没有计划推出针对SSE2或其它指令集的计算程序?还是说这样做的代价会超过所带来的好处?

Bernd答:
There's still some room for improvements of the SSE code, I'll try that first. My rough guess is that SSE2 would gain less than 10% over the best possible SSE App.
However with the new way of feature-based App switching the "costs" (for the project) are lowered too, compared to the cumbersome mixed-linked Apps we had before.
目前的SSE代码仍有提升空间,我还会试一试,不过推测SSE2带来的提升不会超过10%,当然,考虑到可以自动检测指令集,多准备几种优化方式的代价也相对小一些了。

旁边有人说:
Fair enough. There will definitely be diminishing returns on the efforts. If you provide SSE2, then I'm sure people will want SSE3, SSSE3, SSE4, etc... My guess, based on what is being seen with SETI, is that SSE3 is where meaningful improvements would stop. For AMD processors, it became apparent that SSE3 had negligible differences (perhaps due to missing HyperThreading?)...
总归优化程度越高后带来的好处也会越来越少。如果提供了SSE2版本,马上就会有人要SSE3版本、SSSE3版本。。。根据我在SETI项目观察到的,在SSE3之后就不会有明显的提升了。而对于AMD处理器,SSE3的效果还更差。

Bernd又说:
In the new code we tried to avoid double precision as much as possible, so we already can perform most calculations in SSE. In the two functions that take the most time there is not much left to the compiler to optimize. Benefits from double-precision vectorization, more registers etc. are actually pretty minimal (e.g. the current kernel loop only uses 5 of 8 xmm registers, there is simply no benefit from having twice as many or even more).
There are a few specific features of SSE2 that are helpful, but only if the instructions are carefully placed into the code, probably in assembler (inline assembler in the code or using some well-coded math library). The full-blown 64Bit/SSE2 experiment where I left most to the compiler was nothing less than disappointing.
在新的代码里,我们已经尽量避免使用双精度数据,因此可以用SSE完成大部分的计算。在消耗计算时间最多的两个函数里已经没有多少可供优化的空间了。SSE2以及更高版本指令集带来的好处将非常少。有几个SSE2的特性可能会有所帮助,但需要非常小心地引入到代码中。目前的测试结果并不乐观。





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
Julian_Yuen (拜饼干教教主)
资深顾问
Rank: 5Rank: 5
BiscuiT后援团团长喵


UID 12330
精华 6
积分 4257
帖子 4105
阅读权限 10
注册 2006-12-19
来自 ★饼神饼爱饼干党★
发表于 2008-4-28 14:26  资料  短消息  加为好友 
youth在一楼最后的链接会受到个人论坛设置的影响,默认设置的人不能正确打开该链接
我的是默认每页10个回帖,所以84楼在第9页,而非第6页。
http://www.equn.com/forum/viewth ... mp;page=9#pid243468

page后面的参数不同。
youth的page是第6页





见到饼干番长要记得高呼贵安~








顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 9098
帖子 8793
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2008-4-28 15:03  资料  主页 短消息  加为好友 
收到,貌似discuz比较土。。。搜索到一个解决办法:

http://www.discuz.net/viewthread ... p;page=1#pid7049225

已更新一楼:)





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
Julian_Yuen (拜饼干教教主)
资深顾问
Rank: 5Rank: 5
BiscuiT后援团团长喵


UID 12330
精华 6
积分 4257
帖子 4105
阅读权限 10
注册 2006-12-19
来自 ★饼神饼爱饼干党★
发表于 2008-4-28 16:45  资料  短消息  加为好友 
呵呵,在别的论坛我也遇到过类似的情况。
page的问题是discuz自己做的问题。

---
改过后就不会受到不同设置的影响了应该。





见到饼干番长要记得高呼贵安~








顶部
sakeki
资深顾问
Rank: 5Rank: 5


UID 10232
精华 0
积分 1147
帖子 933
阅读权限 10
注册 2006-1-20
来自 广东-汕头
发表于 2008-4-28 20:22  资料  短消息  加为好友  QQ


那我们就这样决定,优化到SSE2为止





顶部
Bismarck
论坛会员
Rank: 2Rank: 2


UID 15525
精华 0
积分 199
帖子 199
阅读权限 10
注册 2007-11-13
发表于 2008-4-28 20:23  资料  短消息  加为好友  添加 Bismarck 为MSN好友 通过MSN和 Bismarck 交谈 QQ
28号更新了什么玩意?





顶部
Bismarck
论坛会员
Rank: 2Rank: 2


UID 15525
精华 0
积分 199
帖子 199
阅读权限 10
注册 2007-11-13
发表于 2008-4-28 20:24  资料  短消息  加为好友  添加 Bismarck 为MSN好友 通过MSN和 Bismarck 交谈 QQ
刚刚解压了试试,发现还是早期的那个版本

文件大小都没变





顶部
 



当前时区 GMT+8, 现在时间是 2008-7-20 19:28
沪ICP备05042587号

本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0 © 2001-2007 Comsenz Inc.
清除 Cookies - 联系我们 - 中国分布式计算总站 - Archiver - WAP