找回密码
 新注册用户
搜索
楼主: Youth

[分享] Einstein@Home 官方优化程序!(S5R3, 已失效)

[复制链接]
 楼主| 发表于 2008-4-3 22:37:30 | 显示全部楼层
据说SSE3对目前的计算程序不会有什么帮助
回复

使用道具 举报

发表于 2008-4-4 08:06:08 | 显示全部楼层
T2450,SAH使用SSE3 r2.4v优化,EAH使用4.36的优化,结果是EAH得分速度是SAH的1.3倍
EAH每个包238分,时间在6万秒左右。

[ 本帖最后由 cnchina 于 2008-4-4 08:07 编辑 ]
回复

使用道具 举报

 楼主| 发表于 2008-4-4 11:49:31 | 显示全部楼层
主要原因是seti的官方程序已经优化不少了,后出的优化程序提升幅度就相对小一些。
回复

使用道具 举报

发表于 2008-4-4 13:45:17 | 显示全部楼层
希望会出酷睿2支持的SSSE3的优化~
回复

使用道具 举报

发表于 2008-4-7 22:13:16 | 显示全部楼层
有支持64位么/
回复

使用道具 举报

 楼主| 发表于 2008-4-8 08:43:44 | 显示全部楼层
没有,貌似也没这方面的计划
回复

使用道具 举报

 楼主| 发表于 2008-4-28 11:36:31 | 显示全部楼层
@ 更新了MAC-PPC的优化,比4.41大概提速10%
回复

使用道具 举报

发表于 2008-4-28 13:25:46 | 显示全部楼层
还停留在SSE,失望啊…………
回复

使用道具 举报

 楼主| 发表于 2008-4-28 13:59:24 | 显示全部楼层
呵呵,没什么好失望的啊,在务必保证计算结果可靠性的前提下,项目方在优化程序方面已经很努力了,翻译几个帖子吧。

http://einstein.phys.uwm.edu/for ... p;nowrap=true#81998

有人问:
Since we're talking about feature detection now, are there any plans to go up to SSE2, or would the costs of doing so outweigh the benefits?
既然现在能够自动检测指令集了,有没有计划推出针对SSE2或其它指令集的计算程序?还是说这样做的代价会超过所带来的好处?

Bernd答:
There's still some room for improvements of the SSE code, I'll try that first. My rough guess is that SSE2 would gain less than 10% over the best possible SSE App.
However with the new way of feature-based App switching the "costs" (for the project) are lowered too, compared to the cumbersome mixed-linked Apps we had before.
目前的SSE代码仍有提升空间,我还会试一试,不过推测SSE2带来的提升不会超过10%,当然,考虑到可以自动检测指令集,多准备几种优化方式的代价也相对小一些了。

旁边有人说:
Fair enough. There will definitely be diminishing returns on the efforts. If you provide SSE2, then I'm sure people will want SSE3, SSSE3, SSE4, etc... My guess, based on what is being seen with SETI, is that SSE3 is where meaningful improvements would stop. For AMD processors, it became apparent that SSE3 had negligible differences (perhaps due to missing HyperThreading?)...
总归优化程度越高后带来的好处也会越来越少。如果提供了SSE2版本,马上就会有人要SSE3版本、SSSE3版本。。。根据我在SETI项目观察到的,在SSE3之后就不会有明显的提升了。而对于AMD处理器,SSE3的效果还更差。

Bernd又说:
In the new code we tried to avoid double precision as much as possible, so we already can perform most calculations in SSE. In the two functions that take the most time there is not much left to the compiler to optimize. Benefits from double-precision vectorization, more registers etc. are actually pretty minimal (e.g. the current kernel loop only uses 5 of 8 xmm registers, there is simply no benefit from having twice as many or even more).
There are a few specific features of SSE2 that are helpful, but only if the instructions are carefully placed into the code, probably in assembler (inline assembler in the code or using some well-coded math library). The full-blown 64Bit/SSE2 experiment where I left most to the compiler was nothing less than disappointing.
在新的代码里,我们已经尽量避免使用双精度数据,因此可以用SSE完成大部分的计算。在消耗计算时间最多的两个函数里已经没有多少可供优化的空间了。SSE2以及更高版本指令集带来的好处将非常少。有几个SSE2的特性可能会有所帮助,但需要非常小心地引入到代码中。目前的测试结果并不乐观。
回复

使用道具 举报

发表于 2008-4-28 14:26:42 | 显示全部楼层
youth在一楼最后的链接会受到个人论坛设置的影响,默认设置的人不能正确打开该链接
我的是默认每页10个回帖,所以84楼在第9页,而非第6页。
http://www.equn.com/forum/viewth ... mp;page=9#pid243468

page后面的参数不同。
youth的page是第6页
回复

使用道具 举报

 楼主| 发表于 2008-4-28 15:03:42 | 显示全部楼层
收到,貌似discuz比较土。。。搜索到一个解决办法:

http://www.discuz.net/viewthread ... p;page=1#pid7049225

已更新一楼:)
回复

使用道具 举报

发表于 2008-4-28 16:45:06 | 显示全部楼层
呵呵,在别的论坛我也遇到过类似的情况。
page的问题是discuz自己做的问题。

---
改过后就不会受到不同设置的影响了应该。
回复

使用道具 举报

发表于 2008-4-28 20:22:50 | 显示全部楼层


那我们就这样决定,优化到SSE2为止
回复

使用道具 举报

发表于 2008-4-28 20:23:03 | 显示全部楼层
28号更新了什么玩意?
回复

使用道具 举报

发表于 2008-4-28 20:24:42 | 显示全部楼层
刚刚解压了试试,发现还是早期的那个版本

文件大小都没变
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-27 10:17

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表