标题: [Pi Segment]64位优化测试V2.0
JUST
版主
Rank: 6Rank: 6Rank: 6



UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2007-1-9 10:53  资料  短消息  加为好友 
[Pi Segment]64位优化测试V2.0

需64位操作系统

解压后依次运行两个.exe文件
会生成两个.txt文件,贴在这里即可

运行时间约为1分钟,其间建议关闭其他使用CPU的程序以获得准确数据

谢谢!



查看积分策略说明
附件
2007-1-9 10:53
  下载次数: 46
64bittest_v2.rar (81.64 KB)
 







中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
[广告] Einstein@Home 官方优化程序,推荐使用!
xxeitx
论坛知事
Rank: 3Rank: 3Rank: 3


UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
发表于 2007-1-9 11:46  资料  短消息  加为好友 
Batch Test | Long Pipeline Version | V 2.0
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 3600+
ID=1948 Cycle=42 Count=2
ID=2444 Cycle=42 Count=9
ID=9713 Cycle=42 Count=8
ID=11312 Cycle=42 Count=4
ID=844 Cycle=42 Count=17
ID=1737 Cycle=42 Count=2
ID=780 Cycle=42 Count=5
ID=10775 Cycle=42 Count=3
ID=89 Cycle=42 Count=7
ID=1065 Cycle=42 Count=16
ID=10823 Cycle=42 Count=5
ID=2876 Cycle=42 Count=9
ID=3079 Cycle=42 Count=3
ID=9543 Cycle=42 Count=2
ID=190 Cycle=42 Count=2
ID=12433 Cycle=42 Count=6
ID=272 Cycle=42 Count=2
ID=1593 Cycle=42 Count=3
ID=348 Cycle=42 Count=3
ID=10755 Cycle=42 Count=7
ID=5697 Cycle=42 Count=2
ID=11121 Cycle=42 Count=4
ID=9540 Cycle=42 Count=2
ID=524 Cycle=42 Count=2
ID=11804 Cycle=42 Count=6
ID=12207 Cycle=42 Count=2
ID=2508 Cycle=42 Count=2
ID=8689 Cycle=42 Count=2
ID=10642 Cycle=42 Count=2





顶部
xxeitx
论坛知事
Rank: 3Rank: 3Rank: 3


UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
发表于 2007-1-9 11:47  资料  短消息  加为好友 
Batch Test | ShortPipeline Version | V 2.0
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 3600+
ID=8785 Cycle=21 Count=22
ID=14081 Cycle=21 Count=14
ID=12825 Cycle=21 Count=24
ID=11249 Cycle=21 Count=3
ID=11963 Cycle=21 Count=2
ID=9484 Cycle=21 Count=2





顶部
tonybuaa
新手上路
Rank: 1


UID 12109
精华 0
积分 31
帖子 31
阅读权限 10
注册 2006-10-25
来自 Beijing
发表于 2007-1-9 20:33  资料  主页 短消息  加为好友  添加 tonybuaa 为MSN好友 通过MSN和 tonybuaa 交谈 QQ ICQ 状态
Batch Test | Long Pipeline Version | V 2.0
CPU: Intel(R) Pentium(R) D CPU 2.80GHz
ID=9135 Cycle=46 Count=11
ID=9140 Cycle=46 Count=8
ID=1622 Cycle=46 Count=79
ID=5128 Cycle=46 Count=11
ID=972 Cycle=46 Count=9
ID=10949 Cycle=46 Count=16
ID=9066 Cycle=46 Count=2
ID=697 Cycle=46 Count=52
ID=7599 Cycle=46 Count=2
ID=9136 Cycle=46 Count=7

Batch Test | ShortPipeline Version | V 2.0
CPU: Intel(R) Pentium(R) D CPU 2.80GHz
ID=13897 Cycle=50 Count=59
ID=13568 Cycle=53 Count=42
ID=13898 Cycle=49 Count=55
ID=6184 Cycle=52 Count=22
ID=13925 Cycle=50 Count=6
ID=13596 Cycle=53 Count=9
ID=11312 Cycle=53 Count=2
ID=14068 Cycle=53 Count=3





[img]http://www.pisegment.net/sign/signid.aspx?userid=1c3c9036-153d-48c2-bc78-b5e73778e847&language=cs[/img]
顶部
momomodaTX
论坛知事
Rank: 3Rank: 3Rank: 3


UID 12206
精华 0
积分 355
帖子 175
阅读权限 10
注册 2006-11-18
发表于 2007-1-10 05:01  资料  短消息  加为好友  添加 momomodaTX 为MSN好友 通过MSN和 momomodaTX 交谈 QQ
Batch Test | Long Pipeline Version | V 2.0
CPU: Intel(R) Core(TM)2 CPU          6300  @ 1.86GHz
ID=4847 Cycle=37 Count=85
ID=726 Cycle=37 Count=7
ID=147 Cycle=37 Count=15
ID=91 Cycle=37 Count=81
ID=9672 Cycle=37 Count=2
ID=3226 Cycle=37 Count=5
ID=936 Cycle=37 Count=4
Batch Test | ShortPipeline Version | V 2.0
CPU: Intel(R) Core(TM)2 CPU          6300  @ 1.86GHz
ID=7235 Cycle=37 Count=2
ID=5076 Cycle=37 Count=2
ID=5149 Cycle=37 Count=10
ID=5137 Cycle=37 Count=5
ID=5119 Cycle=37 Count=2
ID=5150 Cycle=37 Count=39
ID=14096 Cycle=37 Count=14
ID=14114 Cycle=37 Count=2
ID=13742 Cycle=37 Count=5
ID=14063 Cycle=37 Count=2
ID=13686 Cycle=37 Count=5
ID=13631 Cycle=37 Count=2
ID=14109 Cycle=37 Count=4
ID=13358 Cycle=37 Count=6
ID=8977 Cycle=37 Count=3
ID=14032 Cycle=37 Count=3
ID=5155 Cycle=37 Count=2
ID=13792 Cycle=37 Count=2
ID=6303 Cycle=37 Count=5
ID=14033 Cycle=37 Count=3
ID=14057 Cycle=37 Count=2
ID=13969 Cycle=37 Count=5
ID=14099 Cycle=37 Count=2
ID=13981 Cycle=37 Count=2
ID=7534 Cycle=37 Count=2
ID=13254 Cycle=37 Count=2






顶部
xxeitx
论坛知事
Rank: 3Rank: 3Rank: 3


UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
发表于 2007-1-10 17:04  资料  短消息  加为好友 
怎么测试的人越来越少了





顶部
彬彬
论坛担当
Rank: 4



UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
发表于 2007-1-10 17:08  资料  短消息  加为好友 


QUOTE:
引用 xxeitx 在 2007-1-10 17:04 时的帖子:
怎么测试的人越来越少了

愿意加与的人本来就少了,再加上是 64 位的测试,当然更少。。。因为用 64 位软件平台的人不多。我这么多台机,也才 3 台是 64 位硬件,但清一色 32 位系统。所以没办法。。。

顶部
JUST
版主
Rank: 6Rank: 6Rank: 6



UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2007-1-10 19:17  资料  短消息  加为好友 
数据基本足够了

预期加速效果:
Netburst  19%
K8    38%
conroe    0%








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
momomodaTX
论坛知事
Rank: 3Rank: 3Rank: 3


UID 12206
精华 0
积分 355
帖子 175
阅读权限 10
注册 2006-11-18
发表于 2007-1-10 19:23  资料  短消息  加为好友  添加 momomodaTX 为MSN好友 通过MSN和 momomodaTX 交谈 QQ
0%...






顶部
xxeitx
论坛知事
Rank: 3Rank: 3Rank: 3


UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
发表于 2007-1-10 19:33  资料  短消息  加为好友 
扣肉居然是0?不过K8增加好多,呵呵





顶部
apple (Lolicon)
版主
Rank: 6Rank: 6Rank: 6
Nice boat.


UID 3937
精华 2
积分 1362
帖子 897
阅读权限 100
注册 2005-2-13
来自 广东广州
发表于 2007-1-10 21:36  资料  主页 短消息  加为好友  QQ
0%.....绝望了
PS:没64位平台。。。。。没法测试





抛弃过去·走向未来
-------------
全力SoB,主力机:E6300+1G
/*死机问题解决,CPU温度从85度回落,继续SoB*/
-------------

--------------
顶部
JUST
版主
Rank: 6Rank: 6Rank: 6



UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2007-1-10 23:18  资料  短消息  加为好友 
看到这个结果我也挺失望的
本来希望conroe能提升很多的

这个测试包中包含了1万多种不同的算法,进行自动对比,输出最优的几种方案
conroe都是37个cycle,基本可以认定这就是它的极限了








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
Frankenstein
新手上路
Rank: 1



UID 12384
精华 0
积分 33
帖子 32
阅读权限 10
注册 2007-1-2
发表于 2007-1-11 00:09  资料  短消息  加为好友 


QUOTE:
引用 JUST 在 2007-1-10 23:18 时的帖子:

这个测试包中包含了1万多种不同的算法,进行自动对比,输出最优的几种方案
conroe都是37个cycle,基本可以认定这就是它的极限了

大哥,不会吧,里面真的有一万多种关于PI运算的算法?
能不能介绍一下,谢谢.(很想学)





顶部
彬彬
论坛担当
Rank: 4



UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
发表于 2007-1-11 08:32  资料  短消息  加为好友 


QUOTE:
引用 JUST 在 2007-1-10 23:18 时的帖子:
看到这个结果我也挺失望的
本来希望conroe能提升很多的

这个测试包中包含了1万多种不同的算法,进行自动对比,输出最优的几种方案
conroe都是37个cycle,基本可以认定这就是它的极限了

1W 多种并不代表所有吧。另外,你指的算法是计算的方法,还是同一种算法的1W多种不同优化方法?

CONROE 对性能提升效果最大的不是在于短管线或是大L2。因为用短管线可以在底频下将效能提升这是必然的。而它表现得比 K8 更强的地方只是在 Wide Dynmaic Execution 和 Micro-op FusioN 等技术。

以下引用网上找来的资料:

**********
Intel Core微架构的Wide Dynmaic Execution和Adcanced Dynamic Executive意念不同,它的出发点在于如何提高每周期指令处理数目,改善执行时间及提升处理器的能源效益,Core微架构拥有4组Decoder(3 Simple decoders + 1 Complex decoder),比上代Pentium Pro(P6)/PentiumII/PentiumIII/Pentium M架构拥有2 Simple decoders + 1 Complex decoder可多处理一组指令,与AMD K8不同的是它只拥有3组Complex ecoders,正常来说大部份x86指令均可以采用Simple Coder把它翻译成一个Micro-Op指令,只有极少数学运算的指令,需要采用Complex decoders来把它翻译为四个Micro-Ops指令
Wide Dynamaic Execution首次加入了Macro-Fusion技术。在旧世代的微架构中,每个指令被送来时其译码及执行动作是完全独立的,但Intel Core微架构可以让常见的指令组例如一个Compare指令配随后拥有一个Jump指令,便可把这个指令组合成单一的Micro-Op指令,这令Core微架构在特定情况下每个周期有运算五组指令,据Intel表示大部份x86程序,约每十至十五个指令就会出现一组可透过Macro -Fusion被组合,因此减少了程序执行所需运算时间
此外,Intel Core微架构保留了Banias微架构的Micro-op Fusion技术,在现代的x86处理器,x86指令(Macro-ops)会被分拆去为长短相同的Micro-Ops指令,才会被送往处理器的Pipeline等候执行,而Micro-op Fusion能把相同的Macro-ops混合成单一个Micro-ops,减少了Micro-ops运算的数目亦令处理器运作排序更有效率,据Intel表示,Micro-op Fision透过Out-of-order逻辑可以减高达10%的Micro-op指令执行数
**********
引用完毕。

如果真如 INTEL 上面的资料说的一样的话,前者每 10 到 15 条指令就有一条得到“免费执行”,后者 有 10% 的性能提升。那就算前者是每15条指令才“免费”一次,加起来也有 17% 左右了,而这 17% 的前提是已经通过改短管线,用新制程等提升效能之后的性能的再 17%,并不是 P4 的 17%,跟 P4 比起来,已经不只 17% 了。

我本人觉得扣肉虽然说白了是从 PIII 进化到 PM 后的再一次进化,但它已经与 PIII 完全不同了,它新技术相对太多,所以优化潜力也非常大。以前 P4 出来后 INTEL 有推出自己的编译优化软件来克服效能底,并最大化效能的,不知道针对扣肉的出了没有,如果出了的话,那我相 INTEL 的编译优化软件才能真正能生成对扣肉做最大优化的程序。

顶部
Frankenstein
新手上路
Rank: 1



UID 12384
精华 0
积分 33
帖子 32
阅读权限 10
注册 2007-1-2
发表于 2007-1-11 08:51  资料  短消息  加为好友 
晕死,高手啊....................





顶部
 



当前时区 GMT+8, 现在时间是 2008-7-24 15:59
沪ICP备05042587号

本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0 © 2001-2007 Comsenz Inc.
清除 Cookies - 联系我们 - 中国分布式计算总站 - Archiver - WAP