标题: AMD的K7怎么这么慢?
gy-ygf
论坛会员
Rank: 2Rank: 2



UID 12333
精华 0
积分 54
帖子 54
阅读权限 10
注册 2006-12-20
发表于 2007-1-1 14:58  资料  短消息  加为好友 
AMD的K7怎么这么慢?

用Superpi测试,我的xp1700+运算速度比赛扬4 1.7G快很多,但可能程序优化有问题,现在跑一个PISegment 要3个多小时,而赛扬4 1.7G只要一个多小时,慢了一倍以上,能否为K7核心的CPU也优化一下程序,提高效率,K7核心的CPU应该还是有很多人在用。

顶部
[广告] Einstein@Home 官方优化程序,推荐使用!
老冬腌菜
资深顾问
Rank: 5Rank: 5



UID 9354
精华 1
积分 1051
帖子 792
阅读权限 10
注册 2005-12-12
发表于 2007-1-1 17:43  资料  短消息  加为好友 
没办法,just手头没有k7的cpu,无法对其进行进一步的优化





现在开始狂算Protein@Home、Riesel Sieve Project~
顶部
彬彬
论坛担当
Rank: 4



UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
发表于 2007-1-1 18:09  资料  短消息  加为好友 
好像是针对 SSE? 优化的吧。K7 不支持太多的 SSE? 。

顶部
gy-ygf
论坛会员
Rank: 2Rank: 2



UID 12333
精华 0
积分 54
帖子 54
阅读权限 10
注册 2006-12-20
发表于 2007-1-1 20:57  资料  短消息  加为好友 
K7支持SSE但不支持SSE2,但赛扬4支持SSE2,不知道是否是SSE2的关系,不知有无使用P3或C2\C3的,他们的速度怎样?

顶部
彬彬
论坛担当
Rank: 4



UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
发表于 2007-1-1 21:05  资料  短消息  加为好友 


QUOTE:
引用 gy-ygf 在 2007-1-1 20:57 时的帖子:
K7支持SSE但不支持SSE2,但赛扬4支持SSE2,不知道是否是SSE2的关系,不知有无使用P3或C2\C3的,他们的速度怎样?

不知道。。。不过也没关系啦。运算量不是真的太巨大。应该一年半载之内会算完的了。

顶部
JUST
版主
Rank: 6Rank: 6Rank: 6



UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2007-1-1 23:33  资料  短消息  加为好友 


QUOTE:
引用 老冬腌菜 在 2007-1-1 05:43 PM 时的帖子:
没办法,just手头没有k7的cpu,无法对其进行进一步的优化

这是最主要的

另外优化也不是一件简单的事情








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
gy-ygf
论坛会员
Rank: 2Rank: 2



UID 12333
精华 0
积分 54
帖子 54
阅读权限 10
注册 2006-12-20
发表于 2007-1-2 14:29  资料  短消息  加为好友 
不知是否是SSE2的问题,那位同仁可以提供一下P3或C2\C3的速度,他们同样只支持sse。一天算不了几个,觉得没有成就感

顶部
woozhou52
新手上路
Rank: 1



UID 12381
精华 0
积分 23
帖子 23
阅读权限 10
注册 2007-1-1
发表于 2007-1-3 04:50  资料  短消息  加为好友 
我在用毒龙1.33G 算,是好慢啊,3个多小时算一个,比c2 950感觉都慢





顶部
xxeitx
论坛知事
Rank: 3Rank: 3Rank: 3


UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
发表于 2007-1-3 19:08  资料  短消息  加为好友 
我终于开始算了,但界面上有个问题,我的3600+双核,在界面上有显示HT的,而SSE是支持到SSE3,可界面显示SSE2





顶部
caosimin7532
论坛会员
Rank: 2Rank: 2


UID 6465
精华 0
积分 116
帖子 116
阅读权限 10
注册 2005-7-31
来自 佛山
发表于 2007-1-3 22:51  资料  短消息  加为好友  QQ


QUOTE:
引用 gy-ygf 在 2007-1-1 14:58 时的帖子:
用Superpi测试,我的xp1700+运算速度比赛扬4 1.7G快很多,但可能程序优化有问题,现在跑一个PISegment 要3个多小时,而赛扬4 1.7G只要一个多小时,慢了一倍以上,能否为K7核心的CPU也优化一下程序,提高效率,K7核 ...

我也有想过这个问题 感觉于see2有关 时间上 差异很大~~~~~~~~~





不要积分统计,不是因为我不懂,是我不想,不想为一个数字而做一件本来就很有意义的事,我喜欢默默的………
顶部
gy-ygf
论坛会员
Rank: 2Rank: 2



UID 12333
精华 0
积分 54
帖子 54
阅读权限 10
注册 2006-12-20
发表于 2007-1-4 08:46  资料  短消息  加为好友 
能否编译个不支持SSE2,没有为Intel优化的程序,或许会快些。我只有C语言的编程经验,不知是否会很麻烦。

顶部
JUST
版主
Rank: 6Rank: 6Rank: 6



UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2007-1-4 09:51  资料  短消息  加为好友 
现在的核心中包含三个版本:
使用SSE2优化的版本,适用于netburst等长管线架构
使用general指令计算+SSE搬运优化的版本,适用于K8、conroe、P3、有SSE的K7、PM等短管线架构
只使用general指令的版本,用于其他架构

目前只有netburst经过精心的指令排布,其他架构因为没有相应的机器无法精细优化
另外短管的架构本身对指令排布不敏感,目前的效率已经很高
如果有时间,可能会在以后对conroe精心优化

优化的成本是极高的,优化一条汇编指令的工程量近乎于编写100条高级语言代码








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
gy-ygf
论坛会员
Rank: 2Rank: 2



UID 12333
精华 0
积分 54
帖子 54
阅读权限 10
注册 2006-12-20
发表于 2007-1-5 08:47  资料  短消息  加为好友 
我以为编译时选择for p4 for k8就可以了,原来需要汇编指令,好麻烦(不好意思,老了)。
不过如果为支持SSE3的K8优化应该不错,毕竟K8是主流机型,还将流行一段时间。

顶部
彬彬
论坛担当
Rank: 4



UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
发表于 2007-1-5 10:43  资料  短消息  加为好友 


QUOTE:
引用 gy-ygf 在 2007-1-5 08:47 时的帖子:
我以为编译时选择for p4 for k8就可以了,原来需要汇编指令,好麻烦(不好意思,老了)。
不过如果为支持SSE3的K8优化应该不错,毕竟K8是主流机型,还将流行一段时间。

那种形式的优化虽然也有用,但总是没有汇编级的优化高效的。前者是尽量优化,用户无法控制太多,后者是用户自行优化,简直是一条条指令都是在手下控制着。

如果能力足够的话,直接用汇编语言写也不错的。

顶部
tbstudiozlj
论坛知事
Rank: 3Rank: 3Rank: 3


UID 10435
精华 0
积分 324
帖子 99
阅读权限 10
注册 2006-2-5
来自 上海
发表于 2007-1-5 15:15  资料  短消息  加为好友  QQ
Pentium III 的速度可以接受,毕竟主频不高





顶部
 



当前时区 GMT+8, 现在时间是 2008-7-24 04:51
沪ICP备05042587号

本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0 © 2001-2007 Comsenz Inc.
清除 Cookies - 联系我们 - 中国分布式计算总站 - Archiver - WAP