找回密码
 新注册用户
搜索
查看: 9822|回复: 21

AMD的K7怎么这么慢?

[复制链接]
发表于 2007-1-1 14:58:25 | 显示全部楼层 |阅读模式
用Superpi测试,我的xp1700+运算速度比赛扬4 1.7G快很多,但可能程序优化有问题,现在跑一个PISegment 要3个多小时,而赛扬4 1.7G只要一个多小时,慢了一倍以上,能否为K7核心的CPU也优化一下程序,提高效率,K7核心的CPU应该还是有很多人在用。
回复

使用道具 举报

发表于 2007-1-1 17:43:50 | 显示全部楼层
没办法,just手头没有k7的cpu,无法对其进行进一步的优化
回复

使用道具 举报

发表于 2007-1-1 18:09:20 | 显示全部楼层
好像是针对 SSE? 优化的吧。K7 不支持太多的 SSE? 。
回复

使用道具 举报

 楼主| 发表于 2007-1-1 20:57:34 | 显示全部楼层
K7支持SSE但不支持SSE2,但赛扬4支持SSE2,不知道是否是SSE2的关系,不知有无使用P3或C2\C3的,他们的速度怎样?
回复

使用道具 举报

发表于 2007-1-1 21:05:59 | 显示全部楼层
引用 gy-ygf 在 2007-1-1 20:57 时的帖子:
K7支持SSE但不支持SSE2,但赛扬4支持SSE2,不知道是否是SSE2的关系,不知有无使用P3或C2\C3的,他们的速度怎样?


不知道。。。不过也没关系啦。运算量不是真的太巨大。应该一年半载之内会算完的了。
回复

使用道具 举报

发表于 2007-1-1 23:33:38 | 显示全部楼层
引用 老冬腌菜 在 2007-1-1 05:43 PM 时的帖子:
没办法,just手头没有k7的cpu,无法对其进行进一步的优化

这是最主要的

另外优化也不是一件简单的事情
回复

使用道具 举报

 楼主| 发表于 2007-1-2 14:29:02 | 显示全部楼层
不知是否是SSE2的问题,那位同仁可以提供一下P3或C2\C3的速度,他们同样只支持sse。一天算不了几个,觉得没有成就感
回复

使用道具 举报

发表于 2007-1-3 04:50:53 | 显示全部楼层
我在用毒龙1.33G 算,是好慢啊,3个多小时算一个,比c2 950感觉都慢
回复

使用道具 举报

头像被屏蔽
发表于 2007-1-3 19:08:15 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2007-1-3 22:51:32 | 显示全部楼层
引用 gy-ygf 在 2007-1-1 14:58 时的帖子:
用Superpi测试,我的xp1700+运算速度比赛扬4 1.7G快很多,但可能程序优化有问题,现在跑一个PISegment 要3个多小时,而赛扬4 1.7G只要一个多小时,慢了一倍以上,能否为K7核心的CPU也优化一下程序,提高效率,K7核 ...

我也有想过这个问题 感觉于see2有关 时间上 差异很大~~~~~~~~~
回复

使用道具 举报

 楼主| 发表于 2007-1-4 08:46:52 | 显示全部楼层
能否编译个不支持SSE2,没有为Intel优化的程序,或许会快些。我只有C语言的编程经验,不知是否会很麻烦。
回复

使用道具 举报

发表于 2007-1-4 09:51:12 | 显示全部楼层
现在的核心中包含三个版本:
使用SSE2优化的版本,适用于netburst等长管线架构
使用general指令计算+SSE搬运优化的版本,适用于K8、conroe、P3、有SSE的K7、PM等短管线架构
只使用general指令的版本,用于其他架构

目前只有netburst经过精心的指令排布,其他架构因为没有相应的机器无法精细优化
另外短管的架构本身对指令排布不敏感,目前的效率已经很高
如果有时间,可能会在以后对conroe精心优化

优化的成本是极高的,优化一条汇编指令的工程量近乎于编写100条高级语言代码
回复

使用道具 举报

 楼主| 发表于 2007-1-5 08:47:16 | 显示全部楼层
我以为编译时选择for p4 for k8就可以了,原来需要汇编指令,好麻烦(不好意思,老了)。
不过如果为支持SSE3的K8优化应该不错,毕竟K8是主流机型,还将流行一段时间。
回复

使用道具 举报

发表于 2007-1-5 10:43:51 | 显示全部楼层
引用 gy-ygf 在 2007-1-5 08:47 时的帖子:
我以为编译时选择for p4 for k8就可以了,原来需要汇编指令,好麻烦(不好意思,老了)。
不过如果为支持SSE3的K8优化应该不错,毕竟K8是主流机型,还将流行一段时间。


那种形式的优化虽然也有用,但总是没有汇编级的优化高效的。前者是尽量优化,用户无法控制太多,后者是用户自行优化,简直是一条条指令都是在手下控制着。

如果能力足够的话,直接用汇编语言写也不错的。
回复

使用道具 举报

发表于 2007-1-5 15:15:45 | 显示全部楼层
Pentium III 的速度可以接受,毕竟主频不高
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-24 17:37

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表