找回密码
 新注册用户
搜索
楼主: agentcn

[讨论] ARM和X86平台计算BOINC,性能相差了多少?

  [复制链接]
发表于 2012-11-16 16:28:09 | 显示全部楼层
考虑性能还要考虑乱序执行和顺序执行的能力。
回复

使用道具 举报

发表于 2012-11-16 17:03:52 | 显示全部楼层
ARM应该没有SIMD类型的指令吧……于是如果某个程序可以用SIMD类型的指令优化的话,在x86上肯定有优势……
回复

使用道具 举报

发表于 2012-11-16 18:19:25 | 显示全部楼层
回复 14# agentcn


    产品太多了,上网本、部分一体机、部分服务器、超低功耗台式机…联想K800手机也用Atom(凌动)处理器哦。
回复

使用道具 举报

发表于 2012-11-16 18:32:01 | 显示全部楼层
总之一句话:二者差异太大,没有可比性。
其实,何必纠结呢,哪个快、哪个得分多就用哪个呗。。。
回复

使用道具 举报

发表于 2012-11-16 19:11:35 | 显示全部楼层
可以关注下最新版3DMark,据说能通吃Windows、Windows RT、iOS、Android四大操作系统,横跨桌面和移动设备,而且不同平台上的成绩是可以直接对比~~~~~~~~~~
回复

使用道具 举报

发表于 2012-11-16 19:22:08 | 显示全部楼层
其实当今最权威的性能测试,应该属Linpack吧?大到超级计算机,小到移动设备,它都可以测试机器的每秒浮点性能(FLOPS)。然而,就算是FLOPS也并不能完全地体现出设备的真实性能:因为还有整数与逻辑运算性能影响着运算速度。所以,测试只有一定参考价值,具体还要看真实水平。
回复

使用道具 举报

发表于 2012-11-16 20:01:02 | 显示全部楼层
回复 9# xuyongchen
这个估计和优化有关,实际只看硬件的性能的话,Tegra3 比 i7 差得远
上一张图
001848293.jpg

这里tegra 3 的数据是nvidia 自己提供的
t7200 new 代表用GCC 4.4.1 -o3, 就是和tegra 3 评测用的相同的编译器
t7200 old 代表用GCC 3.4.4 -o2,比GCC 4.4.1 -o3 的编译优化要差一些

而且是nvidia官方的数据,nvidia很可能在评测时对tegra3用了neon指令优化,而没有用t7200的sse等

不知道有没有人有tegra3的开发板?这样就可以做一个基于普通linux的完整的测试(android上的测试各种不靠谱。。。。。。)
回复

使用道具 举报

发表于 2012-11-16 20:44:22 | 显示全部楼层
有项目支持吗?哪
回复

使用道具 举报

发表于 2012-11-16 21:22:52 | 显示全部楼层
回复 22# gameboybf2142


    上面是tegra 2诶。。。
回复

使用道具 举报

发表于 2012-11-17 00:40:39 | 显示全部楼层
回复 24# xuyongchen
那个Kal-El是tegra 3的内部代号
下面才是tegra 2
回复

使用道具 举报

发表于 2012-11-17 02:12:43 | 显示全部楼层
回复 25# gameboybf2142


    哦,原来如此
回复

使用道具 举报

发表于 2012-11-17 22:26:54 | 显示全部楼层
怎麼弄ARM跑啊?
iPhone可以不?
我能找到個iOS的boinc app
可是不會弄
回复

使用道具 举报

发表于 2012-11-18 13:50:30 | 显示全部楼层
我之前手机算过prime,拼上电费都算不过x86。

可能是现在的arm程序都不成熟,优化不够吧。
回复

使用道具 举报

发表于 2012-11-28 23:48:22 | 显示全部楼层
关注一下
回复

使用道具 举报

发表于 2012-11-29 19:36:04 | 显示全部楼层
我的意思是同样频率下,假设有一个同样的程序,核心数一样,同样的晶体管面积,X86是不是肯定比ARM快,但是温度高?
agentcn 发表于 2012-11-16 16:12


首先,你要搞清楚一个概念:X86 和 ARM 都只是一个指令集的名称。所谓“指令集”,你可以简单地理解为“软件和硬件的接口”,这其中的关键“接口”两个字!因为接口只是个形式,而不是具体实现。

其次,在同一指令集之下,可以有不同的逻辑设计。比如,是否采用流水线设计技术?如果采用流水线设计,是采用线性还是非线性、是静态还是动态,等等等等。

最后是实现,这个可以简单理解为工艺吧。

最典型的例子莫过于 AMD 和 Intel 了,他们都使用 X86 指令集,尽管制造工艺相近(都是 45nm 技术),但由于各自的逻辑设计不同,造成同频的 Sandy 要比 推土机 的效率高,而发热量却反而更低。

因此,指令集就好比一个门,逻辑设计就如你打开门之后看到的房间布局,而物理实现就是建造房间所用的材质了。

讲到这,我想你应该很清楚答案了:不一定!

只要给 ARM 加上足够多的技术手段,比如把缓存扩充到与 X86 CPU 一样多、使用更先进的制造工艺等,就有可能使 ARM 快过 X86 CPU,但发热量不高于 X86。另外,即使不增加设计复杂度,仅仅是在同一频率下,也可以通过精心选择对 ARM 有利的指令来执行,来达到“快”过 X86 的感觉。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-13 01:59

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表