找回密码
 新注册用户
搜索
查看: 49716|回复: 152

【EQUN原创】中端性价比之王——GTS450通用计算成绩放出

  [复制链接]
发表于 2010-9-3 17:06:28 | 显示全部楼层 |阅读模式
本帖最后由 cicikml 于 2010-9-3 17:57 编辑

    EQUN原创稿件,转载请注明出处。

    在经历了漫长的等待之后,NVIDIA终于为700-1000元市场设计出一款性价比超高的GPU核心——GF106。之前我们已经通过厂商内部获得了这款核心的相关细节,也获知了它的性能介于GTS250和GTX260+之间,今天通过一款通路厂商提供的产品,让我们一同了解GF106核心在GPU通用计算方面的性能,借此机会同时放出国外玩家的测试报告。此贴仅为EQUN论坛的各位会员选择适合自己的硬件设备做参考,希望我们涉及到的相关厂商不要找到这来删帖。

    作为中端性能级市场的主力军,这款GPU核心必须严格控制晶体管规模以提高良率降低成本,所以它原生集成192个CUDA统一计算单元,128bit显存控制器,按照GF104芯片的布局规模,我们猜测它的所有规格基本是GF104核心的一半,所以它具备4个多形体引擎(包含4个曲面细分单元)。值得一提的是GF106继承了Fermi架构的存储体系,从现有数据推算,GF106芯片的缓存得到了保留。这对通用计算和图形的帮助都是非常明显的。

    FAH成绩在4楼,如果你急于查看这款GPU的PPD成绩,请点击这里

    下面让我们对这款GPU规格进行简单了解。首先是GPU-Z截图,一些参数出错,但是还是能看出一些东西。

    450-1.gif

    然后是GPU-Z第二屏截图,我们看到GTS450同样支持非常完善的节能特性,频率最低下降到50MHz。

    450-2.gif

    现在是更为详细的Everest软件测试,我们使用了GPGPU界面CUDA接口。在这里,1GB显存容量和993MB剩余容量被正常显示。Warp Size宽度和G80以来的所有产品一致为32。

    450-3.png

    我们看到这款GPU内部有4个SM,在计算特性方面,双精度浮点和64位原子操作都获得了保留。我们猜测GF106核心的双精度实现方式和GF104是完全一样的。它们相对于Tesla版本的Fermi架构GPU,回归了使用SFU单元来运算双精度的方式,这是在GT200芯片中已经被大家熟知的运算方式。它的特点是双精度性能大约是单精度的1/8-1/12。

    最后我们使用了SiSoftware Sandra 2010版软件来检测这款显卡所搭载的GPU理论浮点吞吐量。这个测试可以检测GPU的Shader单元运算能力,虽然它是面向通用计算程序设计的,但是在一些较为高端的对Shader负载较重的游戏中,Shader单元运算能力强的显卡可以有更强劲的发挥和更小的性能衰减。

    需要注意的是这里检测的仅是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。测试对N卡和A卡都默认基于Open CL编程接口,同时测试者可以自行选择编程接口,所以测试结果无论是对于NVIDIA还是AMD都比较公正。

    我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。

450-4.PNG

评分

参与人数 3基本分 +39 收起 理由
caozhonghua + 6 原创内容
金鹏 + 23 精品文章
zglloo + 10 GJ支持原创

查看全部评分

回复

使用道具 举报

 楼主| 发表于 2010-9-3 17:07:59 | 显示全部楼层
本帖最后由 cicikml 于 2010-9-3 17:46 编辑

回复 1# cicikml



    第二贴是所有GPU通用计算项目测试成绩汇总,首先让我们通过CUDA-Z来获知这款GPU的通用计算性能。

    捕获.PNG

    底层计算性能理论测试证明了我们之前的分析,32位整数性能依然强劲,但是双精度计算能力貌似衰减更小,是单精度的1/7。相对于192个SP的规模,几项带宽测试也都令人满意。

    关于GPC Benchmark测试软件,在这里我不必要再多介绍了,各位可以通过这款软件的测试成绩判断GPU的通用计算能力。

    GeForce GTS 450
    ----------------------------------------
    全局存储器:                     86.5
    局部存储器:                     39.1
    32位整型运算:                   120.2
    单精度浮点运算:                 70.6
    双精度浮点运算:                 64.4
    常用数学方法(单精度):      327.3
    常用数学方法(双精度):      375.8
    图像处理:                          217.8
    密码学:                             80.4
    所有测试:                         1382.0

    之前的GTX460(1024MB)是1997分,而GTX480是3406分,GTX285是2053分,而AMD GPU方面,HD5870是2328分。

    未命名.PNG

    我们通过制作GPC Benchmark柱状图可以获得相关对比。

    未命名2.PNG

    通过对比之前的重点产品,我们同样可以获知这款产品的通用计算能力。
回复

使用道具 举报

 楼主| 发表于 2010-9-3 17:10:09 | 显示全部楼层
本帖最后由 cicikml 于 2010-9-3 17:15 编辑

国外有网站购买了核心频率为925MHz的华硕GTS450产品并进行了性能测试,现在我们将其测试分数放出供大家参考。















回复

使用道具 举报

 楼主| 发表于 2010-9-3 17:17:44 | 显示全部楼层
本帖最后由 cicikml 于 2010-9-5 12:22 编辑

    Folding@home通用计算测试

    Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。

    Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、核糖体与抗生素。

      111111111.png

    最后的测试项目是大家最为关心的,因为很多EQUN论坛的会员要借助这款尚未发布的GPU来进行Folding@home运算,所以直接测试其FAH性能(单位:PPD)可以让更多玩家直接决定自己的选购目标。

    捕获GTS450.PNG

    结合我们之前测试的相关NVIDIA显卡成绩,我们现在放出GTS450产品和其他产品的PPD分值对比。这个结果的确让我们感到惊异,192个流处理器在783MHz频率下竟然能够获得超越8000PPD的运算速度,这款显卡如果定位在799-999元,毫无疑问将成为中端市场的性能首选。

    1009031750f75c43a2dd5fb7ba.png

    2010年9月13日,这款产品将正式发布,其测试分数也会正式公开。

    我在这里放出分数仅代表EQUN论坛会员观点,所有测试成绩也仅针对我们的会员,为大家购买硬件设备做参考。
回复

使用道具 举报

发表于 2010-9-3 17:45:33 | 显示全部楼层
本帖最后由 eqzero 于 2010-9-10 22:31 编辑

谢谢C版,没看错的话,单精度不及9800GTX+?但双精度小胜260+?

450只能用260.52版驱动:

http://u.115.com/file/t610910a54#

据陈此驱动比258.96性能高了不少。

260.52.JPG
回复

使用道具 举报

发表于 2010-9-3 17:46:22 | 显示全部楼层
800左右是个好选择,PPD超260+默频,功耗和价格应该不错的!
回复

使用道具 举报

 楼主| 发表于 2010-9-3 17:48:12 | 显示全部楼层
本帖最后由 cicikml 于 2010-9-3 17:49 编辑

回复 5# eqzero

恩,理论吞吐模式是这样,但是架构的巨大改进已经让这些数据没有意义,也不好做对比分析,这张SiSoftware Sandra 2010我本来都不想放。

这次8039 PPD的成绩实在是太令人满意了!哈哈。不过这款显卡毕竟受制与192个SP,所以通用计算性能不是很突出,不过FAH的意外表现起码证明我们可以做出理性的选购。
回复

使用道具 举报

发表于 2010-9-3 19:57:17 | 显示全部楼层
回复 7# cicikml


    确实不错,87%的460的效能,抛开超频,就算超频比460差点,只要价格低于460的80%就很超值了!
回复

使用道具 举报

发表于 2010-9-3 20:04:53 | 显示全部楼层
...cicikml!你出来!结果有了?
回复

使用道具 举报

发表于 2010-9-3 21:05:40 | 显示全部楼层
那么长,我看都觉得辛苦。写的更加辛苦了。
回复

使用道具 举报

发表于 2010-9-3 21:25:18 | 显示全部楼层
本帖最后由 caozhonghua 于 2010-9-3 23:25 编辑

回复 2# cicikml
GPU-Z新出的0.4.6应该可以正确识别450。预设的核心电压1.087相对460已经算高的了,超频幅度估计不会很大。
回复

使用道具 举报

发表于 2010-9-3 22:10:56 | 显示全部楼层
本帖最后由 eqzero 于 2010-9-3 22:11 编辑

回复 7# cicikml


    拿450的时候没签NDA吗?要不要帮你加上阅读权限?NDA这个事情可大可小的。
回复

使用道具 举报

发表于 2010-9-3 23:08:44 | 显示全部楼层
回复 4# cicikml

感谢兄弟提前分享!

深感意外,惊喜不断,本年度真正的FAH神卡诞生了

783核心下有8039的表现,要是超到950+估计9K+表现,PPD/RMB超高啊
回复

使用道具 举报

发表于 2010-9-3 23:43:49 | 显示全部楼层
本帖最后由 金鹏 于 2010-9-3 23:45 编辑

继续放毒。。。。。。。。。

核心破1G是亮点

e8ff93446e937063.png


2.png


3.jpg


4.png


5.jpg
回复

使用道具 举报

发表于 2010-9-4 02:45:45 | 显示全部楼层
回复 14# 金鹏


    默认跑不过260+我觉得是个比较遗憾的。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-19 15:05

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表