找回密码
 新注册用户
搜索
查看: 5952|回复: 11

[转帖] AMD统一渲染GPU架构 历程回顾与评测(转自ZOL)

[复制链接]
发表于 2010-5-4 20:43:45 | 显示全部楼层 |阅读模式
本帖最后由 金鹏 于 2010-5-4 20:51 编辑
前言:NVIDIA公司历经长时间酝酿的Fermi架构高端产品GTX480/GTX470发布已经结束,经历了长达一个月的忙碌,我们已经了解到了这款产品的各项特性,众多用户和开发者组成显卡圈最近也趋于平淡。如果别人问到我,了解NVIDIA和AMD两家产品的性能后,你该做些什么?我想我该回忆两家公司这些年来在统一渲染架构方面成果,更重要的是思考它们所采用的不同发展模式最终带来的结果。

    今天通过这篇分析和评测文章,我希望能够回顾AMD在统一渲染架构时代的发展历程,换而言之也就是分析从Radeon HD2000到Radeon HD5000系列AMD的GPU芯片设计思路,以及这种思路带给用户最终的使用体验。这是一条由最初的失败,逐渐看到转机,并最后走出自己特色走向成功的路径。如果你能耐心读完整篇文章,相信一定会有所收获。同时感谢迪兰恒进友情送测的“收藏级别”显卡帮助我们完成这次跨越时空的评测过程。


Radeon 9700与竞争对手规格对比


   ● 7年前的狂热和选择

    2007年6月3日是AMD发布其第一款桌面级统一渲染架构GPU的时间,这款产品被命名为Radeon HD 2900 XT,它代表了全新的R600架构。从名称能够看出它代表了AMD最顶级GPU产品,而它的对手正是NVIDIA公司之前发布GeForce 8800 GTX。

    我们按照一款GPU芯片的设计周期推测,Radeon HD 2900 XT所代表的R600架构,大约是在2003年开始设计的。而此后流传出的信息也印证了这个猜想,R600架构的设计思路提出,正是始于2003年,此后的故事就从这个时候开始。

    2002年微软发布了DirectX 9.0,在这一代图形API中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元被取消。全新的Vertex Shader(顶点着色引擎)编程将比以前复杂得多。DirectX 9.0的先进特性使得它早就了无数经典的PC游戏,GPU也从这个时候开始走上飞速发展的道路。

    面对微软发布的全新API,两家厂商的反应是不同的。此时NVIDIA沉浸于GeForce4 Ti带来的全盛,这是一款在DirectX 8.0为NVIDIA公司带来无数好评的GPU产品,同时它当之无愧地代表了图形业界的最高性能。NVIDIA为了追求完美,选择稍作等待来支持更成熟的DirectX 9.0,在NDIDIA心中所谓“成熟”的Shader Model是一个较为特殊的版本,它实际上是由VS2.0和PS3.0组成的。



而ATI并没有选择“成熟”的Shader Model,依靠和微软紧密的合作,ATI发布Radeon 9700时,选择了VS 2.0/PS 2.0,并且发布速度惊人。直至5个月后,NVIDIA公司才发布了研发代号NV30的GeForce FX,同时这款产品在功耗和特性方面并不占优。

    Radeon 9700成为了ATI最成功的一代显卡,无论高中低端,R300架构造就的ATI显卡在竞争中都取得明显的优势。R300应该是当时正式上市的最复杂的图形处理器,由0.15µm工艺制造的大约1亿700万个晶体管组成,相对于竞争对手的GPU,它的规模明显放大了很多。


R300芯片微架构


ATI在这时尝到了甜头,R300的成功让它认为设计一款大型GPU产品,然后通过灵活地组合其功能单元开发出针对中低端市场的小型GPU产品,是非常容易获得利润的,同时保证了自己在高端领域的形象。

    这种思路直接影响了R600的开发,尽管当时没有明确提出R600这个名称,但是ATI还是信心满满地开始规划未来的美好前景。

    R300的成功,还为ATI赢得了另一份荣誉,那就是微软的信任。同为2003年,ATI和微软宣布了一份开发协议——由ATI来为当时的下一代主机XBOX开发业界尖端的图形单元Xenos。这打破了先前微软和NVIDIA的合作关系,意味着XBOX下一代主机的图形部分将更换一位新的合伙人。到了2005年,微软透露360将使用由ATI设计的专用图形单元,它工作在500MHz的时脉上,拥有48条统一着色器和10M嵌入式内存。


第一款统一渲染架构GPU——Xenos处理器


    Xenos是微软与ATI的合作结晶,于2005年发布在XBOX360游戏主机中。这款GPU最大的特色是采用了统一着色器单元架构,顶点、像素着色器程序都在同样的单元上执行,由线程调度器作动态的资源分配,还引入了顶点纹理拾取(VTF单元)等ATI同期R5XX产品所不具备的特性。。。。。。。。。。。。。。。。。。。。。。。。。。



http://vga.zol.com.cn/176/1762080.html


---------------------------------------------------------------------

cicikml兄弟的文章写的真好


另 ATI Stream SDK 2.1发布并支持5XXX系列显卡,

ATI Stream SDK 2.1正式版主要新特性:

1、支持新显卡硬件:

- ATI Radeon HD 5830/5450桌面显卡

- ATI FirePro V8800/V7800/V5800/V4800/V3800专业显卡

- ATI Mobility Radeon HD 5800/5700/5600/5400系列移动显卡

- ATI FirePro M7820/M5800专业显卡

2、支持新操作系统:OpenSUSE 11.2、Red Hat Enterprise Linux 5.4。

3、支持OpenCL、OpenGL交互。

4、支持OpenCL字节编址存储。

5、支持OpenCL图像。

6、在OpenCL C 内核中支持双精度浮点基本算法。

7、在OpenCL上支持AMD媒体操作。

8、在OpenCL上支持设备裂变(device fission)。

9、在OpenCL上支持设备属性查询。

10、支持二进制OpenCL内核。

11、更多OpenCL示例:HistogramAtomics、MatrixMulDouble、MatrixMulImage、SimpleGL、SimpleImage、SobelFilterImage、URNGNoiseGL。

12、捆绑Stream KernelAnalyzer 1.5安装程序。

13、其他大量的OpenCL编译器和运行时修正、增强。


ATI Stream SDK 2.1更多资料与下载




是不是意味着GPU3发布时能同时支持 A卡和N卡  
回复

使用道具 举报

发表于 2010-5-4 23:33:13 | 显示全部楼层
STU也有一句话……说OpenCL的……掩面……
回复

使用道具 举报

发表于 2010-5-5 01:08:28 | 显示全部楼层
本帖最后由 shouldbe 于 2010-5-5 01:15 编辑

“让NVIDIA取得性能王座,让NVIDIA获得光环效应,我们要做的是设计在$200-$300价格段最好的GPU。”这句话出自RV770的首席设计师Carrell Killerbrew之口”典型的田忌赛马策略。我喜欢AMD工程师贴近消费者的设计理念。虽然因为FAH我没有选择AMD,但广大消费者用脚投了票。如果用某老总的话来说就是“提高终端用户感知度”。

cicikml的文章引用资料详实、准确,文字娓娓道来,好像一部三国演义的小说一样。只是这是NV和AMD两国的战争。我喜欢。
回复

使用道具 举报

发表于 2010-5-5 01:19:07 | 显示全部楼层
“这种改进让代号RV770Pro的Radeon HD 4850在199美元的市场上找不到瞬间对手,因为它的性能过于出色,市场占据能力极强,所以NVIDIA GeForce 9800 GTX价格突然暴降,以便维持竞争力,但是即使如此也不够。如果没有Dave Baumann这样的改变,HD 4850不能对NV的GeForce 9800 GTX施加如此大的压力,它的价格也不会降得这么快。在这场较量中AMD用自己的努力,将消费者推向了最终的胜利”

消费者的胜利,这话看着真过瘾啊。我当初最看不惯NV的就是自居老大,裹挟膜拜自己的玩家对普通的玩家施压。没有1500元,你就别想买到一款性价比较好的产品。而正是AMD把9800从2500+一下子拉到1500左右。AMD帮助消费者获得胜利,同时自己也赢得了消费者。
回复

使用道具 举报

发表于 2010-5-5 01:25:34 | 显示全部楼层
Fermi未来的性能亮点与优势——这节没有太看懂。不过时间会证明一切的。相信cicikml的眼光。
回复

使用道具 举报

发表于 2010-5-5 01:27:20 | 显示全部楼层
这文章只发表在ZOL上实在屈才。POP、MYDRIVERS,也应该转载啊。这么详实的分析哪里去找啊。
回复

使用道具 举报

发表于 2010-5-5 01:31:07 | 显示全部楼层
“基于RV840的HD5770在提供了比肩GTX260+的性能前提下,消耗的电力约为对手的1/2,这就是技术进步的重要体现。”——很遗憾,对FAH来说,这不是。虽然没有验证过,但我相信5770的FAH能力不到260+的一半。所以在FAH这种科学计算领域,AMD并没有真正的实力。
回复

使用道具 举报

发表于 2010-5-5 01:33:54 | 显示全部楼层
本帖最后由 shouldbe 于 2010-5-5 01:43 编辑

“。。。。。。程序指令中的1D指令数量并不多,指令相关和分支嵌套等数量更为有限。这导致MIMD结构的流处理器无法发挥最佳效率,而传统的SIMD架构反而能够更好适应曾今的编程环境。”这点有点为NV叫屈。不过相信FAH上NV不会吃亏。

没有数据或者图表来证明NV的强大的计算能力。
回复

使用道具 举报

发表于 2010-5-5 01:48:22 | 显示全部楼层
nv是做块通用计算卡,附带有3d游戏功能。
ati是做块3d游戏卡,附带有通用计算能力。
这个就是2者区别
回复

使用道具 举报

发表于 2010-5-5 15:51:26 | 显示全部楼层
感谢金鹏版主转载,也很欣慰大家能看得上这篇文章。
实际上姑且不说性能如何,从Fermi这次的功耗和发热表现来看,问题比较严重。
AMD以市场为导向的简单开发思路是值得赞许的。
回复

使用道具 举报

发表于 2010-5-6 01:36:49 | 显示全部楼层
要不cicikml兄把文章做成一个PDF,坛子里面流传吧,我看了你好些帖子,想收下来随时再看看
这边网络这段时间不太稳定,上网好痛苦啊
回复

使用道具 举报

发表于 2010-5-6 03:18:43 | 显示全部楼层
nv是做块通用计算卡,附带有3d游戏功能。
ati是做块3d游戏卡,附带有通用计算能力。
这个就是2者区别 ...
finf 发表于 2010-5-5 01:48



    至少对现在来说 这句话是对的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-6 06:47

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表