AMD统一渲染GPU架构历程回顾与评测(转自ZOL)

金鹏 · 发表于 2010-5-4 20:43:45

本帖最后由金鹏于 2010-5-4 20:51 编辑

前言：NVIDIA公司历经长时间酝酿的Fermi架构高端产品GTX480/GTX470发布已经结束，经历了长达一个月的忙碌，我们已经了解到了这款产品的各项特性，众多用户和开发者组成显卡圈最近也趋于平淡。如果别人问到我，了解NVIDIA和AMD两家产品的性能后，你该做些什么？我想我该回忆两家公司这些年来在统一渲染架构方面成果，更重要的是思考它们所采用的不同发展模式最终带来的结果。

今天通过这篇分析和评测文章，我希望能够回顾AMD在统一渲染架构时代的发展历程，换而言之也就是分析从Radeon HD2000到Radeon HD5000系列AMD的GPU芯片设计思路，以及这种思路带给用户最终的使用体验。这是一条由最初的失败，逐渐看到转机，并最后走出自己特色走向成功的路径。如果你能耐心读完整篇文章，相信一定会有所收获。同时感谢迪兰恒进友情送测的“收藏级别”显卡帮助我们完成这次跨越时空的评测过程。

Radeon 9700与竞争对手规格对比

● 7年前的狂热和选择

2007年6月3日是AMD发布其第一款桌面级统一渲染架构GPU的时间，这款产品被命名为Radeon HD 2900 XT，它代表了全新的R600架构。从名称能够看出它代表了AMD最顶级GPU产品，而它的对手正是NVIDIA公司之前发布GeForce 8800 GTX。

我们按照一款GPU芯片的设计周期推测，Radeon HD 2900 XT所代表的R600架构，大约是在2003年开始设计的。而此后流传出的信息也印证了这个猜想，R600架构的设计思路提出，正是始于2003年，此后的故事就从这个时候开始。

2002年微软发布了DirectX 9.0，在这一代图形API中，PS单元的渲染精度已达到浮点精度，传统的硬件T&L单元被取消。全新的Vertex Shader（顶点着色引擎）编程将比以前复杂得多。DirectX 9.0的先进特性使得它早就了无数经典的PC游戏，GPU也从这个时候开始走上飞速发展的道路。

面对微软发布的全新API，两家厂商的反应是不同的。此时NVIDIA沉浸于GeForce4 Ti带来的全盛，这是一款在DirectX 8.0为NVIDIA公司带来无数好评的GPU产品，同时它当之无愧地代表了图形业界的最高性能。NVIDIA为了追求完美，选择稍作等待来支持更成熟的DirectX 9.0，在NDIDIA心中所谓“成熟”的Shader Model是一个较为特殊的版本，它实际上是由VS2.0和PS3.0组成的。

而ATI并没有选择“成熟”的Shader Model，依靠和微软紧密的合作，ATI发布Radeon 9700时，选择了VS 2.0/PS 2.0，并且发布速度惊人。直至5个月后，NVIDIA公司才发布了研发代号NV30的GeForce FX，同时这款产品在功耗和特性方面并不占优。

Radeon 9700成为了ATI最成功的一代显卡，无论高中低端，R300架构造就的ATI显卡在竞争中都取得明显的优势。R300应该是当时正式上市的最复杂的图形处理器，由0.15µm工艺制造的大约1亿700万个晶体管组成，相对于竞争对手的GPU，它的规模明显放大了很多。

R300芯片微架构

ATI在这时尝到了甜头，R300的成功让它认为设计一款大型GPU产品，然后通过灵活地组合其功能单元开发出针对中低端市场的小型GPU产品，是非常容易获得利润的，同时保证了自己在高端领域的形象。

这种思路直接影响了R600的开发，尽管当时没有明确提出R600这个名称，但是ATI还是信心满满地开始规划未来的美好前景。

R300的成功，还为ATI赢得了另一份荣誉，那就是微软的信任。同为2003年，ATI和微软宣布了一份开发协议——由ATI来为当时的下一代主机XBOX开发业界尖端的图形单元Xenos。这打破了先前微软和NVIDIA的合作关系，意味着XBOX下一代主机的图形部分将更换一位新的合伙人。到了2005年，微软透露360将使用由ATI设计的专用图形单元，它工作在500MHz的时脉上，拥有48条统一着色器和10M嵌入式内存。

第一款统一渲染架构GPU——Xenos处理器

Xenos是微软与ATI的合作结晶，于2005年发布在XBOX360游戏主机中。这款GPU最大的特色是采用了统一着色器单元架构，顶点、像素着色器程序都在同样的单元上执行，由线程调度器作动态的资源分配，还引入了顶点纹理拾取（VTF单元）等ATI同期R5XX产品所不具备的特性。。。。。。。。。。。。。。。。。。。。。。。。。。

http://vga.zol.com.cn/176/1762080.html

---------------------------------------------------------------------

cicikml兄弟的文章写的真好

另 ATI Stream SDK 2.1发布并支持5XXX系列显卡，

ATI Stream SDK 2.1正式版主要新特性：

1、支持新显卡硬件：

－ ATI Radeon HD 5830/5450桌面显卡

－ ATI FirePro V8800/V7800/V5800/V4800/V3800专业显卡

－ ATI Mobility Radeon HD 5800/5700/5600/5400系列移动显卡

－ ATI FirePro M7820/M5800专业显卡

2、支持新操作系统：OpenSUSE 11.2、Red Hat Enterprise Linux 5.4。

3、支持OpenCL、OpenGL交互。

4、支持OpenCL字节编址存储。

5、支持OpenCL图像。

6、在OpenCL C 内核中支持双精度浮点基本算法。

7、在OpenCL上支持AMD媒体操作。

8、在OpenCL上支持设备裂变(device fission)。

9、在OpenCL上支持设备属性查询。

10、支持二进制OpenCL内核。

11、更多OpenCL示例：HistogramAtomics、MatrixMulDouble、MatrixMulImage、SimpleGL、SimpleImage、SobelFilterImage、URNGNoiseGL。

12、捆绑Stream KernelAnalyzer 1.5安装程序。

13、其他大量的OpenCL编译器和运行时修正、增强。

ATI Stream SDK 2.1更多资料与下载

是不是意味着GPU3发布时能同时支持 A卡和N卡

Bismarck · 发表于 2010-5-4 23:33:13

STU也有一句话……说OpenCL的……掩面……

shouldbe · 发表于 2010-5-5 01:08:28

本帖最后由 shouldbe 于 2010-5-5 01:15 编辑

“让NVIDIA取得性能王座，让NVIDIA获得光环效应，我们要做的是设计在$200-$300价格段最好的GPU。”这句话出自RV770的首席设计师Carrell Killerbrew之口”典型的田忌赛马策略。我喜欢AMD工程师贴近消费者的设计理念。虽然因为FAH我没有选择AMD，但广大消费者用脚投了票。如果用某老总的话来说就是“提高终端用户感知度”。

cicikml的文章引用资料详实、准确，文字娓娓道来，好像一部三国演义的小说一样。只是这是NV和AMD两国的战争。我喜欢。

shouldbe · 发表于 2010-5-5 01:19:07

“这种改进让代号RV770Pro的Radeon HD 4850在199美元的市场上找不到瞬间对手，因为它的性能过于出色，市场占据能力极强，所以NVIDIA GeForce 9800 GTX价格突然暴降，以便维持竞争力，但是即使如此也不够。如果没有Dave Baumann这样的改变，HD 4850不能对NV的GeForce 9800 GTX施加如此大的压力，它的价格也不会降得这么快。在这场较量中AMD用自己的努力，将消费者推向了最终的胜利”

消费者的胜利，这话看着真过瘾啊。我当初最看不惯NV的就是自居老大，裹挟膜拜自己的玩家对普通的玩家施压。没有1500元，你就别想买到一款性价比较好的产品。而正是AMD把9800从2500＋一下子拉到1500左右。AMD帮助消费者获得胜利，同时自己也赢得了消费者。

shouldbe · 发表于 2010-5-5 01:25:34

Fermi未来的性能亮点与优势——这节没有太看懂。不过时间会证明一切的。相信cicikml的眼光。

shouldbe · 发表于 2010-5-5 01:27:20

这文章只发表在ZOL上实在屈才。POP、MYDRIVERS，也应该转载啊。这么详实的分析哪里去找啊。

shouldbe · 发表于 2010-5-5 01:31:07

“基于RV840的HD5770在提供了比肩GTX260+的性能前提下，消耗的电力约为对手的1/2，这就是技术进步的重要体现。”——很遗憾，对FAH来说，这不是。虽然没有验证过，但我相信5770的FAH能力不到260＋的一半。所以在FAH这种科学计算领域，AMD并没有真正的实力。

shouldbe · 发表于 2010-5-5 01:33:54

本帖最后由 shouldbe 于 2010-5-5 01:43 编辑

“。。。。。。程序指令中的1D指令数量并不多，指令相关和分支嵌套等数量更为有限。这导致MIMD结构的流处理器无法发挥最佳效率，而传统的SIMD架构反而能够更好适应曾今的编程环境。”这点有点为NV叫屈。不过相信FAH上NV不会吃亏。

没有数据或者图表来证明NV的强大的计算能力。

finf · 发表于 2010-5-5 01:48:22

nv是做块通用计算卡，附带有3d游戏功能。
ati是做块3d游戏卡，附带有通用计算能力。
这个就是2者区别

cicikml · 发表于 2010-5-5 15:51:26

感谢金鹏版主转载，也很欣慰大家能看得上这篇文章。
实际上姑且不说性能如何，从Fermi这次的功耗和发热表现来看，问题比较严重。
AMD以市场为导向的简单开发思路是值得赞许的。

muclemanxb · 发表于 2010-5-6 01:36:49

要不cicikml兄把文章做成一个PDF，坛子里面流传吧，我看了你好些帖子，想收下来随时再看看
这边网络这段时间不太稳定，上网好痛苦啊

Klose_Rinz · 发表于 2010-5-6 03:18:43

nv是做块通用计算卡，附带有3d游戏功能。
ati是做块3d游戏卡，附带有通用计算能力。
这个就是2者区别 ...
finf 发表于 2010-5-5 01:48

至少对现在来说这句话是对的

		自动登录	找回密码
密码			新注册用户

[转帖] AMD统一渲染GPU架构 历程回顾与评测(转自ZOL)

[转帖] AMD统一渲染GPU架构历程回顾与评测(转自ZOL)