2008-8-19 12:32
mooncocoon
有关GT200系列,忽然想到的
老是看到有人为RV770鸣冤,说优化不当,只用了64个US导致性能无法发挥云云……
这两天闲来无事,翻了翻PPD表格,发现GTX260跟98GTX之间并没有拉开差距,由于这两天要白来一块GTX260,遂琢磨了一下为啥FAH下即使不提运算密度的提升,GTX260跟98GTX的运算能力竟然还是趋近相同,难道也是优化不当~?到底是哪里优化不当呢~?看了看GT200的SM结构,明白了
实际上,NV部分的程序一样没有得到优化……
表面上看GTX260由于频率问题,增加的SP数量被98GTX的高频率给抵消了,192*1242跟128*1680相比没有啥太大的优势,但是GT200是支持Dual-Issue的,NV为GT200配备的SFU可以完成标准的乘法指令,一个周期内GT200是可以毫无问题的完成一个乘加运算+一个乘法运算共计3个flops的,通用计算领域中相对于G92的半吊子Co-Issue来说是一个巨大的提升,但是在与目前版本驱动配合的FAH中每周期向单位运算单元发射的指令很明显仍未大于2
也就是说,GT200理论上仍有最少50%的性能未得到释放
无论ATI还是NV,目前都面临着优化失当的问题,迅速优化才是释放分布式运算能力的最佳途径
不过一旦双方优化都到位了起码总运算量要暴涨100%,我很担心现在已经动不动就撂挑子的服务器了[em03]
还有~某人的高频GTX260还是值得期待的~后面的BIG BANG II可能会有惊喜,Forceware180解放的GT200的性能部分应该与SFU相关
2008-8-19 13:06
luoyinbazi
服务器不会那么容易卦的吧,吧每个WU的计算量增加2倍不就可以了
2008-8-19 14:50
avin550
G92也支持指令双发射,在某个驱动里已经打开了
如果FAH对双发射优化的, GT200和G92都能受益
2008-8-19 15:07
mooncocoon
那个……现在讨论的GT200,是三发射……[em03]
2008-8-19 15:23
花泥
没看懂。。。。。
2008-8-19 15:51
mooncocoon
简单地说目前的FAH对AN优化都很不彻底,期待释放运算能力的同时为服务器祈祷[em03]
2008-8-19 16:56
avin550
GT200从设计理念上就不是一个以图形处理为主要目标的GPU,它应该是NV GPGPU计划中的第一步,很多东西都是为通用计算改进设置的
2008-8-19 18:24
sakeki
期待[em05]
2008-8-19 21:36
Dreamyip-China
不得不说···NV的CUDA系受到业界冷遇的
2008-8-19 22:55
宝康
似乎优化不是那么容易的事情,起码我看老外里AMD开发组的人总是对优化闪烁其词
也给不出一个确定的时间表来敲定优化在什么时候能有结果
2008-8-20 00:26
mooncocoon
优化需要程序员彻底吃透硬件,彻底吃透硬件需要开发方完全公开硬件结构,将结构彻底开放给第三方意味着什么……
这才是根本所在,其实优化本身没啥难度的,虽然让程序员吃透硬件并非易事但也绝非难事
2008-8-20 01:31
shouldbe
[quote]原帖由 [i]宝康[/i] 于 2008-8-19 22:55 发表 [url=http://www.equn.com/forum/redirect.php?goto=findpost&pid=256047&ptid=19187][img]http://www.equn.com/forum/images/common/back.gif[/img][/url]
似乎优化不是那么容易的事情,起码我看老外里AMD开发组的人总是对优化闪烁其词
也给不出一个确定的时间表来敲定优化在什么时候能有结果 [/quote]
Michael Huston?
2008-8-20 02:28
宝康
[quote]原帖由 [i]shouldbe[/i] 于 2008-8-20 02:31 发表 [url=http://www.equn.com/forum/redirect.php?goto=findpost&pid=256061&ptid=19187][img]http://www.equn.com/forum/images/common/back.gif[/img][/url]
Michael Huston? [/quote]
是阿,就是他
页:
[1]
Powered by Discuz! Archiver 5.5.0
© 2001-2006 Comsenz Inc.