找回密码
 新注册用户
搜索
查看: 9416|回复: 21

[Pi Segment]开始尝试开发GPU客户端

[复制链接]
发表于 2006-12-28 11:46:56 | 显示全部楼层 |阅读模式
入手一块X1650XT,准备开始尝试GPU客户端的开发

不过以前没做过类似研究,相关资料也少,估计会遇到不少困难,最终的性能也很难预料
期望能够成功,但心里确实没底

会尽量兼容所有的SM3.0显卡
但因为NV的显卡(G7X)在通用计算方面有很多局限,因此仅以ATI X1000作为参考平台

[ Last edited by JUST on 2006-12-28 at 12:14 ]
回复

使用道具 举报

发表于 2006-12-28 17:19:15 | 显示全部楼层
我的集成显卡是指望不上了:)
回复

使用道具 举报

头像被屏蔽
发表于 2006-12-28 20:59:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

 楼主| 发表于 2006-12-28 22:28:58 | 显示全部楼层
64位的性能提升估计小于10%
回复

使用道具 举报

发表于 2006-12-29 10:37:43 | 显示全部楼层
引用 JUST 在 2006-12-28 22:28 时的帖子:
64位的性能提升估计小于10%


上面的同志说得也对呀。可能大部分人会为 10% 的提升而装 64 位系统。

但别说 100%,就算是 1000%的提升,也不足已让大部分人为了这个运算的性能提升而特意去买个显卡,假如这个显卡对人家平时不太重要的话。

我本人未来 N 年是铁定用集成显卡的了。因为我不玩游戏。集成显卡能带得起新操作系统就已经很足够了。而且也省电
回复

使用道具 举报

头像被屏蔽
发表于 2006-12-29 14:40:48 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2006-12-29 17:20:07 | 显示全部楼层
引用 xxeitx 在 2006-12-29 14:40 时的帖子:
现在X1x00的显卡用户少得可怜,要知道现在市场上显卡品牌占有率最高的不是NV和ATI,而是INTEL,因为集成显卡的用户实在太多了,而支持64位的CPU倒有一大堆,况且买显卡要钱,64位的系统可不需要,版主要好好考虑一 ...


也许是站的角度不同。想的不同吧。在楼主的方面看来,用显卡能加得更快,而在我们,就只愿意升级到 64 位操作系统,而不愿意买新显卡。。。
回复

使用道具 举报

 楼主| 发表于 2006-12-29 20:40:10 | 显示全部楼层
其实无论是GPU还是64位,目前来说象征意义比实际意义更大

今天初步试了一下,结果不容乐观
因为需要很多高精度的运算,还要用浮点去模拟,使GPU的性能损失严重,比CPU的速度还慢一点
当然,这是我第一次用Cg,可能是我写得不好

我会再尝试改进一下,不行的话就先做64位了,相对容易得多
回复

使用道具 举报

 楼主| 发表于 2006-12-31 17:39:26 | 显示全部楼层
现在的代码还没有CPU算得快呢
有很多问题很难解决,先要学些东西才行

决定先做64位的客户端
不过别指望性能会提高多少,能有5%就不错了
都怪现在32位版本优化的太好了:)

跟优化32为版本时一样,先会放出一些小测试
装了64位操作系统的人很少,测试期会长一些
回复

使用道具 举报

发表于 2006-12-31 23:48:42 | 显示全部楼层
现在GPU的浮点运算能力远非CPU可比,如果能利用到的话对计算速度会有超大帮助的!而且。。。集成显卡嘛。。。有人百年不用独显也照样有人百年不用集显。。。除非有一天在显卡市场出现一款类似于声卡那边的HD Audio芯片这样级别的处理芯片,否则集显始终只会是~低能的代名词。。。
回复

使用道具 举报

 楼主| 发表于 2007-1-1 00:08:22 | 显示全部楼层
目前的GPU代码速度大概只有CPU的1/10,用cg写的
即使换成汇编,估计至多与CPU速度相仿
除非算法有突破,否则用现有的显卡不会有加速效果了
主要问题是需要用浮点模拟整数和位运算,效率极低
CUDA中据说原生支持整数,期待~

不过,64位客户端的优化效果超乎我的想象
SSE2的代码(P4用的)仅仅简单优化了一下就有大概10%的速度提升,深层优化后应该会更明显
非SSE2的代码(K8、Conroe用的)还没有试,因为我没有短管的CPU,只能从理论上优化
回复

使用道具 举报

发表于 2007-1-1 04:21:07 | 显示全部楼层
国外不是用GPU运算的,效率是CPU的几百倍啊
回复

使用道具 举报

发表于 2007-1-1 12:19:29 | 显示全部楼层
引用 woozhou52 在 2007-1-1 04:21 时的帖子:
国外不是用GPU运算的,效率是CPU的几百倍啊


那是理论上,想象中。。。。而且拿来比较的是顶级 GPU。。。
回复

使用道具 举报

头像被屏蔽
发表于 2007-1-2 18:58:10 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2007-1-2 19:04:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-25 13:42

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表