游客:
新账户
|
登录
|
会员
|
统计
|
帮助
|
繁体
|
English
中国分布式计算论坛
»
Pi Segment
» [Pi Segment]开始尝试开发GPU客户端
‹‹ 上一主题
|
下一主题 ››
22
1/2
1
2
››
投票
交易
悬赏
活动
打印
|
推荐
|
订阅
|
收藏
标题: [Pi Segment]开始尝试开发GPU客户端
JUST
版主
UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
#1
发表于 2006-12-28 11:46
资料
短消息
加为好友
[Pi Segment]开始尝试开发GPU客户端
入手一块X1650XT,准备开始尝试GPU客户端的开发
不过以前没做过类似研究,相关资料也少,估计会遇到不少困难,最终的性能也很难预料
期望能够成功,但心里确实没底
会尽量兼容所有的SM3.0显卡
但因为NV的显卡(G7X)在通用计算方面有很多局限,因此仅以ATI X1000作为参考平台
[
Last edited by JUST on 2006-12-28 at 12:14
]
中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
[广告]
[Folding@Home] NV/AMD 版 GPUv2 客户端均已发布,附简单教程!
扎西日泰
版主
IT农民工
UID 3242
精华 0
积分 2355
帖子 2011
阅读权限 100
注册 2004-11-9
来自 重庆
#2
发表于 2006-12-28 17:19
资料
短消息
加为好友
我的集成显卡是指望不上了:)
xxeitx
论坛知事
UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
#3
发表于 2006-12-28 20:59
资料
短消息
加为好友
不会吧,我觉得还是开发64位的客户端来得现实
我会为分布式而装64位,但不会为分布式而买X1600系列的显卡
JUST
版主
UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
#4
发表于 2006-12-28 22:28
资料
短消息
加为好友
64位的性能提升估计小于10%
中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
彬彬
论坛担当
UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
#5
发表于 2006-12-29 10:37
资料
短消息
加为好友
QUOTE:
引用
JUST
在 2006-12-28 22:28 时的帖子:
64位的性能提升估计小于10%
上面的同志说得也对呀。可能大部分人会为 10% 的提升而装 64 位系统。
但别说 100%,就算是 1000%的提升,也不足已让大部分人为了这个运算的性能提升而特意去买个显卡,假如这个显卡对人家平时不太重要的话。
我本人未来 N 年是铁定用集成显卡的了。因为我不玩游戏。集成显卡能带得起新操作系统就已经很足够了。而且也省电
xxeitx
论坛知事
UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
#6
发表于 2006-12-29 14:40
资料
短消息
加为好友
现在X1x00的显卡用户少得可怜,要知道现在市场上显卡品牌占有率最高的不是NV和ATI,而是INTEL,因为集成显卡的用户实在太多了,而支持64位的CPU倒有一大堆,况且买显卡要钱,64位的系统可不需要,版主要好好考虑一下了
彬彬
论坛担当
UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
#7
发表于 2006-12-29 17:20
资料
短消息
加为好友
QUOTE:
引用
xxeitx
在 2006-12-29 14:40 时的帖子:
现在X1x00的显卡用户少得可怜,要知道现在市场上显卡品牌占有率最高的不是NV和ATI,而是INTEL,因为集成显卡的用户实在太多了,而支持64位的CPU倒有一大堆,况且买显卡要钱,64位的系统可不需要,版主要好好考虑一 ...
也许是站的角度不同。想的不同吧。在楼主的方面看来,用显卡能加得更快,而在我们,就只愿意升级到 64 位操作系统,而不愿意买新显卡。。。
JUST
版主
UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
#8
发表于 2006-12-29 20:40
资料
短消息
加为好友
其实无论是GPU还是64位,目前来说象征意义比实际意义更大
今天初步试了一下,结果不容乐观
因为需要很多高精度的运算,还要用浮点去模拟,使GPU的性能损失严重,比CPU的速度还慢一点
当然,这是我第一次用Cg,可能是我写得不好
我会再尝试改进一下,不行的话就先做64位了,相对容易得多
中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
JUST
版主
UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
#9
发表于 2006-12-31 17:39
资料
短消息
加为好友
现在的代码还没有CPU算得快呢
有很多问题很难解决,先要学些东西才行
决定先做64位的客户端
不过别指望性能会提高多少,能有5%就不错了
都怪现在32位版本优化的太好了:)
跟优化32为版本时一样,先会放出一些小测试
装了64位操作系统的人很少,测试期会长一些
中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
MythCreator
论坛知事
UID 6348
精华 0
积分 365
帖子 144
阅读权限 10
注册 2005-7-8
#10
发表于 2006-12-31 23:48
资料
短消息
加为好友
现在GPU的浮点运算能力远非CPU可比,如果能利用到的话对计算速度会有超大帮助的!而且。。。集成显卡嘛。。。有人百年不用独显也照样有人百年不用集显。。。除非有一天在显卡市场出现一款类似于声卡那边的HD Audio芯片这样级别的处理芯片,否则集显始终只会是~低能的代名词。。。
JUST
版主
UID 1265
精华 0
积分 1731
帖子 1384
阅读权限 100
注册 2004-5-4
来自 北京
#11
发表于 2007-1-1 00:08
资料
短消息
加为好友
目前的GPU代码速度大概只有CPU的1/10,用cg写的
即使换成汇编,估计至多与CPU速度相仿
除非算法有突破,否则用现有的显卡不会有加速效果了
主要问题是需要用浮点模拟整数和位运算,效率极低
CUDA中据说原生支持整数,期待~
不过,64位客户端的优化效果超乎我的想象
SSE2的代码(P4用的)仅仅简单优化了一下就有大概10%的速度提升,深层优化后应该会更明显
非SSE2的代码(K8、Conroe用的)还没有试,因为我没有短管的CPU,只能从理论上优化
中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
woozhou52
新手上路
UID 12381
精华 0
积分 23
帖子 23
阅读权限 10
注册 2007-1-1
#12
发表于 2007-1-1 04:21
资料
短消息
加为好友
国外不是用GPU运算的,效率是CPU的几百倍啊
彬彬
论坛担当
UID 11969
精华 0
积分 558
帖子 311
阅读权限 10
注册 2006-9-30
#13
发表于 2007-1-1 12:19
资料
短消息
加为好友
QUOTE:
引用
woozhou52
在 2007-1-1 04:21 时的帖子:
国外不是用GPU运算的,效率是CPU的几百倍啊
那是理论上,想象中。。。。而且拿来比较的是顶级 GPU。。。
xxeitx
论坛知事
UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
#14
发表于 2007-1-2 18:58
资料
短消息
加为好友
在用GPU算的时候,CPU要随时等待它的处理结果,在实际效能上比CPU快不了几倍
建议楼主看看这篇F@H的评测
http://vga.intozgc.com/101/101795.html
64位和32位系统的评测请看
http://www.pcpop.com/doc/0/125/125971.shtml
xxeitx
论坛知事
UID 3254
精华 0
积分 331
帖子 329
阅读权限 10
注册 2004-11-10
#15
发表于 2007-1-2 19:04
资料
短消息
加为好友
还有一点忘了说明,现在64位的CPU不管INTEL还是AMD,基本都支持SSE3了,建议从SSE3指令集优化吧
我在网站上看不到有64位的客户端啊
22
1/2
1
2
››
投票
交易
悬赏
活动
控制面板首页
编辑个人资料
积分交易
公众用户组
好友列表
当前时区 GMT+8, 现在时间是 2008-7-24 05:05
沪ICP备05042587号
Powered by
Discuz!
5.5.0
© 2001-2007 Comsenz Inc.
TOP
清除 Cookies
-
联系我们
-
中国分布式计算总站
-
Archiver
-
WAP