找回密码
 新注册用户
搜索
楼主: mobility

[求助] 什么型号的A卡可以支持GPU运算?

[复制链接]
发表于 2010-2-11 10:30:56 | 显示全部楼层

回复 #14 Rouble 的帖子

我几个月前已经知道5870的OpenCL底层测试数据了(实际测试),也把它的线程仲裁能力和G80做了对比(仅是纸面),都不理想。
不过没关系,我还是对A卡有信心,毕竟新的客户端还没发布,我们都等等吧。A卡用户暂时玩玩Collatz Conjecture和MilkyWay,也能达到效率最大化。
回复

使用道具 举报

发表于 2010-2-11 10:50:19 | 显示全部楼层

回复 #16 cicikml 的帖子

我曾看介绍说 OpenCL 很多东西都是来自 OpenGL 的,这应该对 ATi 有利啊。
回复

使用道具 举报

发表于 2010-2-11 11:05:54 | 显示全部楼层
AMD的host to device\device to host\device to device memory copy速度均非常低,但GPU访问显存速度尚可,特别是基本没有受到合并访问条件影响。
AMD R7XX(HD4XXX)系列的GPU中本身没有OCL Local Memroy硬件。LDS根本不足以胜任OCL Local memory,所以肯定是用OCL Global Memory模拟的。速度慢不足为奇。58xx对Global memory的原子操作性能改进可能是托了DX11 Direct Compute的福。
另一方面,既然是OPEN,肯定对大家都是公平的开放的。虽然5870在OPEN底层测试中比4870强了很多,但这样的测试都是理论的。

最后的运算效率,又回到了SIMD+VLIW VS Gigathread+标量化执行单元 不改架构根本没办法改变现状。
回复

使用道具 举报

发表于 2010-2-11 12:57:52 | 显示全部楼层
能跑就跑
回复

使用道具 举报

发表于 2010-2-12 05:31:24 | 显示全部楼层
原帖由 cicikml 于 2010-2-11 11:05 发表
AMD的host to device\device to host\device to device memory copy速度均非常低,但GPU访问显存速度尚可,特别是基本没有受到合并访问条件影响。
AMD R7XX(HD4XXX)系列的GPU中本身没有OCL Local Memroy硬件。LDS根本不足 ...



嗯...都看不懂
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-6-7 12:37

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表