找回密码
 新注册用户
搜索
楼主: alen

GPU无责任推荐及讨论。

  [复制链接]
发表于 2011-12-5 17:06:34 | 显示全部楼层
从SP数量增长并不和TPF正比增长能看出SP利用率上肯定有余地,相对来看对SP频率提升更敏感些


未命名.jpg
回复

使用道具 举报

发表于 2011-12-5 21:49:33 | 显示全部楼层
回复  金鹏


应该没这么一说……
nekoko 发表于 2011-11-30 20:33


偶也感觉斯坦福并木有完全释放Fermi架构的威力~~~

多少留了一手~~~

(大约是考虑到功耗、散热等等,权衡之计)~~~

要不~~~

早前G92核心的显卡强制跑费米包,也能飙到万分以上~~~        
回复

使用道具 举报

 楼主| 发表于 2011-12-6 00:23:20 | 显示全部楼层
个人也觉得F@H没有释放SP的威力,像ATI这么多的SP,跑F@H还不是一样一塌糊涂。
回复

使用道具 举报

发表于 2011-12-6 08:35:57 | 显示全部楼层
回复 17# ONLY


fermi是32sp组成一个SM,SM和smp是类似的,属于多线程,这个就涉及到程序内部数据分割的问题,可能在这方面有极限吧~
另外,tesla是不能跑fermi包的,因为tesla的整数是24bit的,fermi是32bit的,当然也不排除fah现在还在fermi上跑24bit的可能
回复

使用道具 举报

发表于 2011-12-6 09:05:01 | 显示全部楼层
回复  ONLY


fermi是32sp组成一个SM,SM和smp是类似的,属于多线程,这个就涉及到程序内部数据分割的问题 ...
nekoko 发表于 2011-12-6 08:35


谢美女科普!            

PS:美女是学什么的?对这些绕口的术语怎么如此熟悉,如此信手拈来?                  
回复

使用道具 举报

发表于 2011-12-6 09:14:15 | 显示全部楼层
回复 20# ONLY


    最近在偷学cuda了……工作需要……
回复

使用道具 举报

发表于 2011-12-6 12:30:44 | 显示全部楼层
回复  ONLY


    最近在偷学cuda了……工作需要……
nekoko 发表于 2011-12-6 09:14


美女如此给力啊!

佩服佩服~~~         
回复

使用道具 举报

发表于 2011-12-6 16:56:18 | 显示全部楼层
回复 15# nekoko

假设 450 的 SP = 1,则 560 Ti with 448 的 SP = 2.3333 。一般来说,增加一倍的资源能使加速比 E 达到 1.5 以上就不错了。而且,之后再继续增加资源的话,提速效应会越来越不明显。

实际上。。。我一直忘了最简单有效、同时也是最关键的指标 —— 加速比 E = 450 的执行时间 T1 / 560Ti with 448 的执行时间 T2

有条件的童鞋可以在同一台机器上,单独测试两张卡的跑一个包的时间。这里要注意两点:一是两张卡的频率要相同;二是要注意不同编号的包对执行时间是否有影响?

如果加速比 E ≈ 计分比,说明 FAH 的计分算法没有明显的倾向性,它很可能是按工作量给分的。

由于到 FAH 要在不同显卡上运行,考虑到时限、网络传输等实际问题,它很难按最优标准来为每张显卡分发数据。所以,我还是倾向于认为,fAH 没有喂饱 560Ti 的可能性更大。

至于用 GPU-Z 查看负载量,除非是把整个计算过程都记录下来,否则,我们看到的只是一个“时间片”而已,精确度不高。
回复

使用道具 举报

发表于 2011-12-6 18:57:59 | 显示全部楼层
本帖最后由 wpf999 于 2011-12-6 19:00 编辑
回复  ONLY


    最近在偷学cuda了……工作需要……
nekoko 发表于 2011-12-6 09:14



    去年我本来打算学cuda的,但是GPU并行计算还在发展中,我估计有可能被intel 的MIC技术取代,所以暂时观望,不学cuda了。待这些东西发展成熟了再学也不迟。
回复

使用道具 举报

发表于 2011-12-6 19:47:34 | 显示全部楼层
回复 23# refla


    不做任何假设,实测结果:gpugrid上,460(7sm336sp)同频率下每天得分正好是570(15sm480sp)的一半儿。至少对于acemd来说,似乎sm数量才是决定效率的关键~
回复

使用道具 举报

发表于 2011-12-7 08:05:51 | 显示全部楼层
回复 25# nekoko

计算时间也正好一半吗?
回复

使用道具 举报

发表于 2011-12-7 08:42:38 | 显示全部楼层
回复 26# refla


    gpugrid没有加分策略,所以应该时间也是一半,可惜现在没有460了,没办法再测一次
回复

使用道具 举报

发表于 2011-12-7 11:18:10 | 显示全部楼层
不是有sp的利用率的问题吗?
回复

使用道具 举报

发表于 2011-12-9 14:44:30 | 显示全部楼层
回复 27# nekoko

不用测了,打个赌吧。我押 460 的时间 ≥ 570 的时间 × 2

我曾用 9600GT 跑过 GPUGrid,后来跑不下去了,因为 SP 的数量下限提高到 96,而 9600GT 只有 64 个 SP。

看了一眼 GPUGrid 的推荐列表,全是中高端的显卡。所以,我断定 GPUGrid 是按(最)高端显卡的标准设计的。FAH 的设计思想正好相反,容易造成资源利用率的问题。当然,采用哪种设计策略跟算法本身的结构有很大关系,由于不清楚相关细节,我就不多做评论了。总之,还是那句老话:影响硬件效能的决定因素是软件!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-19 14:47

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表