nutdungeon 发表于 2009-3-2 21:26:16

CUDA优化今天有新版本了,支持多GPU

今天在lunatics.kwsn.net/gpu-crunching上看到了新的V10的CUDA的优化包,同时支持AP优化+GPU MB(CUDA),这个版本和V9的区别在于能够支持多GPU了,我把它转过来了,有需要的朋友可以试一下。

首先先修改cc_config.xml文件
<cc_config>
<options>
<ncpus>你的cpu核心数+你的GPU核心数</ncpus>
</options>
</cc_config>
注意:优化包分SSSE3和SSE3两个版本,大家使用前请先用cpu-z检查一下。目前所有的AMD的U都不支持SSSE3,而且目前也仅支持Windows平台

其实我在我的机子上试过的,只有一个GPU也是可以的,没问题的,我够大胆的吧 只有一个GPU想用显卡算MB,cpu算AP的朋友也可以下来用的。还是记住备份先

这个包里已经添加了最新的ap5.03的优化。

我们有纳米盘,只有在skydriver上了

地址在这里

1:Raistmer's_opt_pack_V10a_x86_SSSE3_MB_CPU_GPU_team.rar (2346.37 KB )32位windwos上的优化,cpu算ap包,gpu算mb包 SSSE3的

2:Raistmer's_opt_pack_V10a_x64_SSSE3_MB_CPU_GPU_team.rar (2395.28 KB ) 64位windwos上的优化,cpu算ap包,gpu算mb包SSSE3的

3:Raistmer's_opt_pack_V10a_x86_SSE3_MB_CPU_GPU_team.rar (2316.53 KB ) 32位windwos上的优化,cpu算ap包,gpu算mb包 SSE3的 适合稍微老点的intel U

4:Raistmer's_opt_pack_V10a_x86_SSE3_AMD_MB_CPU_GPU_team.rar (2315.89 KB ) 32位windwos上的优化,cpu算ap包,gpu算mb包 AMD SSE3的

第一次发这种帖子,哪里没做对请及时拍砖,手下留情滴不要,这里是原文(原文在这里),下载要注册,所以才转过来

[ 本帖最后由 nutdungeon 于 2009-3-2 21:53 编辑 ]

Youth 发表于 2009-3-2 22:05:00

纳米盘的地址,前几天放上去后忘记把地址转过来了。。。

Raistmers_opt_pack_V10a_x86_SSE3_MB_CPU_GPU_team.rar

Raistmers_opt_pack_V10a_x86_SSSE3_MB_CPU_GPU_team.rar

Raistmers_opt_pack_V10a_x64_SSSE3_MB_CPU_GPU_team.rar

Raistmers_opt_pack_V10a_x86_SSE3_AMD_MB_CPU_GPU_team.rar

ycb 发表于 2009-3-2 22:45:48

回复 #2 Youth 的帖子

YOUTH请再补充说说,具体怎么开展新的优化,效果如何?

测试了一下,可以下AP5,5.03的包,但没有CUDA的包,GPU一直空着

[ 本帖最后由 ycb 于 2009-3-3 12:53 编辑 ]

Youth 发表于 2009-3-3 12:56:45

不好意思,这个我也没条件测试。。。你用原来的版本可以下载到gpu包吗?

茶里王 发表于 2009-3-3 13:09:26

晕死...换了...CUDA不运行了....

nutdungeon 发表于 2009-3-3 14:09:51

我是在原有的数据包上替换了优化程序试验的,然后计算了大概10分钟左右,发现没有问题后就换回原来的优化包了。不知到楼上的现象是啥啊,是当前的包报错,还是不继续进行计算啊?

[ 本帖最后由 nutdungeon 于 2009-3-3 14:12 编辑 ]

茶里王 发表于 2009-3-3 17:19:42

替换之后不继续计算...只计算CPU的... MB包也没有CUDA字样了...

ycb 发表于 2009-3-3 17:37:54

回复 #7 茶里王 的帖子

回YOUTH ,我本来不计算CUDA的MB包的,现在安装了这个优化后,运行AP5,503均正常,开了6小时也没有下到一个CUDA的包,当然也可能本来就没有CUDA的包,不一定是这个优化系统的问题.再过1天看看,若不行还是换回CPU的优化.

nokia5510 发表于 2009-3-4 15:07:30

路过,没有N卡,纯顶!

zflowers 发表于 2009-3-5 09:21:16

没有多块gpu....

aquarius12 发表于 2009-3-5 11:03:00

收不到GPU的包。。。

ycb 发表于 2009-3-5 20:17:26

回复 #11 aquarius12 的帖子

我也继续收不到CUDA包

这个SETI CUDA对我而言从来没有正常过,不是出错,就接收不到包.

[ 本帖最后由 ycb 于 2009-3-5 23:46 编辑 ]

nutdungeon 发表于 2009-3-6 12:10:41

原帖由 ycb 于 2009-3-5 20:17 发表 http://www.equn.com/forum/images/common/back.gif
我也继续收不到CUDA包

这个SETI CUDA对我而言从来没有正常过,不是出错,就接收不到包.

我仔细看了发布者的说明,了解了这个Mod 优化的工作方式,我给大家解释一下就明白了。
工作方式:大家自己看看这个包里面的文件,比起其他的CUDA优化多了个AK_v8b_win_SSSE3x_GPU_CPU_team_V10.exe文件,这个mod的修改就在这里
我以双核+1GPU算MB来举例:首先系统会判断当前是否有GPU实例在进行计算(官方说的这个优化只能判断seti的实例,所以不支持同时还算其他CUDA的项目,如果同时还在算其他GPU加速的项目会出现卡死的现象,主要是争抢GPU资源导致的),如果没有的话就调用AK_v8b_win_SSSE3x_GPU_CPU_team_V10.exe这个程序,这个程序是mod过的,看起来好像是AK SSSE3的优化,其实他是在调用gpu资源进行计算,说明白点就是他把GPU模拟成一个cpu在进行计算,而其他的cpu核可以算ap或者真正的使用CPU SSSE3加速计算。这个时候看进程会发现三个AK_v8b_win_SSSE3x_GPU_CPU_team_V10.exe和一个MB_6.08_mod_CUDA_V10.exe在工作,而其中一个AK_v8b_win_SSSE3x_GPU_CPU_team_V10.exe进程的cpu使用率基本为零,最高也不过就是3%(在我的机子上是这么多),此时检查GPU使用率为99%。

正因为这个原因,所以在进行计算的时候不会显示CUDA的字样,而在下包的时候也不会去下CUDA包。因为就算不是CUDA包,这个MOD也可以调用GPU资源进行加速计算。

我目前就在用这个包进行计算的,我的机子是双核+1GPU,我同时开始计算3个MB包(其中2个用cpu算1个用gpu算),当我的那个用GPU算的包完成时,用cpu算的才到15%,我的显卡是9800GT(112个流处理器),在算MB6.03的包时候用cpu算需要33分钟,用GPU算要15分,加速是相当明显的。

PS:我用这个优化有2.5天了,中途发现了有4个MB包出现这个信息:(我自己翻译的)计算已经完成,但是系统进度并未到100%,结束计算。
我上传了结果,其中一个http://setiathome.berkeley.edu/workunit.php?wuid=418367142,那个cpu时间短的就是我上传的,还是给了分的,应该不算计算错误吧。其它的就没有什么异常状况了,而且我在使用中并没有出现卡的现象,但是我的另一台机子用同样的优化程序,显卡是880GTS的就很卡,不知道为什么!

ycb 发表于 2009-3-8 00:45:12

回复 #13 nutdungeon 的帖子

谢谢!

但对于GPU的速度 不太明白
根据:
"我的机子是双核+1GPU,我同时开始计算3个MB包(其中2个用cpu算1个用gpu算),当我的那个用GPU算的包完成时,用cpu算的才到15%,"

GPU=6-7倍的CPU


"在算MB6.03的包时候用cpu算需要33分钟,用GPU算要15分,加速是相当明显的。"
说明只快一倍

究竟怎么样?

nutdungeon 发表于 2009-3-8 16:26:01

原帖由 ycb 于 2009-3-8 00:45 发表 http://www.equn.com/forum/images/common/back.gif
谢谢!

但对于GPU的速度 不太明白
根据:
"我的机子是双核+1GPU,我同时开始计算3个MB包(其中2个用cpu算1个用gpu算),当我的那个用GPU算的包完成时,用cpu算的才到15%,"

GPU=6-7倍的CPU


"在算MB6.03的包时候用cpu算需要33分钟,用GPU算要15分 ...

这个问题我也注意到了,可能是每个包的计算量不一样吧。我自己计算了几个包的使用时间,同样都是6.03的MB包,CUDA计算用的是V10的MOD版本,有的包从开始到结束只用了15分钟,有的包要用22分钟,最长的用了30分钟,而且每个包的时间都不是固定的。我是用9800GT计算的,未超频,GPU主频为600,显存256MB,1.0nm。
而我的另一台用8800GTS 320MB显存,GPU主频625MB,也是未超频,同样算6.03MB包,最快的仅需要12分钟,最长的要25分钟。
我也不明白为啥,按道理说8800GTS只有96个流处理器,而9800GT有112个,理应9800GT算的快些啊。莫非CUDA计算和显存又密切的关系,因为8800GTS的显存的带宽是320bit,9800GT的是256bit。

希望知道的给解释一下

PS:我是首席护法哦,鄙视一切饼干,除了小熊饼干。今天才让老娘给买了5盒回来,嘿嘿,又可以膜拜几天了
页: [1] 2
查看完整版本: CUDA优化今天有新版本了,支持多GPU

论坛官方淘宝店开业啦~