找回密码
 新注册用户
搜索
楼主: refla

[总结] CUDA 的常遇问题及解决方法

[复制链接]
发表于 2009-2-23 14:42:02 | 显示全部楼层
自己做了一套AP5,AP503,MB,MBCUDA的优化套装,好象不是很好用,可能是几个DLL的关系,那位高人运算正常的发套来用用看.......
回复

使用道具 举报

发表于 2009-2-23 15:03:31 | 显示全部楼层

回复 #31 saar 的帖子

回31樓大大 請享用
<app_info>
    <app>
        <name>astropulse</name>
    </app>
    <file_info>
        <name>ap_5.00r103_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse</app_name>
        <version_num>500</version_num>
        <file_ref>
            <file_name>ap_5.00r103_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
    </app_version>
    <app>
        <name>astropulse_v5</name>
    </app>
    <file_info>
        <name>ap_5.03r112_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse_v5</app_name>
        <version_num>503</version_num>
        <file_ref>
            <file_name>ap_5.03r112_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
</app_version>
<app>
<name>setiathome_enhanced</name>
</app>
<file_info>
<name>MB_6.08_mod_VLAR_kill_CUDA.exe</name>
<executable/>
</file_info>
<file_info>
<name>cudart.dll</name>
<executable/>
</file_info>
<file_info>
<name>cufft.dll</name>
<executable/>
</file_info>
<file_info>
<name>libfftw3f-3-1-1a_upx.dll</name>
<executable/>
</file_info>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>528</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>603</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>605</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>606</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>607</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
        <app_name>setiathome_enhanced</app_name>
        <version_num>608</version_num>
        <plan_class>cuda</plan_class>
        <avg_ncpus>0.040000</avg_ncpus>
        <max_ncpus>0.040000</max_ncpus>
        <coproc>
                <type>CUDA</type>
                <count>1</count>
        </coproc>
<file_ref>
        <file_name>MB_6.08_mod_VLAR_kill_CUDA.exe</file_name>
        <main_program/>
</file_ref>
<file_ref>
        <file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
        <file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
        <file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
</app_info>

评分

参与人数 1基本分 +10 收起 理由
Julian_Yuen + 10 感谢一直热心参与讨论 : )

查看全部评分

回复

使用道具 举报

发表于 2009-2-23 16:29:27 | 显示全部楼层
MB_6.08_mod_VLAR_kill_CUDA.exe
CUDA的优化?似乎用到3个DLL文件,这3个文件是几个EXE公用的嘛?
请楼上的高手指教,能打个优化包给我不甚感激啊[email protected]
<app>
        <name>astropulse</name>
    </app>
    <file_info>
        <name>ap_5.00r103_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse</app_name>
        <version_num>500</version_num>
        <file_ref>
            <file_name>ap_5.00r103_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
这个名字好象是收不到AP5的包,我把名字改成astropulse_5了,回去试下再来报道
回复

使用道具 举报

 楼主| 发表于 2009-2-23 21:12:48 | 显示全部楼层

回复 #29 nutdungeon 的帖子

我有些日子没算 MB 包了,印象中应该是一直 CUDA 的。没有 AP 包时,就算其它项目吧。
回复

使用道具 举报

 楼主| 发表于 2009-2-23 21:28:21 | 显示全部楼层

回复 #27 a126221345 的帖子

你提到“只要E@H一結束CPU算MB包 GPU就不動了 整個就要重開 GPU才會動”,这个应该是 BOINC 的一个 bug。因为在你结束 E@H 之前,应该就已经有一个 MB - CUDA 在运行着,而 BOINC 企图开多一个 CUDA,显然是会有冲突的。

我加了 GPUGrid 后,就没算 MB-CUDA 了。大体上,我 #25 的意思是,尽量让 CUDA 任务只占一个 core / HT,这样就不容易造成 CUDA 不动的情况了。
回复

使用道具 举报

 楼主| 发表于 2009-2-24 21:16:00 | 显示全部楼层

仅算 MB(CUDA) 的 app_info.xml

<app_info>
<app>
<name>setiathome_enhanced</name>
</app>
<file_info>
<name>MB_6.06r380mod_CUDA.exe</name>
<executable/>
</file_info>
<file_info>
<name>cudart.dll</name>
<executable/>
</file_info>
<file_info>
<name>cufft.dll</name>
<executable/>
</file_info>
<file_info>
<name>libfftw3f-3-1-1a_upx.dll</name>
<executable/>
</file_info>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>528</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>603</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>605</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
</app_info>
回复

使用道具 举报

 楼主| 发表于 2009-2-24 21:20:11 | 显示全部楼层

仅算 AP 包的 app_info.xml

<app_info>
    <app>
        <name>astropulse</name>
    </app>
    <file_info>
        <name>ap_5.00r103_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse</app_name>
        <version_num>500</version_num>
        <file_ref>
            <file_name>ap_5.00r103_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
    </app_version>
    <app>
        <name>astropulse_v5</name>
    </app>
    <file_info>
        <name>ap_5.03r112_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse_v5</app_name>
        <version_num>503</version_num>
        <file_ref>
            <file_name>ap_5.03r112_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
    </app_version>
</app_info>
回复

使用道具 举报

 楼主| 发表于 2009-2-24 21:25:06 | 显示全部楼层

AP + MB( CUDA )

<app_info>
<app>
<name>astropulse</name>
</app>
<file_info>
<name>ap_5.00r103_SSE3.exe</name>
<executable/>
</file_info>
<file_info>
<name>libfftw3f-3-1-1a_upx.dll</name>
<executable/>
</file_info>
<app_version>
<app_name>astropulse</app_name>
<version_num>500</version_num>
<file_ref>
<file_name>ap_5.00r103_SSE3.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>

    <app>
        <name>astropulse_v5</name>
    </app>
    <file_info>
        <name>ap_5.03r112_SSE3.exe</name>
        <executable/>
    </file_info>
    <app_version>
        <app_name>astropulse_v5</app_name>
        <version_num>503</version_num>
        <file_ref>
            <file_name>ap_5.03r112_SSE3.exe</file_name>
            <main_program/>
        </file_ref>
    </app_version>

<app>
<name>setiathome_enhanced</name>
</app>
<file_info>
<name>MB_6.06r380mod_CUDA.exe</name>
<executable/>
</file_info>
<file_info>
<name>cudart.dll</name>
<executable/>
</file_info>
<file_info>
<name>cufft.dll</name>
<executable/>
</file_info>
<file_info>
<name>libfftw3f-3-1-1a_upx.dll</name>
<executable/>
</file_info>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>528</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>603</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>605</version_num>
<plan_class>cuda</plan_class>
<avg_ncpus>0.040000</avg_ncpus>
<max_ncpus>0.040000</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.06r380mod_CUDA.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
</app_info>
回复

使用道具 举报

头像被屏蔽
发表于 2009-2-24 23:47:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2009-2-25 21:11:35 | 显示全部楼层
請教各位大大 請問一下若算好的工作約為20個或更多 沒有回傳
會造成CUDA停止嗎?? 還是有甚麼休眠狀態阿
今早6點多碰過電腦 一直運算至早上8點就停了
然後下班後將工作回傳回去 又開始在算了
真是頭大ㄝ
回复

使用道具 举报

发表于 2009-2-25 22:48:43 | 显示全部楼层
弱弱的问一句:CUDA可以来算AP包不啊?
回复

使用道具 举报

发表于 2009-2-25 23:12:05 | 显示全部楼层

回复 #41 nutdungeon 的帖子

CUDA 暂时只有 MB 包的计算程序
回复

使用道具 举报

 楼主| 发表于 2009-2-26 17:30:07 | 显示全部楼层

回复 #40 a126221345 的帖子

不清楚,没碰过这种情况。

也可能跟服务器有关吧?25号是周三,上午正好对着美国的周二下午,正在维护服务器中。。。
回复

使用道具 举报

发表于 2009-2-26 23:11:19 | 显示全部楼层
參加了兩個專案SETI及E@H,經過這幾天的跑下來 CUDA總算是穩定了 不用常常守在電腦前面了
有了下列做法:
1.顯卡溫度最好是不要超過66度以上(白天開機溫度),要不然會熱當,顯卡運作時溫度越低越好,最好是把機殼側邊拆掉,再加一個  風扇把顯卡的熱氣抽出去
2.目前使用起來優化程式,CPU-AP CUDA-MB最優,且CPU運作起來也很順
3.調整網路選項-連線時間,調整為算完一個工作後,可顯示"準備回報"而不是上傳中,若積太多工作,GPU會當掉

                                                                                                  以上 若有錯誤 請各位大大指教!!
回复

使用道具 举报

发表于 2009-2-27 15:46:09 | 显示全部楼层

回复 #44 a126221345 的帖子

我这还好满载GPU稳定在52度,侧面板也没开
感觉算CUDA小包没什么感觉,算大包时操作有明显的卡,特别是包一开始的5%内
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-10 13:57

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表