牵牛星 发表于 2020-1-30 21:59:02

5500XT适合跑什么项目

今天入手了5500XT,本应该是值得高兴的一天,结果发现大部分项目都没办法跑,要不出现opencl引擎卡死(如Einstein的脉冲星和PG),要不运行正常但验证错误率过高(如Milkyway),不知道是否和大部分项目程序未及时更新,不兼容RDNA架构有关?顺便求助各位大佬有什么适合5500XT运行的项目

顺便说下,现在是和1070组双卡跑,驱动是2020.1.3

牵牛星 发表于 2020-1-30 22:06:15

顺便说下具体的情况,Einstein跑FGRPB1G 大约在1分钟的时候出现卡死,表现为驱动界面及GPU-Z界面无响应,任务直接报错,随后GPU占用率锁定在99%,必须重启才能恢复


16:00:11 (6976): : This Einstein@home App was built at: May8 2019 13:29:27

16:00:11 (6976): : Start of BOINC application 'projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.22_windows_x86_64__FGRPopencl1K-ati.exe'.
16:00:11 (6976): : 1e+016 fp, 5.1e+009 fp/s, 2050312 s, 569h31m52s11
16:00:11 (6976): : % CPU usage: 1.000000, GPU usage: 1.000000
command line: projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.22_windows_x86_64__FGRPopencl1K-ati.exe --inputfile ../../projects/einstein.phys.uwm.edu/LATeah1062L33.dat --alpha 1.41058464281 --delta -0.444366280137 --skyRadius 5.526880e-07 --ldiBins 30 --f0start 380.0 --f0Band 8.0 --firstSkyPoint 0 --numSkyPoints 1 --f1dot -1e-13 --f1dotBand 1e-13 --df1dot 2.512676418e-15 --ephemdir ..\..\projects\einstein.phys.uwm.edu\JPLEPH --Tcoh 2097152.0 --toplist 10 --cohFollow 10 --numCells 1 --useWeights 1 --Srefinement 1 --CohSkyRef 1 --cohfullskybox 1 --mmfu 0.1 --reftime 56100 --model 0 --f0orbit 0.005 --mismatch 0.1 --demodbinary 1 --BinaryPointFile ../../projects/einstein.phys.uwm.edu/templates_LATeah1062L33_0388_15577681.dat --debug 1 --device 0 -o LATeah1062L33_388.0_0_0.0_15577681_2_0.out
output files: 'LATeah1062L33_388.0_0_0.0_15577681_2_0.out' '../../projects/einstein.phys.uwm.edu/LATeah1062L33_388.0_0_0.0_15577681_2_0' 'LATeah1062L33_388.0_0_0.0_15577681_2_0.out.cohfu' '../../projects/einstein.phys.uwm.edu/LATeah1062L33_388.0_0_0.0_15577681_2_1'
16:00:11 (6976): : Flags: X64 SSE SSE2 GNUC X86 GNUX86
16:00:11 (6976): : Set up communication with graphics process.
boinc_get_opencl_ids returned
Using OpenCL platform provided by: Advanced Micro Devices, Inc.
Using OpenCL device "gfx1012" by: Advanced Micro Devices, Inc.
Max allocation limit: 4244635648
Global mem size: 4278190080
Couldn't create OpenCL command queue (error: -6)!
OpenCL shutdown complete!
initialize_ocl returned error
OCL context null
OCL queue null
Error generating generic FFT context object
16:00:24 (6976): : ERROR: MAIN() returned with error '5'
FPU status flags:
16:00:35 (6976): : done. calling boinc_finish(69).
16:00:35 (6976): called boinc_finish

PG也是在1分钟左右出现进度条停滞,GPU负载消失,只能手动终止任务
<core_client_version>7.14.2</core_client_version>
<![CDATA[
<message>
aborted by user</message>
<stderr_txt>
geneferocl 3.3.3-2 (Windows/OpenCL/32-bit)

Copyright 2001-2018, Yves Gallot
Copyright 2009, Mark Rodenkirch, David Underbakke
Copyright 2010-2012, Shoichiro Yamada, Ken Brazier
Copyright 2011-2014, Michael Goetz, Ronald Schneider
Copyright 2011-2018, Iain Bethune
Genefer is free source code, under the MIT license.

Running on platform 'AMD Accelerated Parallel Processing', device 'gfx1012', vendor 'Advanced Micro Devices, Inc.', version 'OpenCL 1.2 AMD-APP (3004.8)' and driver '3004.8 (PAL,LC)'.
11 computeUnits @ 1737MHz, memSize=3072MB, cacheSize=16kB, cacheLineSize=64B, localMemSize=64kB, maxWorkGroupSize=256.
Supported transform implementations: ocl ocl2 ocl3 ocl4 ocl5

Command line: projects/www.primegrid.com/geneferocl_windows_3.3.3-2.exe -boinc -q 72776242^65536+1

Normal priority change succeeded.
Checking available transform implementations...
OCL transform is past its b limit.
OCL3 transform is past its b limit.
OCL4 transform is past its b limit.
OCL5 transform is past its b limit.
Using OCL2 transform
Starting initialization...
Initialization complete (0.120 seconds).
Testing 72776242^65536+1...
Estimated time for 72776242^65536+1 is 0:01:59               

maxErr exceeded for 72776242^65536+1, 1.0000 > 0.4500
Errors occurred for all available transform implementations
Waiting 10 minutes before attempting to continue from last checkpoint...


</stderr_txt>
]]>

Milkyway运行过程正常,但验证错误率高达15%以上

vincentdark 发表于 2020-1-30 23:21:54

本帖最后由 vincentdark 于 2020-1-31 01:25 编辑

目测是OpenCL有问题,AN混插出问题你不能怪项目啊,本来AN混插就是非常规操作,出现兼容性问题也是情有可原。

有可能是安装A卡驱动是没有正常安装OpenCL。

请尝试手动安装OpenCL,或者尝试把1070卸了重装A卡驱动,然后再插回1070重启试一下。

如果还是不行,那就可能是下面这个帖子里的问题,
https://www.techpowerup.com/261603/amd-radeon-navi-opencl-bug-makes-it-unfit-for-seti-home


但是帖子里有人回复只是跑seti@home有问题,Einstein@home, Milkyway@home, Collatz都可以正常跑。

horst1981 发表于 2020-1-31 02:18:11

我5700XT已经装好,试了一下milkyway,跑完的40几个包并未出现验证错误。
我用的是最新的20.14驱动。
下午再去开机看einstein怎么样。

horst1981 发表于 2020-1-31 02:23:39

另外AN混插的话,以我的经验,A卡要做主卡,也就是插到离CPU最近的槽里,并且要接显示器,N卡就可以随意。
win10下双卡驱动很好解决,交给系统自动更新就行。
还有感觉主板跟U也有关系(这个不太确定),我X99+E5混插很少出现问题,以前搞过A88+A10就常有错误。

vincentdark 发表于 2020-1-31 18:34:42

horst1981 发表于 2020-1-31 03:23
另外AN混插的话,以我的经验,A卡要做主卡,也就是插到离CPU最近的槽里,并且要接显示器,N卡就可以随意。
...

那说名intel是和事老,A,N打不起来,你要全套A再插个N进去就会boom

vincentdark 发表于 2020-1-31 18:37:12

horst1981 发表于 2020-1-31 03:18
我5700XT已经装好,试了一下milkyway,跑完的40几个包并未出现验证错误。
我用的是最新的20.14驱动。
下午再 ...

大佬辛苦了,方便的话也请试试seti,看看那帖子是否属实,或者说苏妈是否已修复驱动bug了~

牵牛星 发表于 2020-1-31 20:07:58

感谢各位大佬的意见,目前确认Milkyway和Einstein的重力波能跑,等过段时间跑完剩余任务再继续折腾
下午远程了一网友的5700XT跑脉冲星,驱动2020.1.2,完全没问题,FFT implementation应该在这个版本得到了解决

yimu35 发表于 2020-2-1 04:42:31

A N混插主要看驱动版本,gpu-z看下open-cl有没有打勾。 经常是安装A驱动,N的opencl就没了,或者安装N的,A没了。 只能DDU后一个个版本试错。我现在发现A的新驱动没问题,N的要用老的,否则没法混插。怀疑是老黄搞的手脚。。。

horst1981 发表于 2020-2-2 13:59:09

vincentdark 发表于 2020-1-31 18:37
大佬辛苦了,方便的话也请试试seti,看看那帖子是否属实,或者说苏妈是否已修复驱动bug了~ ...

这几天都收不到SETI的包,还测试不了,官网论坛说好像这段时间减少发包了。
https://setiathome.berkeley.edu/forum_thread.php?id=85093#2028359

Tlabs 发表于 2020-2-19 22:03:22

明年试一下AI混插、AN混插、IN混插,看哪个插得好

freestman 发表于 2020-2-20 10:21:59

yimu35 发表于 2020-2-1 04:42
A N混插主要看驱动版本,gpu-z看下open-cl有没有打勾。 经常是安装A驱动,N的opencl就没了,或者安装N的,A ...

遇到混插掉OpenCL的问题,可以试试在设备管理器内删除显卡,刷新让系统更新显卡驱动的操作。
页: [1]
查看完整版本: 5500XT适合跑什么项目

论坛官方淘宝店开业啦~