找回密码
 新注册用户
搜索
查看: 6760|回复: 12

[求助] 5500XT适合跑什么项目

[复制链接]
发表于 2020-1-30 21:59:02 | 显示全部楼层 |阅读模式
今天入手了5500XT,本应该是值得高兴的一天,结果发现大部分项目都没办法跑,要不出现opencl引擎卡死(如Einstein的脉冲星和PG),要不运行正常但验证错误率过高(如Milkyway),不知道是否和大部分项目程序未及时更新,不兼容RDNA架构有关?顺便求助各位大佬有什么适合5500XT运行的项目

顺便说下,现在是和1070组双卡跑,驱动是2020.1.3
回复

使用道具 举报

 楼主| 发表于 2020-1-30 22:06:15 | 显示全部楼层
顺便说下具体的情况,Einstein跑FGRPB1G 大约在1分钟的时候出现卡死,表现为驱动界面及GPU-Z界面无响应,任务直接报错,随后GPU占用率锁定在99%,必须重启才能恢复


  1. 16:00:11 (6976): [normal]: This Einstein[url=home.php?mod=space&uid=92741]@home[/url] App was built at: May  8 2019 13:29:27

  2. 16:00:11 (6976): [normal]: Start of BOINC application 'projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.22_windows_x86_64__FGRPopencl1K-ati.exe'.
  3. 16:00:11 (6976): [debug]: 1e+016 fp, 5.1e+009 fp/s, 2050312 s, 569h31m52s11
  4. 16:00:11 (6976): [normal]: % CPU usage: 1.000000, GPU usage: 1.000000
  5. command line: projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.22_windows_x86_64__FGRPopencl1K-ati.exe --inputfile ../../projects/einstein.phys.uwm.edu/LATeah1062L33.dat --alpha 1.41058464281 --delta -0.444366280137 --skyRadius 5.526880e-07 --ldiBins 30 --f0start 380.0 --f0Band 8.0 --firstSkyPoint 0 --numSkyPoints 1 --f1dot -1e-13 --f1dotBand 1e-13 --df1dot 2.512676418e-15 --ephemdir ..\..\projects\einstein.phys.uwm.edu\JPLEPH --Tcoh 2097152.0 --toplist 10 --cohFollow 10 --numCells 1 --useWeights 1 --Srefinement 1 --CohSkyRef 1 --cohfullskybox 1 --mmfu 0.1 --reftime 56100 --model 0 --f0orbit 0.005 --mismatch 0.1 --demodbinary 1 --BinaryPointFile ../../projects/einstein.phys.uwm.edu/templates_LATeah1062L33_0388_15577681.dat --debug 1 --device 0 -o LATeah1062L33_388.0_0_0.0_15577681_2_0.out
  6. output files: 'LATeah1062L33_388.0_0_0.0_15577681_2_0.out' '../../projects/einstein.phys.uwm.edu/LATeah1062L33_388.0_0_0.0_15577681_2_0' 'LATeah1062L33_388.0_0_0.0_15577681_2_0.out.cohfu' '../../projects/einstein.phys.uwm.edu/LATeah1062L33_388.0_0_0.0_15577681_2_1'
  7. 16:00:11 (6976): [debug]: Flags: X64 SSE SSE2 GNUC X86 GNUX86
  8. 16:00:11 (6976): [debug]: Set up communication with graphics process.
  9. boinc_get_opencl_ids returned [0000000003ba5080 , 00007ffa5d54bfd0]
  10. Using OpenCL platform provided by: Advanced Micro Devices, Inc.
  11. Using OpenCL device "gfx1012" by: Advanced Micro Devices, Inc.
  12. Max allocation limit: 4244635648
  13. Global mem size: 4278190080
  14. Couldn't create OpenCL command queue (error: -6)!
  15. OpenCL shutdown complete!
  16. initialize_ocl returned error [2013]
  17. OCL context null
  18. OCL queue null
  19. Error generating generic FFT context object [5]
  20. 16:00:24 (6976): [CRITICAL]: ERROR: MAIN() returned with error '5'
  21. FPU status flags:
  22. 16:00:35 (6976): [normal]: done. calling boinc_finish(69).
  23. 16:00:35 (6976): called boinc_finish
复制代码


PG也是在1分钟左右出现进度条停滞,GPU负载消失,只能手动终止任务
  1. <core_client_version>7.14.2</core_client_version>
  2. <![CDATA[
  3. <message>
  4. aborted by user</message>
  5. <stderr_txt>
  6. geneferocl 3.3.3-2 (Windows/OpenCL/32-bit)

  7. Copyright 2001-2018, Yves Gallot
  8. Copyright 2009, Mark Rodenkirch, David Underbakke
  9. Copyright 2010-2012, Shoichiro Yamada, Ken Brazier
  10. Copyright 2011-2014, Michael Goetz, Ronald Schneider
  11. Copyright 2011-2018, Iain Bethune
  12. Genefer is free source code, under the MIT license.

  13. Running on platform 'AMD Accelerated Parallel Processing', device 'gfx1012', vendor 'Advanced Micro Devices, Inc.', version 'OpenCL 1.2 AMD-APP (3004.8)' and driver '3004.8 (PAL,LC)'.
  14. 11 computeUnits @ 1737MHz, memSize=3072MB, cacheSize=16kB, cacheLineSize=64B, localMemSize=64kB, maxWorkGroupSize=256.
  15. Supported transform implementations: ocl ocl2 ocl3 ocl4 ocl5

  16. Command line: projects/www.primegrid.com/geneferocl_windows_3.3.3-2.exe -boinc -q 72776242^65536+1

  17. Normal priority change succeeded.
  18. Checking available transform implementations...
  19. OCL transform is past its b limit.
  20. OCL3 transform is past its b limit.
  21. OCL4 transform is past its b limit.
  22. OCL5 transform is past its b limit.
  23. Using OCL2 transform
  24. Starting initialization...
  25. Initialization complete (0.120 seconds).
  26. Testing 72776242^65536+1...
  27. Estimated time for 72776242^65536+1 is 0:01:59                 

  28. maxErr exceeded for 72776242^65536+1, 1.0000 > 0.4500
  29. Errors occurred for all available transform implementations
  30. Waiting 10 minutes before attempting to continue from last checkpoint...


  31. </stderr_txt>
  32. ]]>
复制代码


Milkyway运行过程正常,但验证错误率高达15%以上
回复

使用道具 举报

发表于 2020-1-30 23:21:54 | 显示全部楼层
本帖最后由 vincentdark 于 2020-1-31 01:25 编辑

目测是OpenCL有问题,AN混插出问题你不能怪项目啊,本来AN混插就是非常规操作,出现兼容性问题也是情有可原。

有可能是安装A卡驱动是没有正常安装OpenCL。

请尝试手动安装OpenCL,或者尝试把1070卸了重装A卡驱动,然后再插回1070重启试一下。


如果还是不行,那就可能是下面这个帖子里的问题,
https://www.techpowerup.com/261603/amd-radeon-navi-opencl-bug-makes-it-unfit-for-seti-home


但是帖子里有人回复只是跑seti@home有问题,Einstein@home, Milkyway@home, Collatz都可以正常跑。
回复

使用道具 举报

发表于 2020-1-31 02:18:11 | 显示全部楼层
我5700XT已经装好,试了一下milkyway,跑完的40几个包并未出现验证错误。
我用的是最新的20.14驱动。
下午再去开机看einstein怎么样。
回复

使用道具 举报

发表于 2020-1-31 02:23:39 | 显示全部楼层
另外AN混插的话,以我的经验,A卡要做主卡,也就是插到离CPU最近的槽里,并且要接显示器,N卡就可以随意。
win10下双卡驱动很好解决,交给系统自动更新就行。
还有感觉主板跟U也有关系(这个不太确定),我X99+E5混插很少出现问题,以前搞过A88+A10就常有错误。
回复

使用道具 举报

发表于 2020-1-31 18:34:42 | 显示全部楼层
horst1981 发表于 2020-1-31 03:23
另外AN混插的话,以我的经验,A卡要做主卡,也就是插到离CPU最近的槽里,并且要接显示器,N卡就可以随意。
...

那说名intel是和事老,A,N打不起来,你要全套A再插个N进去就会boom
回复

使用道具 举报

发表于 2020-1-31 18:37:12 | 显示全部楼层
horst1981 发表于 2020-1-31 03:18
我5700XT已经装好,试了一下milkyway,跑完的40几个包并未出现验证错误。
我用的是最新的20.14驱动。
下午再 ...

大佬辛苦了,方便的话也请试试seti,看看那帖子是否属实,或者说苏妈是否已修复驱动bug了~
回复

使用道具 举报

 楼主| 发表于 2020-1-31 20:07:58 | 显示全部楼层
感谢各位大佬的意见,目前确认Milkyway和Einstein的重力波能跑,等过段时间跑完剩余任务再继续折腾
下午远程了一网友的5700XT跑脉冲星,驱动2020.1.2,完全没问题,FFT implementation应该在这个版本得到了解决
回复

使用道具 举报

发表于 2020-2-1 04:42:31 | 显示全部楼层
A N混插主要看驱动版本,gpu-z看下open-cl有没有打勾。 经常是安装A驱动,N的opencl就没了,或者安装N的,A没了。 只能DDU后一个个版本试错。我现在发现A的新驱动没问题,N的要用老的,否则没法混插。怀疑是老黄搞的手脚。。。
回复

使用道具 举报

发表于 2020-2-2 13:59:09 | 显示全部楼层
vincentdark 发表于 2020-1-31 18:37
大佬辛苦了,方便的话也请试试seti,看看那帖子是否属实,或者说苏妈是否已修复驱动bug了~ ...

这几天都收不到SETI的包,还测试不了,官网论坛说好像这段时间减少发包了。
https://setiathome.berkeley.edu/forum_thread.php?id=85093#2028359
回复

使用道具 举报

发表于 2020-2-19 22:03:22 | 显示全部楼层
明年试一下AI混插、AN混插、IN混插,看哪个插得好
回复

使用道具 举报

发表于 2020-2-20 10:21:59 | 显示全部楼层
yimu35 发表于 2020-2-1 04:42
A N混插主要看驱动版本,gpu-z看下open-cl有没有打勾。 经常是安装A驱动,N的opencl就没了,或者安装N的,A ...

遇到混插掉OpenCL的问题,可以试试在设备管理器内删除显卡,刷新让系统更新显卡驱动的操作。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-28 16:15

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表