找回密码
 新注册用户
搜索
查看: 10240|回复: 23

[求助] 新款报错,是祸是福,求助!!!

[复制链接]
发表于 2017-2-3 09:27:46 | 显示全部楼层 |阅读模式
从2月1号开始,几台机器LOG都开始不间断的在报错,各种显卡都有970、1060、680等无一幸免,均是使用的7.4.15,但是看最终UPDATA貌似又是结果通过校验了有积分的,这就不知所以了,所以特向广大算友们求证,是否有同样情况,会影响输出么

970跑的11707
00:53:10:WU00:FS01:0x21:Completed 3450000 out of 7500000 steps (46%)
00:54:15:WARNING:WU00:FS01:FahCore returned an unknown error code which probably indicates that it crashed
00:54:15:WARNING:WU00:FS01:FahCore returned: WU_STALLED (127 = 0x7f)
00:54:15:WU00:FS01:Starting
00:54:15:WU00:FS01:Running FahCore: F:\FAHClient7415/FAHCoreWrapper.exe F:\FAH7415\cores/fahwebx.stanford.edu/cores/Win32/AMD64/NVIDIA/Fermi/beta/Core_21.fah/FahCore_21.exe -dir 00 -suffix 01 -version 704 -lifeline 855504 -checkpoint 3 -opencl-platform 0 -gpu-vendor nvidia -gpu 0
00:54:15:WU00:FS01:Started FahCore on PID 1010892
00:54:15:Started thread 22 on PID 855504
00:54:16:WU00:FS01:Core PID:1010944
00:54:16:WU00:FS01:FahCore 0x21 started
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:17:WARNING:FS01:Size of positions 2578 does not match topology 2576
00:54:18:WU00:FS01:0x21:*********************** Log Started 2017-02-03T00:54:17Z ***********************
00:54:18:WU00:FS01:0x21:Project: 11707 (Run 94, Clone 9, Gen 39)
00:54:18:WU00:FS01:0x21:Unit: 0x000000318ca304f358702fa9d3b9ba42
00:54:18:WU00:FS01:0x21:CPU: 0x00000000000000000000000000000000
00:54:18:WU00:FS01:0x21:Machine: 1
00:54:18:WU00:FS01:0x21:Digital signatures verified
00:54:18:WU00:FS01:0x21:Folding@home GPU Core21 Folding@home Core
00:54:18:WU00:FS01:0x21:Version 0.0.18
00:54:18:WU00:FS01:0x21:  Found a checkpoint file
00:54:23:WU00:FS01:0x21:Completed 3250000 out of 7500000 steps (43%)
00:54:24:WU00:FS01:0x21:Temperature control disabled. Requirements: single Nvidia GPU, tmax must be < 110 and twait >= 900
00:57:01:WU00:FS01:0x21:Completed 3300000 out of 7500000 steps (44%)
01:01:08:WU00:FS01:0x21:Completed 3375000 out of 7500000 steps (45%)
01:05:37:WU00:FS01:0x21:Completed 3450000 out of 7500000 steps (46%)
01:08:14:WARNING:FS01:Size of positions 2578 does not match topology 2576
01:09:31:WU00:FS01:0x21:Completed 3525000 out of 7500000 steps (47%)



970跑的11400
QQ截图20170203091455.png
回复

使用道具 举报

发表于 2017-2-3 11:18:55 | 显示全部楼层
我的在0.018下没有此错误,尝试重新安装一下客户端,安装换个盘符下位置
回复

使用道具 举报

 楼主| 发表于 2017-2-3 11:41:54 | 显示全部楼层
1060跑的11711 QQ截图20170203112959.png
回复

使用道具 举报

发表于 2017-2-3 12:27:15 | 显示全部楼层

是同一台机器还是不同机器上?
回复

使用道具 举报

发表于 2017-2-3 13:00:25 | 显示全部楼层
昨天我也遇到了类似问题,解决办法:升级驱动。 我把显卡驱动升级到378.49,就没有问题了
回复

使用道具 举报

 楼主| 发表于 2017-2-3 13:06:26 | 显示全部楼层
金鹏 发表于 2017-2-3 12:27
是同一台机器还是不同机器上?

三台机器都出现这个问题,不同的包报错代码不一样
回复

使用道具 举报

 楼主| 发表于 2017-2-3 13:08:11 | 显示全部楼层
wpf999 发表于 2017-2-3 13:00
昨天我也遇到了类似问题,解决办法:升级驱动。 我把显卡驱动升级到378.49,就没有问题了 ...

老大,但是970坛里都说是347.88产出最高,换驱动产出会不会降低呀
回复

使用道具 举报

发表于 2017-2-3 13:10:17 | 显示全部楼层
tommynsx 发表于 2017-2-3 13:08
老大,但是970坛里都说是347.88产出最高,换驱动产出会不会降低呀

347.88跑报错吗,不报错不用升级, 报错就只能升级了
回复

使用道具 举报

 楼主| 发表于 2017-2-3 13:13:54 | 显示全部楼层
wpf999 发表于 2017-2-3 13:10
347.88跑报错吗,不报错不用升级, 报错就只能升级了

老大,但是很奇葩的是,虽然是报错,但是产出好像是计入统计了的,这个我就搞不清楚这些机器要闹哪样了
回复

使用道具 举报

发表于 2017-2-3 13:17:44 | 显示全部楼层
tommynsx 发表于 2017-2-3 13:13
老大,但是很奇葩的是,虽然是报错,但是产出好像是计入统计了的,这个我就搞不清楚这些机器要闹哪样了
...

那建议还是升级吧,运算中有warning,可能破坏科学价值
回复

使用道具 举报

 楼主| 发表于 2017-2-3 13:18:40 | 显示全部楼层
wpf999 发表于 2017-2-3 13:10
347.88跑报错吗,不报错不用升级, 报错就只能升级了

十点半左右计算完的结果,客户端显示提交了有得分
QQ截图20170203130505.png

一个小时左右以后manho网站的统计就有了该项提交的分数
QQ截图20170203130521.png

这下搞得我是升级不是不升级好像处女座的人看着这个,真的很别扭
回复

使用道具 举报

发表于 2017-2-3 13:25:04 | 显示全部楼层
tommynsx 发表于 2017-2-3 13:18
十点半左右计算完的结果,客户端显示提交了有得分

先把跑beta包的选项去掉看看
回复

使用道具 举报

 楼主| 发表于 2017-2-3 13:25:10 | 显示全部楼层
372.90的1060也有这种报错的情况 QQ截图20170203131335.png
回复

使用道具 举报

发表于 2017-2-3 14:11:06 | 显示全部楼层
wpf999 发表于 2017-2-3 13:00
昨天我也遇到了类似问题,解决办法:升级驱动。 我把显卡驱动升级到378.49,就没有问题了 ...

378.49在有些机器上稳定性有问题,我有一台机器有死机现象,另一台机器有运算程序崩溃现象(不一定是驱动的锅),但是总感觉PPD不是很高,大多数机器还是降回去了。目前只有个别机器在试验这个驱动。

评分

参与人数 1基本分 +8 收起 理由
tommynsx + 8 辛苦了!

查看全部评分

回复

使用道具 举报

发表于 2017-2-3 16:58:34 | 显示全部楼层
tommynsx 发表于 2017-2-3 13:25
372.90的1060也有这种报错的情况

应该与驱动无关,我这里970都是347.88没出现你的问题
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-9 05:10

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表