找回密码
 新注册用户
搜索
查看: 8034|回复: 21

9205:Bad State detected... attempting to resume from last good checkpoint

[复制链接]
发表于 2015-10-21 13:40:37 | 显示全部楼层 |阅读模式
  1. Bad State detected... attempting to resume from last good checkpoint
复制代码
跑9205时,总是会出现这个错误,其他人也遇到了吗

回复

使用道具 举报

发表于 2015-10-21 13:43:48 | 显示全部楼层
是的,970在Linux下少超一点能过
回复

使用道具 举报

 楼主| 发表于 2015-10-21 13:50:49 | 显示全部楼层
Lynt 发表于 2015-10-21 13:43
是的,970在Linux下少超一点能过

如果大家都遇到这个问题,说明不是我的硬件问题 起初我怀疑是硬件故障
回复

使用道具 举报

发表于 2015-10-21 13:58:11 | 显示全部楼层
本帖最后由 金鹏 于 2015-10-21 14:00 编辑

我这里980/970/960/780TI/780都正常,就是需要降低60MHZ+频率才能稳住


PS:注意一下21内核是0.011还是0.012版本,且系统剩余可用内存最好有4G+,那样存盘点不容易丢失
回复

使用道具 举报

发表于 2015-10-21 14:06:45 | 显示全部楼层
金鹏 发表于 2015-10-21 13:58
我这里980/970/960/780TI/780都正常,就是需要降低60MHZ+频率才能稳住

我也是少超60能过,我的内核还是0.11影响大吗?
回复

使用道具 举报

发表于 2015-10-21 14:09:39 | 显示全部楼层
wpf999 发表于 2015-10-21 13:50
如果大家都遇到这个问题,说明不是我的硬件问题  起初我怀疑是硬件故障
...

现已发现9712、9205、9625三种包会这样
回复

使用道具 举报

发表于 2015-10-21 14:37:53 | 显示全部楼层
金鹏 发表于 2015-10-21 13:58
我这里980/970/960/780TI/780都正常,就是需要降低60MHZ+频率才能稳住

今天还发现core21包10495的怪现象:GPU频率无法跑到最大,我的刷vBIOS到1480,跑10495的时候,实际频率在1400上下乱跳,早上连续两个10495都是这个现象,第二个包中间特意重启了机器还是一样,后面跑其他包又都能固定在1480,看起来就是10495包的问题
回复

使用道具 举报

发表于 2015-10-21 14:45:24 | 显示全部楼层
Lynt 发表于 2015-10-21 14:37
今天还发现core21包10495的怪现象:GPU频率无法跑到最大,我的刷vBIOS到1480,跑10495的时候,实际频率在 ...

所有21内核包都是这样自动降频

感觉是负载太大显卡功耗保护机制动作造成
回复

使用道具 举报

发表于 2015-10-21 15:34:56 | 显示全部楼层
今早刚好爆了一个包,2%的时候。
回复

使用道具 举报

发表于 2015-10-21 16:37:51 | 显示全部楼层
金鹏 发表于 2015-10-21 14:45
所有21内核包都是这样自动降频

感觉是负载太大显卡功耗保护机制动作造成

之前没注意过,我再观察一下,我的vBIOS改大了保护功耗,应该不会自动降频才对?
回复

使用道具 举报

 楼主| 发表于 2015-10-21 17:35:58 | 显示全部楼层
guihuo 发表于 2015-10-21 15:34
今早刚好爆了一个包,2%的时候。

我这里没有爆包,只是从check point重启
回复

使用道具 举报

发表于 2015-10-21 21:23:09 来自手机 | 显示全部楼层
wpf999 发表于 2015-10-21 17:35
我这里没有爆包,只是从check point重启

从check point重启,gpu要用100,但进度走不下去了,只能删除了再下新wu
回复

使用道具 举报

 楼主| 发表于 2015-10-21 22:01:42 | 显示全部楼层
guihuo 发表于 2015-10-21 21:23
从check point重启,gpu要用100,但进度走不下去了,只能删除了再下新wu

我这没遇到这种情况,重启后还是继续走,GPU load 99%

回复

使用道具 举报

发表于 2015-10-21 22:29:58 来自手机 | 显示全部楼层
看来爆包几率挺大的!
回复

使用道具 举报

发表于 2015-10-21 23:28:02 | 显示全部楼层
不一定降频,我都是自制bios,980ti最后定格在1.205v 1405定频,980是1.168v,1392没定频但不降频,公版980这么设置是因为是伪titan皮,散热能力比公版980ti差很多,就这个电压和频率,温度都要比980ti高几度,换了硅脂,也不是风道问题,互换位置和单卡运行都是一样
我见过跑完了有一次,1次bad state,不记得是哪个包了,也不记得是哪张卡了
也爆过一次,其实就是两次bad state,好像才50-60%的样子,估计撑不住,就自己手动删除了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-13 06:55

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表