艾滋病还是大面积无效,暂停计算
本帖最后由 vardrag 于 2015-12-30 19:44 编辑还好有个金牌。同期的结果少数有效,难道又是网络的问题?
先换个别的项目刷。 是ES的U么?
难道对AVX支持有问题?
金鹏 发表于 2015-12-30 20:20
是ES的U么?
难道对AVX支持有问题?
是ES,但是hwinfo可以看到SSPEC,跟盖子上写的一样,所以我认为跟正式版没有区别(那U网上没有任何信息,不知道正式版什么样)。
vardrag 发表于 2015-12-30 20:25
是ES,但是hwinfo可以看到SSPEC,跟盖子上写的一样,所以我认为跟正式版没有区别(那U网上没有任何信息, ...
只跑一个FAH2任务试个一天看看单线程还会出错否?
金鹏 发表于 2015-12-30 20:28
只跑一个FAH2任务试个一天看看单线程还会出错否?
我批量计算之前就先算了一个,结果就有效,然后就被坑了
金鹏 发表于 2015-12-30 20:28
只跑一个FAH2任务试个一天看看单线程还会出错否?
可能真是网络问题。
无效结果大部分未经验证,另外两个还在计算,我就被pass掉了,有些甚至是上传之后立刻就无效。
刚刚上传的十几个结果全部有效,区别就是它们是随算随传,无效的大部分来自恢复网络之后的集中上传。
看起来我目前的网络状况比较适合小包。
vardrag 发表于 2015-12-30 20:50
可能真是网络问题。
无效结果大部分未经验证,另外两个还在计算,我就被pass掉了,有些甚至是上传之后立 ...
你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效
金鹏 发表于 2015-12-30 20:53
你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效
我是今天一起算了一批任务,中间断网一次,恢复之后有部分已经算完,部分还在计算。先行上传的这批基本上都无效,刚刚网络通畅时算完的一批就有效。
这批任务基本上是同时接的,如果是设置的问题,不会出现两种情况吧?
金鹏 发表于 2015-12-30 20:53
你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效
等我这机器均分稳定之后我要测试一下,断网之前暂停计算,保证计算时网络通畅,看看是否还会无效。
机器跑过稳定性压力测试没? muclemanxb 发表于 2015-12-30 21:29
机器跑过稳定性压力测试没?
FPU还是P95?有这必要吗?
vardrag 发表于 2015-12-30 21:34
FPU还是P95?有这必要吗?
ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18个小时重试的),也从来没出现过你这种~除了自身稳定性,目前你还有其他能怀疑的因素吗?
还有,换一个U、换内存试试看。
muclemanxb 发表于 2015-12-30 22:27
ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18 ...
这样我就有疑问了。既然需要对比不同主机的结果,那么为什么我的很多结果没有进行比较就判定无效?今天无效的那几个任务其它主机都是在处理中,服务器凭什么判定我的结果无效?
muclemanxb 发表于 2015-12-30 22:27
ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18 ...
看了一下日志,是因为某种原因计算有中断,于是被判无效。
烤鸡形式的压力测试我是不太相信的。以前买过两张显卡,各种烤鸡一切正常,跑einstein不到10分钟必定黑屏,而einstein的功耗只有默认TDP的80%。
页:
[1]
2