找回密码
 新注册用户
搜索
楼主: wpf999

终极检测方案:应对FAHClient程序僵死

[复制链接]
发表于 2017-4-6 15:04:54 | 显示全部楼层
Lynt 发表于 2017-3-28 23:01
为验证telnet响应判断FAHClient卡死的准确性,已在Linux卡包处理脚本中增加telnet无响应检测代码(目前仅将 ...

试用了兄弟的脚本,怎么没看到有log文件记录呢?什么原因?
回复

使用道具 举报

发表于 2017-4-7 08:51:01 | 显示全部楼层
ONLY 发表于 2017-4-6 15:04
试用了兄弟的脚本,怎么没看到有log文件记录呢?什么原因?

感谢O版支持,昨天已远程查看脚本运行状况,发现两个问题:一个是Linux版LOG对警报或出错会增加颜色标识,导致抓取LOG时间出错,加上新版客户端跑core18一直warning的问题,脚本基本无法成功运行,已调整脚本解决。第二个问题是O版网络状况不稳定,有时下载超过15分钟,导致脚本判断SLOT超过15分钟不计算直接作卡包处理,之前跟金版讨论,为简化卡包判断(因为卡包原因较多),凡是SLOT在阀值时间内不开始计算的,认定为卡包,因此建议网络不好的算友根据实际情况,适当增加卡包判断时间阀值,就是命令行最后那个数值。
至于没有fah_daemon.log文件产生,如果没有发生卡包现象,也不会生成此文件,因此判断脚本是否在运行,主要看/var/log目录中是否有 temp_FSxx_log.txt文件产生,文件大小是否正常,修改时间是否跟crontab设置的脚本运行时间一致。

评分

参与人数 2基本分 +120 收起 理由
金鹏 + 20 赞一个!
wpf999 + 100 辛苦了!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-29 17:01

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表