在INTEL扣肉至强以前的服务器上跑分布式计算要小心~
最近在单位双至强3.0G (老至强,Prescott核心 65nm 那一代,支持SSE3)上装了BOINC SETI@HOME,因为是Linux操作系统,还真费了些周折,不过总算是搞定了。不过四路运算跑了一段,进程竟然自己停止了,远程登录回去看,发现貌似重启过的样子。想想怀疑是CPU温度过热造成的,于是又费力四处考察,找到LINUX命令行下安装和查询硬件设备信息的软件(lm-sensors www.lm-sensors.org),最终稀里糊涂的算是把这个装上搞定,一查才发现,这CPU温度还真高,按INTEL的产品规程,其工作温度上限75度,位于托管机房中的2U服务器中,CPU不跑分布式运算的话负载很低,温度也就50度左右,但跑四路计算1小时后就是77度!!! 以下是侦测结果:
adm1027-i2c-1-2e
Adapter: SMBus I801 adapter at 1440
V1.5: +3.18 V(min =+0.00 V, max =+3.32 V)
VCore: +1.29 V(min =+1.24 V, max =+1.37 V)
V3.3: +3.32 V(min =+3.13 V, max =+3.47 V)
V5: +4.97 V(min =+4.74 V, max =+5.26 V)
V12: +0.06 V(min =+0.00 V, max = +15.94 V)
CPU_Fan: 0 RPM(min = 87 RPM)
fan2: 8940 RPM(min = 87 RPM)
fan3: 8517 RPM(min = 87 RPM)
fan4: -1 RPM(min = 87 RPM)
CPU Temp: +77.0°C(low=+0.0°C, high = +80.0°C)
Board Temp:+44.0°C(low= -127.0°C, high = +127.0°C)
Remote Temp: +41.0°C(low=+0.0°C, high = +64.0°C)
cpu0_vid: +1.375 V
所以,各位用INTEL垃圾至强的都要小心啊~~ 服务器的散热一般都比较好的。。。同时噪音也比较大,反正我公司的垃圾至强一直都在跑BOINC的:) adm1027-i2c-1-2e
Adapter: SMBus I801 adapter at 1440
V1.5: +3.18 V(min =+0.00 V, max =+3.32 V)
VCore: +1.29 V(min =+1.24 V, max =+1.37 V)
V3.3: +3.32 V(min =+3.13 V, max =+3.47 V)
V5: +4.97 V(min =+4.74 V, max =+5.26 V)
V12: +0.06 V(min =+0.00 V, max = +15.94 V)
CPU_Fan: 0 RPM(min = 87 RPM)
fan2: 8940 RPM(min = 87 RPM)
fan3: 8517 RPM(min = 87 RPM)
fan4: -1 RPM(min = 87 RPM)
CPU Temp: +77.0°C(low=+0.0°C, high = +80.0°C)
Board Temp:+44.0°C(low= -127.0°C, high = +127.0°C)
Remote Temp: +41.0°C(low=+0.0°C, high = +64.0°C)
cpu0_vid: +1.375 V
CPU风扇转速0? 不热才怪
[ 本帖最后由 YsMilan 于 2008-1-21 08:42 编辑 ] 至强就是温度高,所以搞好散热和空气对流布局很重要。
偶有几个至强服务器因为散热风扇老化的问题已经down过几次了。
不过一般服务器主板都有过热保护,不会损坏CPU,换个风扇就没事了。 说明你们那散热不过关…… 机房室温多少?
有的IDC 机房不舍得开空调,很热的。我见过有20多度室温的机房....
页:
[1]