C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 2114|回复: 2

[通信前沿] 生产楼IDC机房环境评估报告 [复制链接]

军衔等级:

亚星游戏官网-yaxin222  副版主

注册:2006-11-235
发表于 2022-10-27 09:12:41 |显示全部楼层

一、问题概述
近期,接政企部转客户反映,南京路生产楼IDC机房存在以下问题:
1、测量冷池内个别机柜门温度最高值为32.7°,远大于机房规范要求;
2、机柜内设备最高温超过50度;
3、检查空调设置22.5度,较高。
二、现状核查
接到政企部协查函件后,分企业网络部高度重视,马上协调政企部客户接口人员组成问题对接小组,现场对客户反映相关问题进行核实对接。
               
为有助于南京路四楼IDC机房问题整体分析解决,对接小组调阅相关规划、设计文档,并结合南京路四楼IDC机房现场勘查,根据勘查结果,整理南京路生产楼IDC机房设备配置平面分布图如下:  
南京路生产楼四楼IDC机房整体可用机房面积为389m2,规划建设微机房5个,数据机柜123个。现已建成可用数据机柜52个,在用机柜37个;在建微机房3个,数据机柜71个。
政企客户反映问题涉及微机房为2#微机房。经现场测量,该微机房
1、内部冷池环境温度为23.7oC-23.9oC,数据机柜进风门温度为21.7oC-23.2oC;
2、外部热通道环境温度32.4oC-35.2oC,设备内部元器件工作温度为45.7oC-52.6oC。
外部热通道测量环境温度32.4oC-35.2oC,与客户反映“测量冷池内个别机柜门温度最高值为32.7°”基本吻合,可以基本确认,客户测量“个别机柜门温度”为微机房数据机柜热风出口温度。
二、现状分析:
(一)微机房冷池温度
根据《中国移动通信集团IDC机房维护细则》环境要求 :“温度:对于采用冷热通道隔离或新型空调末端(列间空调、热管空调、水冷冷门等)的IDC机房,要求冷通道或机柜进风区域温度推荐值为18℃~27℃,允许值为15~32°C。”现场实测冷通道或机柜进风区域温度为23.7oC-23.9oC,与客户空调设置温度基本吻合,也符合《中国移动通信集团IDC机房维护细则》环境要求 ,不存在温度过高问题。
(二)机柜内部温度及机柜门温度
客户反映“机柜内设备最高温超过50度”
机柜内部温度问题,《中国移动通信集团IDC机房维护细则》环境要求对客户服务器内部元器件温度没有规定要求,且客户服务器内部元器件温度形成因素比较复杂,主要有以下可能因素导致:
1、服务器板卡超负载:
高功率服务器工作功耗散热IDC机突破房单机柜功耗散热限值,超出微机房空调保障能力,将导致服务器内部元器件温度出现过高现象。
2、服务器元器件散热不良:
1)服务器板卡元器件老化,性能劣化;
2)接触不良,接触电阻增大;
3)板件未及时清理,灰尘堆积,服务器板卡元器件与外界环境传导交换不畅;
4)风扇故障,不能及时将热量带走,导致服务器功耗散不能与外部环境有效交换,导致温度累积上升。
以上都是因为客户规划、设备选型、设备安装、设备维护等原因导致,应建议客户加强维护,确保服务器内部工作环境。
且根据现场实测,“设备内部元器件温度为45.7oC-52.6oC”,远低于半导体器件““商业级”温度级别(0℃~70℃)或者“工业级”温度级别(-40℃~+85℃)。”,处于正常范围。
三、评估结论及整改建议:
根据以上《中国移动通信集团IDC机房维护细则》与现场实测对比,南京路生产楼四楼IDC机房环境完全符合要求。
服务器出现大概率高温退服故障,主要可能原因如下:
(一)环境高温,服务器与机房环境热交换不良,不能将热量排到机房外环境,导致服务器板件异常温升,超过服务器板件安全耐受值,服务器故障退服;
(二)机柜热岛,服务器与机房环境热交换不良,不能将热量排到机房外环境,导致服务器板件异常温升,超过服务器板件安全耐受值,服务器故障退服;
(三)风扇故障,服务器与机房环境热交换不良,不能将热量排到机房外环境,导致服务器板件异常温升,超过服务器板件安全耐受值,服务器故障退服;
(四)板件老化,板件高温耐受能力下降,出现高温故障退服;
(五)板件脏污,灰尘堆积,服务器板件与机房环境热交换不良,不能将热量排到机房外环境,导致服务器板件异常温升,超过服务器板件安全耐受值,服务器故障退服;
根据以上故障可能原因,如机房环境正常,客户服务器仍出现故障率较高问题,建议与客户主动沟通,采取以下整改措施:
(一)将现有服务器替换为低功耗服务器,降低服务器功耗散热;
(二)降低单机柜服务器功率安装密度,减少机柜热岛存在几率;
(三)及时更换老化服务器,提高服务器工作性能水平;
(四)及时清理服务器板件,避免因板件灰尘堆积,影响元器件散热;
(五)风扇及背板故障应及时维修更换,改善服务器与外部环境热量交换,根本避免服务器内元器件异常温升退服!
以降低服务器退服故障发生概率。

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-10-31 13:30 , Processed in 0.115616 second(s), 15 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图