C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 3245|回复: 3

[技术讨论] 信息机房应急响应预案 [复制链接]

军衔等级:

亚星游戏官网-yaxin222  新兵

注册:2010-12-2
发表于 2021-12-24 19:47:08 |显示全部楼层
信息机房应急响应预案


1.  总则
1.1 保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。
1.2 最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。
1.3 故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。
1.4 尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。

2.  应急预案2.1 电源系统应急预案
定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案处置:
1、当机房发生市电供电突然停电或是电源异常时。首先应确认是否正常停电以及预计停电时间。检查不间断电源(UPS)的电池可供电时间,确保设备正常运行。如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突来电瞬间电流过大导致设备损坏等现象。
2、当确定停电时间超出机房UPS承载范围后,首先确定停电的范围(门诊、住院部),并马上通知医院信息网络突发事件应急处理领导小组,由其统一指挥、协调各部门做好停电应急准备。
3、遇到市电或者UPS二者各自不供电的情况下,由值班人员通知医院责任部门马上进行抢修,抢修后告之预计修好时间。如超过10分钟就应马上通知医院信息网络突发事件应急处理领导小组,由其统一指挥、协调各部门做好停用应急准备。
4、恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。
2.2 网络和服务器系统应急预案
定期对中心机房的服务器设备及网络通信线路进行检查,经常关注机房环境和各设备的工作状态,当发生下列突发事件时,按以下方案进行处置:
1、发生网络故障时,首先检查机房设备(交换机或防火墙)情况,确定网络故障的原因。
2、确认原因后,首先要启动备用线路和设备,保证网络的正常运行,然后再联系产品技术支撑,及时处理和排除故障。
3、当确认原因为短时间无法恢复(10分钟左右),应及时向信息科负责人汇报,并通知医院信息网络突发事件应急处理领导小组,协调各部门的工作。
4、当人为或病毒破坏的故障发生时,具体按以下顺序进行:判断破坏的来源及性质,断开影响安全与稳定的信息网络设备,断开与破坏来源的物理网络连接,跟踪并锁定破坏来源和其他网络用户信息,修复被破坏的信息,恢复系统。
5、服务器由于硬件系统异常无法正常运行时。检查服务器设备故障报警指示灯状态,初步确定故障原因,如果不能自行排除(5分钟内)马上启用备用服务器。由备用服务器接管相关业务应用,同时安排人员将故障服务器脱离服务器网络,保存系统状况不变,保护原始数据。
6、在确认安全的情况下,重新启动故障服务器系统:重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败。马上联系相关企业,请求技术支撑,做好技术处理。
处置结束后,技术人员应将处理过程记录下来,以便日后对此问题的处理和持续改进。
2.3 空调系统应急预案
定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与技术支撑企业进行联系解决。
1、当机房主空调因故障无法制冷,应马上开启备用空调给予降温;
2、如备用空调不能满足机房内温度要求,威胁到主要业务的应用服务器的情况下,值班人员应按照业务重要性优先等级次序,逐步关闭无关设备或非重要设备。
2.4 机房发生意外火灾预案
1、一旦机房发生火灾,应遵照下列原则:首先保人员安全;其次保关键设备、数据安全;三是保一般设备安全。
2、工作人员马上通知119电话报警和保卫科,人员及时撤离。
3、当发现机房有火灾发生,且火势未起时,可以酌情利用现场的灭火器进行灭火;
4、如果火势已起,不能人为控制时,人员应马上离开发生火灾的机房,并关闭发生火灾的机房大门。启动七氟丙烷气体进行灭火。
启动方式有如下两种方式:
(1)拿出启停按钮钥匙,开启发生火灾机房门口的气体启动按钮,30秒延时后,相应机房的七氟丙烷气体喷射进行灭火;
(2)到气体灭火控制盘处,按下标有发生火灾机房标志的红色气体启动按钮,此按钮无延时,相应机房的七氟丙烷气体马上喷射进行灭火。
5、释放气体进行灭火时人员应远离现场以免发生意外。
6、发生火灾气体喷洒结束后,机房内底部留有残余气体,此时按下自动报警主机手动按钮标有排烟阀的按钮,报警主机上显示排烟阀打开,接着在配电柜送上排烟机电源,人员离开即可。
7、气体系统设备的日常维护:应定期对七氟丙烷气体灭火钢瓶气密性进行检查,检查方法是观察钢瓶上的压力表指数是否在规定正常的范围内,如果已低于正常范围,即通知外协企业对钢瓶进行充装维修。
2.5 机房水患应急预案
1、漏水:
(1)发生机房漏水后,第一目击者应马上通知信息科负责人;
(2)若空调系统出现渗漏水,应马上停止故障空调,将机房内的积水清除干净,并及时联系设备供应方进行处理,必要情况下可以临时用电扇对服务器进行降温。
(3)若为墙体或窗户渗漏水,应马上通知行总务处,及时清除积水,进行墙体或窗户维修,避免不必要的损失。
2、水淹:
(1)因暴雨,造成机房外环境内涝,值班人员应马上通知总务处维修人员前来疏通下水,并及时向信息科负责人汇报。
(2)在维修人员未赶到之时,值班人员应马上尽量自行疏通下水;
(3)如预计水势无法阻挡,应马上通知医院信息网络突发事件应急处理领导小组,启用信息系统故障应急预案,全院进入手工模式。然后将机房全面断电,防止漏电事故及设备遇水损坏。

举报本楼

本帖有 3 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-10-30 23:15 , Processed in 0.191253 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图