【系统概述】 某工程组网如图3所示,4个OptiX 155/622设备组成622M单向通道保护环,为集中型业务,1号站为中心点,连接网管。 图3 系统组网图 【故障现象】 某日交换机房维护人员反映到3号站的业务中断。查询传输网管告警和性能事件,对应的支路并没有告警和误码、不可用秒等性能事件。 用网管对3号站支路通道做内环回,1号站用误码仪测试,仪表显示业务不通。1号站做外环回,仪表显示业务正常。 【故障分析及排除】 (1) 对应通道没有异常告警和性能事件,一般情况下业务应该是正常的。考虑到部分告警主机缺省是屏蔽的,是不是告警被屏蔽了呢?用网管将1号和3号站支路板的告警屏蔽全取消,查询1号站仍没有异常的告警和性能事件,而3号站通道有LP-UNEQ(支路未装载)告警; (2) 分析1号站业务,1号站同一块PD1不仅有到3号站的业务,还有到2号站的业务,而且在相同的VC-4中,如果是1号站PD1、GTC、SL4故障,一般不会只影响到3号站的业务。可以初步排除1号站有故障的可能;(如果允许,可以做VC-4环回进行测试) (3) 由于只有3号站的业务不好,而同一VC-4中1号站到2号站的业务是好的,故障点最可能在3号站;也可能是2号站的交叉板,怀疑2号站业务穿通不好的原因是,3号站收1号站有LP-UNEQ告警,说明1号站发往3号站的业务有故障,而3号站收1号站只经过了2号站的穿通。 (4) 将1号站对2号站的激光器关闭,倒换后,其它站点业务正常,仍然只有3号站业务不好,告警一样。可以排除2号站穿通不好。(也可以先不对穿通站进行故障定位) (5) 分析3号站业务,3号站只有1块PD1,且业务只对1号站。由于同一VC-4中的1号站到2号站的穿通业务正常,可以初步排除3号站SL4板不好。怀疑是3号站GTC或PD1故障。 (6) 带GTC、PD1到3号站。先更换PD1故障未消失,更换GTC业务恢复。 【结论和建议】 由于GTC和支路板位的接口部分不好,导致了故障。在故障处理中,根据告警,分析业务配置情况、根据业务流向,可有效的进行故障定位。
|