经验 294 分贝 0 家园分 1442 在线时间: 300 小时 最后登录: 2024-10-15 帖子: 90 精华: 0 注册时间: 2009-3-2 UID: 340746
注册:2009-3-2 2
发表于 2022-8-29 12:47:54
| 显示全部楼层
OTN告警先容及故障定位方法
1OTN帧结构概况
1.1OTN产生的背景
目前随着通信行业的发展,对光网络的要求越来越高,要求光网络所承载的信息量也越来越大,承载的客户信号种类也各种各样,包括SDH、ATM、以太网、IP等多种信号都要求能在光网络中快速、高效、透明、可靠的传输。为此,国际电信联盟ITU制订光传送网OTN的相关标准,来引导OTN的发展。
光传送网OTN是下一代光网络的发展方向。OTN设备主要完成的功能就是将客户信号封装在OTN的相应帧格式中,透明、高效的进行传输,同时,通过相应的OTN开销对信号的好坏进行检测。因此,理解好OTN开销对深入理解OTN设备有着重要意义。
ITU-T在G.709标准中规定了OTN的帧格式和映射方式,;在G.798标准中规定了设备的功能特性。因此,本手册主要以G.709和G.798为标准,结合我司M820V2.5设备和ZXONE 8X00设备,主要讲述我司设备OTN开销的实现以及检测。
1.2OTN的网络层次
光传送网OTN的一个主要特征就是网络的层次化。将光传送网划分为多个网络层次,每个层次之间彼此互为服务层与客户层。客户信号在不同层次之间进行传输,每一层次都有着自己的开销,用于检测本层次信号的好坏。
根据ITU-T的G.709规定,OTN分为客户信号层、光通道净荷单元(OPU)、光通道数据单元(ODU)、光通道传送单元(OTU)、光通道层(OCH)、光复用段层(OMS)、光传输段层(OTS)。以上各层之间,前者是后者的客户层,后者是前者的服务层。下面是对各层的简单说明:
1. 客户信号层:该层主要指OTN网络所要承载的局方信号,主要包括:SDH、以太网、IP业务等。
2. 光通道净荷单元OPU:该层主要是用来适配客户信号以便使其适合在光通道上传输,即:承载客户信号的“容器”。该层的开销主要用来指示客户信号映射到OTN信号的过程。
3. 光通道数据单元ODU:该层是由OPU层和ODU层相关开销构成的,该层的开销可以支撑对传输信号质量端到端的检测。
4. 光通道传送单元OTU:该层是在光路上传输信息的基本单元结构,有ODU层和OTU层相关开销构成。
5. 光通道层OCH:该层是具有特定波长和特殊帧格式的光信号,其中特殊帧格式即定义的OTU层。
6. 光复用段层OMS:该层为经过合波处理的多波长光信号。
7. 光传输段层OTS:该层是经过OA放大等处理后的光信号。
由于层次化是OTN网络的主要特点,因此,熟悉各层次结构对于理解OTN标准十分重要。下图是OTN各层次图,以我司设备为例,指出各层的具体位置。
M820V2.5设备OTN各层次举例
在这需要指出的是OTS层、OMS层和OCH层是纯粹的光信号,虽然G.709中定义了相关的开销,但是目前几乎所有的设备制造商都没有涉足。因此,大家重点关注的应是OPU层、ODU层以及OTU层的相关开销。
OTN各层还有不同的速率级别,即通常采用OPUk、ODUk、OTUk的形式来表示OTN各层(k=0、1、2、3),ODU0对应1.25G速率级别可以用来封装GE信号;ODU1对应2.5G速率级别可以用来封装STM-16信号;ODU2对应10G速率级别;ODU3则对应40G速率级别。
1.3OTN的帧结构
OTN的帧结构与SDH的帧结构不同,OTUk的帧是由4行4080列的字节组成。每一个OTUk帧都可以看成相应ODUk加成OTU的开销所构成,而每一个ODUk也同样可以看成是由相应的OPUk加上ODU的开销所构成。下图是一个OTUk帧的示意图:
上图所示中,紫色区域为OTUk帧的帧头区;红色区域为OTU层开销;蓝色区域为ODU层开销;绿色区域为OPU层开销;黄色区域为OTUk帧的净荷区。详细的开销示意图如下图所示:
下面就分别对各区域开销做简单先容。
1. 帧定位字节:
G.709中规定,每一个OTUk的帧头有6个帧定位字节(FAS)和一个复帧定位字节(MFAS)组成。帧定位开销既可用于OTUk也可以用于ODUk,当设备收到的OTUk帧或ODUk帧的帧定位字节出现错误时,设备上报OTU帧丢失(对于ODU帧则上报ODU-LOFLOM);如果出现复帧错误,则会上报OTU复帧丢失的告警。需要特别指出的是,无论是帧丢失还是复帧丢失,都按业务失效处理。
2. OTUk的开销:
如图2-3所示,OTUk的开销实际上有两部分组成,一部分是7个字节的开销,另一部分是最后附加的FEC纠错开销,这里重点先容OTUk的7个字节开销。
OTUk的7字节开销主要三部分组成:3字节的段检视开销(SM)、2字节的通用通信通道(GCC0)以及2字节的预留段(RES)。与大家业务密切相关的是SM段的开销。
SM段开销有3个字节组成,第一个字节为路径踪迹标示符(TTI),第二个字节为比特间插校验码BIP-8,最后一个字节则由4位的后向差错指示/后向输入定位错误指示(BEI/BIAE)、1位后向缺陷指示(BDI)、1位的输入定位错误(IAE)以及2位的预留比特所组成,示意图如下:
路径踪迹标示符(TTI)是由64个字节组成,用来指示路径踪迹防止错连。我司的设备既可以在源端人为设置TTI的希望值,也可以检测上游传递过来的TTI值,当所受到的TTI值与网管设置的希望值不一致时,则上报TTI失配告警。
比特间插校验码BIP-8是用来检测OTUk帧中的传输错误的,当收到的BIP-8值与上游发来的BIP-8值不一致,则设备会统计BIP-8个数,以表示上游传过来的信号中有误码存在。
后向差错指示/后向输入定位错误指示(BEI/BIAE)是用来向上游指示错误或对齐错误的,当设备收到BIP-8误码时,会向上游回送同样数量的BEI作为错误指示;如果设备收到帧对齐错误IAE时,在统计IAE秒的同时,会向上游回送同样数量的BIAE。
后向缺陷指示(BDI)是用来向上游传送反向失效指示的。当设备收到业务失效信息时,会向上游回送BDI,以表示收到的信号失效。
注意:
TTI、BDI、BIP-8、BEI、IAE以及BIAE等开销,不仅仅是在OTUk开销中存在,同样在ODUk层开销和TCMi层开销中也存在,它们的意义是一样的,只是用来检测不同的网络层次,因此,在工程中遇到相关告警或性能统计,一定要首先明确是哪一层次的。
下图是我司设备层次的举例说明:
3. ODUk的开销:
G.709中规定的ODUk的开销比较复杂,如图2-3所示,ODUk的开销主要由3*14个字节组成,这里主要说明一下与业务关系密切的开销。
在ODUk开销中最为重要的开销有两组,即:3字节长的PM段开销和3字节长的TCMi开销。
ODUk通道段监视PM段开销和串联监视TCMi段开销与OTUk中SM开销类似,主要的区别在于PM和TCMi开销中有3比特位的状态标示符(STAT),而SM开销中是预留位(RES)。G.709中规定的串联监视TCM一共有6个,即TCM1~TCM6,由于其开销地位完全相同,故本文中统一用TCMi来表示6个TCM层开销。下图是PM和TCMi的开销示意图:
图 27 TCMi段开销示意图
PM层和TCMi层中的TTI、BIP-8等开销的意义与SM中一致,不再重述。这里主要说明一下状态标志符(STAT)的含义。状态标示符STAT主要由3个比特位组成,由二进制表示一共有8个不同状态。ODUk PM及TCM状态位含义见下表。
PM STAT取值 含义
000 预留作未来国际标准使用
001 正常的通道信号
010 预留作未来国际标准使用
011 预留作未来国际标准使用
100 预留作未来国际标准使用
101 维护信号:ODUk-LCK
110 维护信号:ODUk-OCI
111 维护信号:ODUk-AIS
TCMi STAT取值 含义
000 源端无串联连接监视
001 源端有串联连接监视,无IAE(正常信号)
010 源端有串联连接监视,有IAE
011 预留作未来国际标准使用
100 预留作未来国际标准使用
101 维护信号:TCMi-LCK
110 维护信号:TCMi-OCI
111 维护信号:TCMi-AIS
这里需要重点关注的是维护信号,根据G.709的规定,定义了三种维护信号AIS、OCI和LCK。当下插这三种维护信号时,设备将会以特殊码型来替代出帧定位字节外的全部业务信号(AIS全部置为111、OCI置为110、LCk置为101),此时,业务应为失效处理。关于维护信号的更多内容,将在后续章节中进行详述。
4. OPUk的开销:
G.709中规定的OPUk的开销主要由包括净荷类型(PT)的净荷结构标识(PSI)、与级联相关的开销、与客户信号映射到OPUk相关的开销构成。这里只需要重点关注PT。
净荷类型PT代表了不同的业务映射类型,我司的设备不仅可以在源端设置希望的PT值,而且在设备也可以检测到上游传递过来的PT值,当接受到的PT值与网管设置的希望值不一致时,则上报PT失配告警。
注:当设备AIS非使能状态时,PT失配和TTI失配都不会影响业务。
1.4OTUk,ODUk,OPUk的区别
OPUk帧是ODUk帧的一部分,ODUk帧是OTUk帧的一部分。即OTUk帧中,和业务映射相关的部分组成OPUk,OPUk加上一些维护管理开销组成ODUk,而ODUk再加上一部分维护管理开销组成OTUk
OTUk帧是为了让ODUk帧能够在光纤中传输而设计的,ODUk帧中加上一些适应于外部传输的开销或处理操作就形成了OTUk帧,例如FEC,SM开销,扰码等。出现在设备外面的信号必然是OTUk帧,不可能是ODUk或OPUk帧
ODUk帧是OTUk帧的一部分,是电层处理时用到的帧格式,例如对OTUk做电再生处理时,必须将OTUk帧转换为ODUk帧,然后再从ODUk转为OTUk帧。另外电层交叉调度也是在ODUk上实现的。电层的处理用不到OTUk帧中适用于外部传输的特征,所以应该将OTUk帧做些简化后再进行,实际上OTUk帧去掉适用于外部传输的特性后就变成了ODUk帧。ODUk帧和OTUk帧分别有自己的开销,OTUk帧的开销自然是在外部传输时用到的,而ODUk开销是在电层处理时用到的
OPUk帧是ODUk帧的一部分,OPUk帧是专门为了实现将业务装入OTUk帧而设计的。OPUk帧的主要功能就是把各种业务装OPUk帧的净荷部分,然后再加上和业务映射有关的开销,例如字节调整开销和净荷类型指示
1.5OTN网络中客户信号的映射与复用
客户信号的映射与复用过程比较复杂,这里不作详述,仅对过程做简单的叙述,如有需要可以参加G.709和G.798。
1. GE业务的映射过程:
GE信号—>GFP-T—>OPU0—>ODU0—>OPU1—>ODU1—>OPU2—>ODU2—>OTU2
2. 10GE-LAN业务的映射过程:
10GE-LAN信号—>GFP-F—>OPU2—>ODU2—>OTU2
3. STM-16业务的映射过程:
STM-16信号—>OPU1—>ODU1—>OPU2—>ODU2—>OTU2
4. STM-64业务的映射过程:
STM-64信号—>OPU2—>ODU2—>OTU2
上述映射过程是以M820V2.5和ZXONE 8X00为例,熟悉客户信号的映射过程对理解单板的检测点和故障分析是很重要的。
1.6PM/SM/TCM/OAC层
1.6.1SM,PM,TCM的作用范围
SM的范围:OTUk电再生时
M的范围:非OTUk信号转换到OTUk时产生,OTUk转换为非OTUk时终结
TCM的范围:在整个PM范围内的一部分,起点和终点由用户决定。设置方法:发送口可设置运行或透传,接收口可设置运行、监测或透传)
1.6.2SM,PM,TCM层主要告警
1.6.2.1SM层主要告警:
层 告警名称 告警名称 产生条件及说明
SM OTU_SM_TTI_TIM OTU层SM段信号踪迹字失配告警 从SM开销中提取出接收到的TTI值,和网管设置的TTI希望值做比较,根据TTI比较模式确定实际值和希望值是否匹配,当不匹配时上报SM踪迹字失配告警
SM OTU_LOF OTU帧丢失告警 如果连续5帧无法找到预期的定帧字节则进入OOF状态,当OOF持续3ms后将产生, LOF告警
SM OTU_LOM OTU复帧丢失告警 复帧定位字节出错时,进入OOM状态,当OOM持续3ms,将产生LOM告警
SM 15M_SM_BBE_UP 15分钟SM背景误码块越限告警 1帧中只要有一个BIP8,则计算一个背景误码块,当15分钟内累计误码块数超过网管设定的门限值后上报该告警
SM 24H_SM_BBE_UP 24小时SM背景误码块越限告警 网管对单板上报的SM背景误码块进行累加,当超过网管设定的门限值后上报该告警
SM SM_DEG OTU层SM段DEG告警 在指定的时间长度内连续出现误码大于性能劣化门限时,确认为出现DEG告警,其中时间长度和性能劣化门限均可由网管指定。
SM OTU_AIS OTU AIS告警 见维护信号含义
SM OTU_SM_BDI OTU层SM段BDI后向失效指示 反向失效指示, 一般接收口的OTUk帧检测到LOF或LOM时对应发送口会插入BDI,用于告知上游节点,本节点接收出现问题。
1.6.2.2PM层主要告警:
层 告警名称 告警名称 产生条件及说明
PM 15M_PM_BBE_UP 15分钟PM背景误码块越限告警 1帧中只要有一个BIP8,则计算一个背景误码块,当15分钟内累计误码块数超过网管设定的门限值后上报该告警
PM 24H_PM_BBE_UP 24小时PM背景误码块越限告警 网管对单板上报的SM背景误码块进行累加,当超过网管设定的门限值后上报该告警
PM PM_DEG ODU层PM段DEG告警 在指定的时间长度内连续出现误码大于性能劣化门限时,确认为出现DEG告警,其中时间长度和性能劣化门限均可由网管指定。
PM ODU_PM_TTI_TIM ODU层PM段踪迹字失配 从PM开销中提取出TTI值,和网管设置的TTI希望值做比较,根据TTI比较模式确定实际值和希望值是否匹配,当不匹配时上报PM-TTI失配告警
PM ODU_PM_BDI ODU层PM段BDI后向失效指示 反向失效指示, 一般接收口的ODUk帧检测到失效时对应发送口会插入BDI,用于告知上游节点,本节点接收出现问题
PM ODU_AIS ODU AIS告警 见维护信号含义
PM ODU_LCK ODU LCK告警 见维护信号含义
PM ODU_OCI ODU OCI告警 见维护信号含义
PM ODU_LOFLOM ODU LOFLOM告警 该告警的出现意味着ODU的帧定位字节或者复帧定位字节错误或丢失, 该告警一般不应该出现,一旦出现该告警则说明单板板内部FPGA处理有问题或者背板针损坏
PM OPU_PT_MIS OPU净荷类型PT失配 从PT开销中提取出TTI值,和网管设置的PT希望值做比较,根据PT比较模式确定实际值和希望值是否匹配,当不匹配时上报PT失配失配告警
1.6.2.3TCM层主要告警:
I = 1~6
层 告警名称 告警名称 产生条件及说明
TCMi 15M_TCMi_BBE_UP 15分钟TCMi背景误码块越限告警 1帧中只要有一个BIP8,则计算一个背景误码块,当15分钟内累计误码块数超过网管设定的门限值后上报该告警
TCMi 24H_TCMi_BBE_UP 24小时TCMi背景误码块越限告警 网管对单板上报的SM背景误码块进行累加,当超过网管设定的门限值后上报该告警
TCMi TCMi_DEG TCMi DEG告警 在指定的时间长度内连续出现误码大于性能劣化门限时,确认为出现DEG告警,其中时间长度和性能劣化门限均可由网管指定。
TCMi TCMi_TTI_TIM TCMi层踪迹字失配 从TCM开销中提取出TTI值,和网管设置的TTI希望值做比较,根据TTI比较模式确定实际值和希望值是否匹配,当不匹配时上报TCM-TTI失配告警
TCMi TCMi_BDI TCMi层BDI后向失效指示 反向失效指示, 一般接收口的ODUk帧检测到失效时对应发送口会插入BDI,用于告知上游节点,本节点接收出现问题
TCMi TCMi_AIS TCMi AIS告警 见维护信号含义
TCMi TCMi_LCK TCMi LCK告警 见维护信号含义
TCMi TCMi_OCI TCMi OCI告警 见维护信号含义
1.6.2.4OAC层主要告警:
1.6.2.4.1GE/10GE业务
层 告警名称 告警名称 产生条件及说明
OAC LSYC 同步丢失告警 GE端口的PCS子层实时的对接收到的10B编码进行分析,当连续收到4个无效10B码后接收端口同步丢失,上报该告警时说明接入的业务有问题
OAC RX_GFP_LFD GFP同步丢失告警 GFP帧头不能锁定时上报GFP同步丢失告警,820 V2.4中如果没有背板交叉则客户侧输出端口上报该告警,从820 V2.5开始的时隙交叉系统中,该告警为单板内部告警,一般不会上报,一旦上报该告警,说明单板内部处理有问题
OAC RX_GFP_CSF GFP客户信号失效告警 客户侧输出端口检测到持续的GFP管理帧时上报GFP客户信号失效告警,一般没有接入业务时上报该告警
1.6.2.4.2SDH业务
层 告警名称 告警名称 产生条件及说明
OAC LOF 帧丢失告警 在数据码流连续4帧检测不到有效的A1A2,就报告帧失步(OOF);帧失步(OOF)持续24帧(3ms)就报告帧丢失告警,一般接入业务不正确或光功率不正常时会产生该告警
OAC J0_MISMATCH J0失配 从J0开销中提取出单板接收到的J0值,和网管设置的J0希望值做比较,当不匹配时上报J0失配告警
OAC MS_AIS 接收信号MS_AIS 与OTN-AIS类似,见维护信号含义
OAC MS_RDI MS RDI告警 反向失效指示, 一般接收口检测到失效时对应发送口会插入BDI,用于告知上游节点,本节点接收出现问题
OAC 15M_RS_BBE_UP 15分钟RS背景误码块越限告警 当15分钟内累计接收B1误码块数超过网管设定的门限值后上报该告警
OAC 24H_RS_BBE_UP 24小时RS背景误码块越限告警 网管对单板上报的背景误码块进行累加,当超过网管设定的门限值后上报该告警
OAC RS_DEG RS DEG告警 在指定的时间长度内连续出现误码大于性能劣化门限时,确认为出现DEG告警,其中时间长度和性能劣化门限均可由网管指定
2单板端口的定义:
在M820V2.5设备和M8x00设备中,ODUk的调度接收端口是指从光口到背板方向,ODUk调度发送端口是指从背板到光口方向。下图是背板端口的示意图:
3维护信号的含义
根据G.709的定义,OTN网络中存在三种维护信号,即:告警指示信号AIS、锁定指示信号LCK以及断开连接指示OCI。当出现这三种维护信号时,说明所在业务失效。
3.1告警指示信号AIS:
AIS是实际工程中最常遇到的一种维护信号,其根本作用传递告警信息,即将上游业务失效的信息传递给下游或者是将服务层信号失效的信息传递给客户层。因此,遇到AIS告警要明白两点:一是本业务方向失效;二是故障点不在本检测点而应顺着业务流向向上游查找。此外,AIS是要在所在层中透传的,也就是说从产生之初开始一直到所在层结束,都会有AIS告警。
ODU AIS插入条件:光层LOS、OUT层AIS、LOF、LOM、TTI失配、ODU层LOFLOM、
下图是AIS产生和透传的示意图:
3.2断开连接指示OCI:
OCI告警是在M820 V2.5设备和M8x00设备中新增加的,其主要目的是指示交叉连接的断开。也就是说遇到OCI说明本业务所在的路径上游没有配交叉连接。
通过OCI告警进行问题定位:
没有配置交叉时单板对应的调度端口上报OCI告警,上游的OCI告警可以透传到下游站点,根据OCI告警上报的端口,判断交叉配置情况,如下图所示。
从背板到光口方向没有配置交叉时,业务板调度发送端口上报OCI告警;
A站点从CH1到LO2方向没有配置交叉时,A站点LO2调度发送端口及B站点LO2调度接收端口同时上报OCI告警。
3.3锁定指示LCK:
LCK一般是通过网管设置的,在正常应用下是不会有该告警产生的。LCK的主要作用是锁定该路径,表示该路径不再被使用。
4业务单板常见告警
单板的告警是定位故障的主要手段,因此,在本节中将主要先容一些M820V2.5设备和M8x00设备中常见的告警,关于出现告警后具体的定位方法将在后文中举例详述。
4.1服务层信号失效告警(SSF):
该告警是M820V2.5设备和M8x00设备中新增的告警,用来表示该检测点所监测层的服务层信号失效。比如线路侧接收端口业务失效时,对应的调度接收端口会上报SSF告警,出现该告警意味着业务的中断,并会下插维护信号AIS。服务层失效告警上报时一定是业务方向的上游检测点有问题SSF告警优先级最高,当某端口上报SSF告警时会屏蔽掉其他告警。
4.2信号劣化告警(DEG):
该告警的出现意味着当前信号质量的严重劣化。按照ITU-T标准的规定,我司设备可以检测SM层、PM层和TCMi层的BIP8,当收到信号的BIP8超过所设的DEG门限时,就会上报SM层、PM层或TCMi层的DEG告警。DEG门限可以通过网管设置。
在DEGM(秒)的时间范围内,如果每秒种内错误帧占总帧数的百分比都超过DEGTHR(%),则认为DEG告警产生。
4.3GFP相关告警:
通用成帧程序GFP是用来承载以太网数据业务的一种成帧方式。一般分为GFP-T和GFP-F两种。目前,在M820V2.5设备和M8x00设备中,GE业务采用GFP-T的封装,10GE-LAN采用GFP-F的封装。GFP成帧是位于以太网业务和OPU帧之间的,也就是以太网业务先映射到GFP帧,然后再映射到OPU中,一般是由客户侧单板(如:COMB、CH1、DSAC等)来完成的。
GFP相关告警一般主要有两种,即:GFP客户信号失效和GFP同步丢失。这两种告警只有在接入以太网业务时才会出现。GFP客户信号失效告警意味着在GFP成帧之前以太网业务就已经失效,出现该告警多数是因为上游客户侧信号有问题;GFP同步丢失告警意味着故障点在GFP成帧之后。有关这两种告警具体的定位方法将在后文中详述。
4.4G-AIS告警:
该告警是M820V2.5设备和M8x00设备新增的告警,用于表示客户信号失效,相当于客户层的维护信号AIS,因此,只有客户侧单板(如:COMB、CH1、CD2、CQ2、CO2)才会上报该告警。当接入SDH业务时如果上游输入的客户信号失效,上游客户侧单板检测到客户信号失效后采用维护信号G-AIS代替原有的客户信号向下游传递,此时在下游客户侧单板的输出口会上报G-AIS告警。目前只有具有外购FRAMER芯片的CD2、CQ2、CO2单板实现了此功能。
4.5后向缺陷指示BDI告警:
BDI告警是实际工程中最常见的告警之一,它的出现意味着反方向业务有失效的情况。遇到BDI告警说明了两点:一,本方向业务是好的;二,反方向业务失效了。举个例子,有三个站点A、B、C,之间接有双向业务。若A点上报了BDI告警,则查看下游节点B,发现B点也上报了BDI告警,则继续向下游找,直到找到不上报BDI告警的节点C,说明节点C接收到了失效的业务并回插了BDI,此时应该由节点C开始向上游查找业务失效点。
OUT BDI插入条件:光层LOS、OUT层LOF、LOM、TTI失配、AIS、
ODU BDI插入条件: OTUT层LOF、LOM、TTI失配、AIS、ODU层LOFLOM、AIS、OCI、LCK
4.6背板层信号帧丢失/复帧丢失告警:
该告警是M820V2.5设备中新增的告警。在M820V2.5设备中一共有两个交叉板CSUB,分别放在7槽位和8槽位。如果业务板有背板层状态帧丢失告警上报,说明有交叉板不在位或者失效的情况,此时查看该告警上报的检测端口,如果是背板总线状态接收端口1上报的,则说明是7槽位CSUB单板有问题;如果是背板总线状态接收端口2上报的,则说明是8槽位CSUB单板有问题。
8300有4块交叉板,采用2:2保护,对业务板来讲,背板端口1~4分别对应8~11槽位的交叉板,这四块交叉板中只要有两块交叉板工作正常,系统就可以正常工作。对于820和8200这样的1:1保护系统来讲,只要有一块交叉板有效,业务就正常;对于8300这样的2:2保护系统来讲,只要有2块交叉板有效,业务就正常。
8200子架只要有1个交叉板正常运行就可以正常工作;8300子架只要有2个交叉板正常运行就可以正常工作;8500子架只要有4个交叉板正常运行就可以正常工作;
如果交叉板的数目少于以上的1/2/4个,则业务板背板总线状态端口上报背板层信号帧丢失告警,表示缺少足够的交叉板,而此时业务必定无法正常运行。当业务板上报该告警时,要检查交叉板数目是否正确及交叉板是否正常运行。
4.7多点连接时各点上报的告警:
4.7.1情况一:
没有上业务,双向,没有配置交叉,线路侧光纤连接,
CH1:
客户侧输入端口:信号丢失、输入无光
客户侧输出端口:服务层信号失效
调度发送端口:ODU OCI告警
LO2:
调度发送端口: ODU OCI告警
调度接收端口: ODU OCI告警
线路侧发送端口:无告警
线路侧接收端口:无告警
4.7.2情况二:
没有上业务,双向,配置交叉,线路侧光纤连接
CH1:
客户侧输入端口:信号丢失、输入无光
客户侧输出端口:GFP客户信号失效
LO2:
无告警
4.7.3情况三:
CH1接入业务,双向,配置交叉,线路侧光纤连接
CH1:无告警
LO2:无告警
补充说明:
没有配置交叉时单板上报ODU OCI告警,LO2和CH1在调度发送端口(背板向光口方向)有检测点用于计算是否产生OCI,目前此告警比较可信,一旦出现该告警可以认定是没有配置交叉。LO2比CH1特别之处是LO2在调度接收端口(光口向背板方向)有检测点,可以读取维护信号OCI开销,用以检测上游有没有配置交叉;
5常见故障的举例定位
5.1服务层信号失效SSF告警:
遇到该告警时,最重要的一点就是搞清楚上报该告警端口的服务层是哪一层,然后就可以比较容易的找出故障点。
情况一:线路侧单板的ODUK调度接收端口上报SSF
以LD2为例,一般情况下,LD2调度接收端口所检测的是ODUk层,因此,其服务层是OTU2层,上报SSF也就意味着光口接收方向业务失效,此时线路侧接收光口多数会有失效告警(如:LOS、LOM、LOF、OUT-AIS等)。
情况二:客户侧或线路侧单板的ODUk调度发送口上报SSF
以M8x00的线路单板LO2为例,一般情况下,LO2调度发送口所检测的是ODUk层,而调度发送口的ODUk业务是从背板过来的,因此,背板帧信号可以看成ODUk的服务层,上报SSF意味着背板帧信号失效,此时多数情况是由于交叉板出现故障。
情况三:客户侧单板的OAC输出光口上报SSF
以COMB单板为例,其OAC侧的输出光口检测的是客户信号(如SDH或以太网业务),其服务层可以认为是ODUk层,上报SSF意味着上游发过来的ODUk层已经失效,多数情况下其相应的ODUk调度发送口会有告警上报(如:ODU-AIS、ODU-OCI等),此时故障点应继续向上游寻找。
5.2GFP客户信号失效与GFP同步丢失:
以M8x00设备中CH1单板接入GE业务为例,说明遇到这两种告警的定位情况(COMB单板情况类似)。
上图是上报GFP客户侧信号失效的情况。如果CH1单板客户侧输出光口上报该告警,则说明上游对应的客户侧信号失效,一般为没有正确接入业务,但整个波分设备是好的。
GFP同步丢失告警的产生在M820V2.4和M820V2.5设备中的处理是不一样的(M8x00设备与M820V2.5设备处理方法是一致的)。在M820V2.4中,当上游客户侧单板DSAC到下游DSAC中间路径出现故障,则下游DSAC客户侧输出光口就会上报GFP同步丢失。但在M820V2.5设备中,该情况则是上报服务层信号失效。在M820V2.5设备中,如果COMB上报了GFP同步丢失告警,一般意味着上游出现了业务接错的现象,即很有可能是将STM-16业务或者白光交叉给GE端口上。
5.3ODU-LOFLOM告警:
该告警的出现意味着ODU的帧定位字节或者复帧定位字节错误或丢失。常见的情况是业务板的调度发送端口上报该告警,这主要是由于采用时隙交叉后,ODU帧需要在业务板进行交织与解交织,重新组装ODU帧,此时如果没有对齐帧头就会出现ODU-LOFLOM的情况。因此,该告警一般不应该出现,一旦出现该告警则说明单板板内部FPGA处理有问题或者背板针损坏,可以尝试IC复位一下交叉板或者出现该告警的业务板,或许该告警会消失,但问题并没有得到根本解决。
5.4单板上报OCI告警
没有配置交叉时单板对应的调度端口上报OCI告警,上游的OCI告警可以透传到下游站点,根据OCI告警上报的端口,判断交叉配置情况,如下图所示。
从背板到光口方向没有配置交叉时,业务板调度发送端口上报OCI告警;
A站点从CH1到LO2方向没有配置交叉时,A站点LO2调度发送端口及B站点LO2调度接收端口同时上报OCI告警。
5.5交叉板上报时钟不可用告警
没有插时钟板时或者时钟板有问题,交叉板上报时钟不可用告警。
5.6单板不响应网管的操作
查看CPU占用率是否达到100%,方法为telnet到单板,每隔1分钟单板会自动打印CPU占用率情况,KSH>CPU Use rate = 61%(latest 60s), 61%(latest 300s),单板正常运行过程中CPU占用率在100%以下,如果达到100%表示单板App跑死,有些特殊情况下会造成App跑死,解决方法为硬复位或掉电再上电复位单板。
5.7单板上报板不在位
1、看是否可以ping通单板及其他槽位正常的单板,如果只有本板ping不通,那么问题锁定在本板上,参考5.6查看是否单板跑死,看面板灯是否正常,尝试重新烧程序、复位或更换备板;
2、如果所有业务板都ping不通,则问题在CCP单板上,看是否可以ping通CCP板,如果ping不通CCP板,说明系统环境有问题,检查SNP板及网管是否可以管上,如果环境没有问题,那么问题锁定在CCP单板上,尝试复位CCP板或更换单板。(定位CCP板问题时注意8500中的CCP的级联顺序)