C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 2551|回复: 0

[交换网技术] AP循环REBOOT 故障处理 [复制链接]

军衔等级:

亚星游戏官网-yaxin222  新兵

注册:2015-6-5
发表于 2015-12-8 20:21:54 |显示全部楼层
故障现象:
    网管不能联机。AP的的两个NODE之间交替REBOOT,最终会导致两节点UNDEFINED状态。
  可能原因:1、数据盘镜像故障   
raidutil -L raid  有数据盘节点状态为Drive  Failed
           2、磁盘空间满导致统计故障         一般有相关的统计告警
           3、。。。。
处理流程如下:
1.        telnet 该网元,在cluster res 起来,但还没有来得及循环reboot时停掉进程控制的cluster res (ACS_PRC_ClusterControl);
   cluster res ACS_PRC_ClusterControl_0  /off  /wait
     cluster res ACS_PRC_ClusterControl_1  /off  /wait

    检查告警 alist
  • 检查cluster res ,找出状态为failed的cluster res
cluster res |findstr -ive online
若没有failed 的cluster res 进行第4步;否则转入第5步;
  • 检查数据盘的镜像。(对应有告警mirrored disks not redudent
raidutil -L raid   如果有Drive  Failed 的镜像盘,则进行重建,一般会持续6小时左右。 若重建失败,则需更换node
  • 对于有failed 状态的cluster res , 先消除相关的告警后,再将对应的res  进行offline、online
   eg: 如果由于R盘或S盘满引起统计进程停止,则先应删除无用的文件,消除硬盘空间告警,在对统计进程进行重启
    不能在不作任何相关处理的情况下,直接将failed状态的cluster res 进行人工online
  • 人工重启进程控制的cluster res
cluster res ACS_PRC_ClusterControl_0  /on  /wait
    cluster res ACS_PRC_ClusterControl_1  /on  /wait
  • 检查系统状态
hostname
prcstate
alist
net state
cluster node
           cluster res |findstr -ive online

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-11-17 01:29 , Processed in 0.124872 second(s), 15 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图