还剩3页未读,继续阅读
文本内容:
传输网络维护案例分析两纤双向复用段保护环频繁倒换故障分析
1.SDH故障现象描述
1.1某日,干线传输网环三系统频繁发生环倒换,倒换段落在站和站之SDH D E间,复用段环倒换状态正常,业务未受影响告警信息
1.2此系统承载在烽火波分系统上,占用站和站间的17波SDH D E站烽火波分的波板的端口上报告警,华为设备站的D1720TU1RLOF SDH D东向板上报、告警;S16RLOS RLOF站烽火波分的波板的端口上报告警,华为设备站E172OTU2RLOF SDHD的西向板无告警S16环三系统三全环各站的交叉时钟板上报告警,站和站的SDH XCSPS D E SCC板上班告警APSCJNDI承载在站和站间其他波道上的系统无告警D E SDH原因分析
1.3承载在站和站间波分系统上共有个环网系统,目前只有单个环网D E4SDH系统发生环倒换,可以排除站和站间的光缆线路故障和波分系统的光放大盘D E故障,从波分网管和网管上报的告警信息分析,原因可能有以下几种:SDH站设备板发光模块故障或单板其他故障
1.
3.1E SDHS16站波分设备的板收光模块故障或单板其他故障
1.
3.2E2OTU站波分设备单板和设备单板间的尾纤故障或光纤连接
1.
3.3E2OTU SDHS16器故障人为误操作影响或者施工原因
1.
3.4站波分设备的板端口收光模块故障或单板其他故障(与站
1.
3.5D2OTU1E同时发生故障的可能性很小)处理过程
1.4站和站波分设备波的盘的、端口的收发光功率正常;站DE1720TU12E SDH设备的板收发光正常;站设备的板收光功率异常可能是本S16D SDHS16-60dbm,端收光异常或者对端设备发光异常在站的侧测试端口发至设备光功率正常,排除站142D ODF2OTU1SDHD盘故障和至架间的尾纤故障;在侧对站的板加光衰20TU20TU ODFODF DS16进行自环,单板告警消失,收光功率正常可用确定故障点不在站D通过告警信息可判断,站发送至站信号经过的波分单板端口正
1.
4.1DESDH常,所以站端口可以发送接收到站的正常信号,在单板侧E20TU1D SDH20TU用尾纤把端口和端口环回,端口的告警不消失,可以判断站的122RLOF E20TU单板故障在站波分设备侧尾纤加光衰对板环回,单板告警消失,排除144ES16S16S16板故障,进一步证实导致环三系统三发生频繁环倒换的原因是站的SDH E20TU单板故障站的单板故障,所以端口在收光正常的情况下上报并通
1.
4.5E20TU2RLOF,过波分复用把告警下插到对端站单板的端口上,最终导致站RLOF D2OTU1D的光板收不到正确的信号帧,上报告警,引发环倒换SDH RLOS协调维护人员把环三系统三倒换站和站间的备用波道,告警消失,环
1.
4.6DE倒换恢复正常经验总结
1.5通过此次环倒换障碍的处理,使我更加熟悉波分和设备之间的单盘连接SDH关系的信号流承载在系统上的环网障碍比直接承载在光缆系统上DWDM SDH的环网障碍要复杂的多,因为信号要经过波分设备的波长转换、复用解SDH SDH复用、光放大,然后才能到光缆系统上进行传输,这就要求我们必须熟悉各个层面的信号流向,物理端口连接关系和告警的产生机理,只有这样才能通过告警、性能以及排除法、环回法等手段迅速定位故障原因设备网关设置错误导致命令行无法登陆
2.2500+IP网络管理情况介绍
2.1某传输本地网通过华为子网级网管系统进行管理,为实现网络的集中T2000管理,在省公司上一套华为的网络级网管系统,对本地网进行管理,一期T2100工程网管通信通道,通过路由器和网实现,后期更改为专线方式,DCN2M DCN网络通道不再使用某日,本地维护人员发现三个子网的网关网元使用网管可以登录,但无法使用命令行登录,而且网管重起后网管也无法登录,拔掉上对应网元网线复位主HUB控板或是等待分钟后,再将网元网线插上网管才能登陆上,但命令行还是无法10登陆告警信息
2.3命令行反馈信息(连接失败)Connect Failed.Try toreconnect toNE failed!Please wait...Try toreconnect toNE failed!Please wait...Try toreconnect toNE failed!Please wait...原因分析
2.4网管、命令行问题
2.
4.1网元网管连接汇聚用的端口问题
2.
4.2HUB主控板硬件、或是设置问题243通过路由器外界影响
2.
4.4处理过程
2.5试用本地计算机能够通用命令登陆不上的网元,说明网管通信的通
2.
5.1Ping道正常在网管上更换了一个新的命令行软件,命令行仍不能正常登陆将便携
2.
5.2计算机网管直接插到端口上,代替网管计算机,故障状况和网管系统现象一HUB致,命令行仍然无法登陆,并且拔掉网线后需要等待分钟或板复位后网管10SCC才能正常登陆,所以可以排除网管计算机及网管软件和命令行软件的问题在传输网元设备侧将网元设备连接网线拔下,用便携网管登陆网元
2.
5.3HUB设备,网管及命令行均登陆不上将主控复位后或是等待分钟后,便携机网管10及命令行都能够登陆上了,再把网线拔下再连接,命令行和网管系统登陆都正常将所有本地的服务器及客户端计算机连接到的网线拔
2.
5.4T2000T2000HUB下,之后将网元设备与网线正常连接,再将便携机通过网线连接至用HUB HUB,命令行不能登陆网元说明网元只要连接到后就会引起登陆问题HUB对上连接的设备进行排查发现当拔掉上连接至路由器的网
2.
5.5HUB HUB线后,过分钟,命令行登录正常,网管系统登陆正常,把路由器连接至的10HUB网线正常连接后,故障重现,说明命令行登陆的问题和路由器和省公司的网络级网管有关经对抓包分析,发现的计算机每一分钟都会向命令行登陆有问题
2.
5.6HUB网元的端口发出连接请求该地址正是通过路由器连接的省公司网管系统的1400计算机的地址命令行登陆有问题的网元,设置的网关地址为
132.
37.
8.1o查询路由器的配置表发现,目前省网管和本地网管使用的路由器的257R1E0口地址为而网关网元设置的网关地址为」,这个地IP
132.
37.
8.2,IP
132.
37.8址是一期网管通信所使用的路由器的口地址,目前已不再使用所以当R2E0IP集中网管系统尝试对网元连接后,由于网元的网关设置错误,导致网元不能够IP正常给远程的集中网管系统反馈信息、,而远程的网管启动后,就会对这几个网元会不断尝试连接,最终致使网元通信端口数据堵塞,出现用命令行登陆不上的现象将路由器的口地址更改为后,本地网元能够正常与远程网管
2.
5.8R1E0IP通信,解除了堵塞状态,命令行及网管状态正常了,问题解决经验总结
2.6本次故障的主要原因就是网管通信路由和地址更改后,没有更改网管侧和IP网元侧网关地址,所以远程网管系统启动后就会出现网元通信端口数据拥塞的IP现象,导致本地命令行和网管登陆异常的现象在后期的维护工作中要加强工程验收和维护资料及时更新的工作,避免此类问题的再发生。