链路就是从一个节点到相邻节点的一段物理线路,而中间没有任何其他的交换节点。以下就是主用链路故障时没有实现50ms切换的故障解决步骤: 2 Q; l6 g# Z% |9 \
网络环境 ' f4 h7 l( P9 m3 j0 `- a
路由器故障:主用链路故障时没有实现50ms切换
7 U3 ]3 ?" O4 _( U \2 v AR1-CR1、AR2-CR2、AR1-AR2以及CR1-CR2运行IS-IS Level-2。 / j3 s) Q) S, V1 Q1 B2 o
软交换MSC Server通过lanswitch连接至CR1和CR2,MGW通过lanswitch连接至AR1和AR2。MGW主用链路为AR1-CR1,AR1和CR1之间链路上设置APDP remote,并分别配置nexthop指向AR2和CR2。
8 B' b/ O6 ]6 d0 W% k* C 通过使用APDP和强制下一跳技术来实现AR1-CR1链路故障时50ms内快速切换至AR2-CR2,保证NGN业务不中断。测试时发现AR1-CR1链路中断时需要1-2分钟才能切换至AR2-CR2。
! |5 @: J! }1 L$ B, Z7 c 故障分析 1 I/ l4 [0 y9 x6 ]# k8 Z5 C; f
步骤 1 检查AR1-AR2,CR1-CR2两条链路,通信正常。 " l0 E( [ T1 J. g# e
步骤 2 AR1-CR1之间链路故障后恢复AR1-CR1链路,待路由重新稳定后,检查AR2上到MSC Server的路由,下一跳为CR2,正确。
0 b. x9 _- _% W" ^; O% s 步骤 3 AR1-AR2,CR1-CR2链路正常,AR1-CR1之间链路故障后通过强制下一跳到AR2和CR2的转发也没问题,所以故障也不是出在此处。
' ?( y( F8 c# z) o 步骤 4 鉴于以上分析,且四台路由器都运行在IS-IS Level-2层,判断问题应该出在AR2-CR2之间的路由学习上。可能的原因为AR2上没有到MSC Server的路由,或者CR2上没有到MGW的路由。
% {- m6 X- ~) S9 ?6 W( }5 w 步骤 5 检查CR2上到MGW的路由,发现下一跳不是AR2,而是CR1,说明问题就出在此处。
~- q0 ]/ O7 X) u 处理步骤 4 {6 e! i8 i$ ^: [
步骤 1 检查链路的IS-IS开销值,链路开销分别为, 7 [, |5 v( c: K6 ^: k# x: V ]2 ~& ?
AR1-AR2开销为150,CR1-CR2开销为50,AR1-CR1开销为100,AR2-CR2开销为200。 8 E M+ _2 ], j4 [) J# x
而(AR2-CR2)开销值200大于(AR1-CR1)与(CR1-CR2)的链路开销总和150,所以CR2上到MGW的路由优选开销值小的,因此CR2上到MGW的路由下一跳为CR1。
@+ _" `$ G7 P# u. |# n 步骤 2 执行命令isis cost将AR2-CR2之间的链路开销值改为100。
+ e! ^+ I B9 T5 A5 ^# a( o& b 步骤 3 再检查CR2上到MGW的路由下一跳,已经变为AR2。 6 d/ F7 f+ H9 P, v3 i+ p2 d
步骤 4 此时再将AR1-CR1断开,发现业务在50ms内切换至AR2-CR2之间的链路而不中断,故障排除。 / e0 i. B/ C% w1 M
案例总结 NGN承载网时通常使用两个平面,在主用平面接口上使用APDP和强制下一跳技术,可以实现主用平面链路故障时ms级切换至备用平面。但在两平面的IGP规划时,一定要注意平面内部的路由花销要小于经过平面间迂回的路由花销。否则即使倒换至备用平面后也要重新进行路由计算,从而达不到设计要求。 |