企业网络管理,很大方面是关于对网络互通性的维护与管理。平时注重对网络的维护,当遇到网络连通问题时采取合理的办法,快速而准确的解决,是企业网络管理员的一项必备技能。本文即是对较为常见的一些网络故障作分析与解决介绍。
/ R7 M0 M/ K: Y8 p! t 一、广播风暴的成因、预防: l3 h* H' Y* d
广播风暴指过多的广播包消耗了大量的网络带宽,导致正常的数据包无法正常在网络中传送,通常指一个广播包引起了多个的响应,而每个响应又引起了多个得响应,就像滚雪球一样,把网络的所有带宽都消耗殆尽。该现象通常是由于网络环路、故障网卡、病毒等引起。
( q! K5 U& l6 v- Y4 j& w 下面就来看看此类现象的预防与故障排除过程。
0 A' u& {0 e: ^* S- j" r' g 1.预防(以CISCO catalyst switch为例)' Y2 H- ^1 M: Z) }9 b
具体步骤可从如下方面进行:
& [ }$ H5 e/ g: Q' Q3 o (1)首先使用网管分析你网络的baseline,这样可以明确你的网络当中正常情况下的广播包比例是多少。
8 ?1 o$ [2 _$ i- C, x' G6 p (2)目前绝大多数交换机都支持广播风暴抑制特性,配置了这个特性以后,你可以控制每个端口的广播包维持在特定的比例之下,这样可以保留带宽给必须的应用。" V- Y+ K7 l& _, p q- K- l# H6 _
配置举例:(以CISCO catalyst switch为例)
+ B* V" W. {5 d {5 Q- U Int XX; F' j9 a' x5 R9 Q! y0 @
storm-control broadcast level 20.00
1 n5 p K% ^4 p, y: K switch#sh storm
3 S' a6 `: l+ t! n ]7 n( s Interface Filter State Level Current- S/ R" A' y9 O0 W+ z
--------- ------------- ------- -------( }+ _" _$ @/ }, f, B5 l
Fa1/0/1 Forwarding 20.00% 0.00%$ E/ y% [% R6 H; j) i) b6 Q
(3)针对缺省STP配置无法排除的网络环路问题,利用STP的BPDUguard特性来预防广播风暴。此种环路情况示意如下:
/ y8 \2 [0 \ B9 U switch------hub(portA---portB)
" _% f) h. y) ?% B Switch启用了STP,而hub则被人有意无意的用一根网线联起来,导致引起了环路。SWITCH的端口不会收到其他交换机或本交换机其他端口的BPDU,不会触发该端口的STP决策过程,也就不可能blocking该端口,这样就会引起广播风暴。我们可以利用CISCO STP的BPDUguard 特性来预防这一点。8 [1 J! w1 u2 a" _# A5 @% y2 [# V& [
int xxx" |3 q# b6 s5 t9 ]. T
spanning-tree bpduguard enable
% b2 ?3 @4 \$ A, W" O! y, I 值得注意的是bpduguard可以在全局下配置,也可以在每端口的基础上配置。如果在全局下配置,则只对配置了portfast的端口起作用,如果在端口下配置,则不用配置portfast。 2.广播风暴排障(以CISCO catalyst switch为例)7 n: |5 u4 N- O" }, }: w) g
如果网络中已经产生了网络风暴(现象通常为网络丢包、响应迟缓、时断时通等),则可以利用如下的方法来排障:
; E9 i8 B. B# |, E. M/ s (1)首先确认是否是网络风暴或其他异常流量引起的网络异常,在核心交换机上配置如下:
1 a6 o) S/ N2 ^3 s4 h" R Switch>sh proc cpu | e 0.00" f3 V, U% |: s/ j* v! C' B. @0 O
CPU utilization for five seconds: 19%/0%; one minute: 19%; five
- G% e+ `% u7 T minutes: 19%
4 E* }+ q) f) |' h& w1 ] PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process
. P$ E9 _6 O) {4 c8 e 15 20170516 76615501 263 0.31% 0.13% 0.12% 0 ARP Input
8 P4 w! R6 R, _; R 26 7383266801839439482 401 5.03% 4.70% 5.08% 0 Cat4k Mgmt HiPri) L- W. l) S( b, J8 I/ n# M; e
27 8870781921122570949 790 5.67% 7.50% 6.81% 0 Cat4k Mgmt LoPri7 _( Z% r- f9 g/ W7 r
43 730060152 341404109 2138 6.15% 5.29% 5.28% 0 Spanning Tree
/ k# U4 E, w, f0 O8 ]$ y- @ 50 59141788 401057972 147 0.47% 0.37% 0.39% 0 IP Input
0 i- j/ F6 f2 E5 c1 o) P ]2 c8 L 56 2832760 3795155 746 0.07% 0.03% 0.01% 0 Adj Manager( G! M2 A9 }' l; @( S9 H* a/ Q+ }
58 4525900 28130423 160 0.31% 0.25% 0.18% 0 CEF process
2 @7 ]4 G' p) W0 M. Y' o9 Q' s 96 20789148 344043382 60 0.23% 0.09% 0.08% 0 Standby (HSRP)+ o# Q9 O2 s4 `) e
如果交换机的CPU利用率较高,且大部分的资源都被“IP Input”进程占用,则基本可以确定网络中有大流量的数据。1 [6 \5 t- m% P' s* }
(2)查找异常流量是从交换机的哪一个端口来,配置如下:
5 @* [+ k- t* D1 s( r2 v5 F switch #sh int | i protocol|rate|broadcasts
* y& F; a; |& \) P7 t+ f FastEthernet1/0/1 is up, line protocol is up (connected)6 U4 ^( b6 p1 I
Queueing strategy: fifo
% `; M' I. y, e* ^ 5 minute input rate 0 bits/sec, 0 packets/sec/ R: Z" {2 [9 e2 I/ s1 q J5 {
5 minute output rate 2000 bits/sec, 3 packets/sec
% f3 p" z, z4 c, ` i9 }/ ] Received 241676 broadcasts (0 multicast)% M2 v% e6 s7 Z |7 ]
如果找到一个端口的input rate非常高,且接收到的广播包也非常多,则基本可以找到来源,如果该端口下联的也是可管理的交换机,则再次执行此过程,直到找到一个连接PC或者交换机的端口为止。" C# I0 C. M2 F: J2 W2 L6 g
(3)shutdown该端口
5 ?% o- O) y; }9 _ int xx
& n7 u) Q' k& j( m$ t shutdown
% G% t/ g- J4 q" e% ?/ j (4)查找产生异常流量的根源* _. t( x J$ Q2 B
如果是交换机环路,则拆掉环;如果是病毒,则做杀毒处理;如果是网卡异常,则更换网卡。此部分不详述。
8 f( m' O8 [* h7 P
! H5 {$ |' v' |- X (5)确认交换机的CEF功能是否启用,如果没有,则需要启用,可以加速流量的转发,配置命令如下:# w. g& R C- S! V
switch>sh ip cef9 Y% n# H& B/ U5 k8 U# F
配置CEF时,只需在全局模式下输入ip cef即可。 |