企业网络管理,很大方面是关于对网络互通性的维护与管理。平时注重对网络的维护,当遇到网络连通问题时采取合理的办法,快速而准确的解决,是企业网络管理员的一项必备技能。本文即是对较为常见的一些网络故障作分析与解决介绍。 一、广播风暴的成因、预防% F+ t: o( d$ y. E5 j/ H2 O6 j
广播风暴指过多的广播包消耗了大量的网络带宽,导致正常的数据包无法正常在网络中传送,通常指一个广播包引起了多个的响应,而每个响应又引起了多个得响应,就像滚雪球一样,把网络的所有带宽都消耗殆尽。该现象通常是由于网络环路、故障网卡、病毒等引起。
3 C+ k7 O+ }2 Q3 W0 u5 u! U 下面就来看看此类现象的预防与故障排除过程。& X" y" f8 ] s* G) f
1.预防(以CISCO catalyst switch为例)
Q- y2 j+ w- Q- Q" ?8 x6 S 具体步骤可从如下方面进行:: c. A( d2 I; }4 j7 d
(1)首先使用网管分析你网络的baseline,这样可以明确你的网络当中正常情况下的广播包比例是多少。: c6 ?+ `4 T5 Y1 s7 `/ n
(2)目前绝大多数交换机都支持广播风暴抑制特性,配置了这个特性以后,你可以控制每个端口的广播包维持在特定的比例之下,这样可以保留带宽给必须的应用。
; F: H( _2 p" D6 o; h/ J8 m# v 配置举例:(以CISCO catalyst switch为例)
- k- ~4 e$ Z; w1 s Int XX. `# Y/ g% t0 }
storm-control broadcast level 20.00
4 X4 U4 z* O% I- X* d1 J2 U+ V$ } switch#sh storm5 m8 f0 _! O2 f4 x0 A0 p
Interface Filter State Level Current6 F' T( |+ k1 n \0 b: B8 t
--------- ------------- ------- -------
7 }% F3 T% R# f7 n% d2 s$ a; [ Fa1/0/1 Forwarding 20.00% 0.00%
$ ^% o$ K# X( Y" I5 M' F (3)针对缺省STP配置无法排除的网络环路问题,利用STP的BPDUguard特性来预防广播风暴。此种环路情况示意如下:4 J3 D7 u; z8 h8 K5 u
switch------hub(portA---portB)" `$ R% L% m. C) I
Switch启用了STP,而hub则被人有意无意的用一根网线联起来,导致引起了环路。SWITCH的端口不会收到其他交换机或本交换机其他端口的BPDU,不会触发该端口的STP决策过程,也就不可能blocking该端口,这样就会引起广播风暴。我们可以利用CISCO STP的BPDUguard 特性来预防这一点。. B# `7 Z! s+ |* o; r6 T
int xxx) x a9 l0 T5 O3 P7 R6 q# O; v A
spanning-tree bpduguard enable
+ r) h* T! [6 H 值得注意的是bpduguard可以在全局下配置,也可以在每端口的基础上配置。如果在全局下配置,则只对配置了portfast的端口起作用,如果在端口下配置,则不用配置portfast。 2.广播风暴排障(以CISCO catalyst switch为例)
+ _% E# m) M( b 如果网络中已经产生了网络风暴(现象通常为网络丢包、响应迟缓、时断时通等),则可以利用如下的方法来排障:
9 e' H* ]+ i+ f9 x1 | (1)首先确认是否是网络风暴或其他异常流量引起的网络异常,在核心交换机上配置如下:% \4 V% Q6 L3 a$ c$ R
Switch>sh proc cpu | e 0.001 e3 Q0 d! U7 D" q5 j6 c- L4 T
CPU utilization for five seconds: 19%/0%; one minute: 19%; five
5 p6 F# N& e9 M6 c' K2 p" u minutes: 19%
, Q9 y+ ^8 O" L: j& J0 J; Y! V PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process$ E: l M4 A7 A+ u# s0 V
15 20170516 76615501 263 0.31% 0.13% 0.12% 0 ARP Input
/ J2 v4 S! G6 U* H/ B! w 26 7383266801839439482 401 5.03% 4.70% 5.08% 0 Cat4k Mgmt HiPri
! Z7 g S& I3 O" ?& L/ V: g 27 8870781921122570949 790 5.67% 7.50% 6.81% 0 Cat4k Mgmt LoPri ?) a' j. G: M1 f8 d( U: g
43 730060152 341404109 2138 6.15% 5.29% 5.28% 0 Spanning Tree
0 a. `1 S6 y% W( d+ S: q6 L 50 59141788 401057972 147 0.47% 0.37% 0.39% 0 IP Input, a5 X3 } t/ N$ K
56 2832760 3795155 746 0.07% 0.03% 0.01% 0 Adj Manager1 V/ _, l; {7 a
58 4525900 28130423 160 0.31% 0.25% 0.18% 0 CEF process+ q1 A$ Q$ o; e7 z) x
96 20789148 344043382 60 0.23% 0.09% 0.08% 0 Standby (HSRP)
2 f& N9 y5 c: R+ i, W6 \# z5 g 如果交换机的CPU利用率较高,且大部分的资源都被“IP Input”进程占用,则基本可以确定网络中有大流量的数据。( t' S: z, h0 F+ Z5 h% Q4 M
(2)查找异常流量是从交换机的哪一个端口来,配置如下:& F/ @, [% }* [5 e1 u# O
switch #sh int | i protocol|rate|broadcasts8 t) O8 y8 B q9 ^* r
FastEthernet1/0/1 is up, line protocol is up (connected)1 g4 Q9 Y# r' T! k! L
Queueing strategy: fifo7 M. T. k& {6 H& H' A6 @9 s6 ]
5 minute input rate 0 bits/sec, 0 packets/sec
: F; T* {' g. d: ?6 O 5 minute output rate 2000 bits/sec, 3 packets/sec3 Z2 K! [4 a L8 n7 j
Received 241676 broadcasts (0 multicast): X9 ^; Z6 B: _5 u* T- _8 p6 [
如果找到一个端口的input rate非常高,且接收到的广播包也非常多,则基本可以找到来源,如果该端口下联的也是可管理的交换机,则再次执行此过程,直到找到一个连接PC或者交换机的端口为止。& K" w4 P2 s7 z f! _, G% ]/ @2 I
(3)shutdown该端口5 l- f: I5 r+ ?# ]
int xx
6 Q' Q+ h5 E1 Z- A: g shutdown
/ f6 \) J' k& y4 q* _* d (4)查找产生异常流量的根源
0 g& [0 l! Y! d4 [# ^, t& A 如果是交换机环路,则拆掉环;如果是病毒,则做杀毒处理;如果是网卡异常,则更换网卡。此部分不详述。
( R5 t% R- j$ r7 q1 G
. C5 K4 E1 N# M4 a (5)确认交换机的CEF功能是否启用,如果没有,则需要启用,可以加速流量的转发,配置命令如下:# K% [3 D7 T% g' a) p. Z
switch>sh ip cef: ^- \9 t4 w$ o' [
配置CEF时,只需在全局模式下输入ip cef即可。 |