原创文章
如引用请注明来源樊胜民工作室(樊胜民创客DIY)
如今是网络飞速发展时代,办公以及各个信息化系统都是建立在网络技术基础之上,对网络不仅仅在速度上、稳定性以及可靠性都提出了更高的要求。作为一名合格的网络工程师,需要全面掌握网络数通交换方面的技能,同时还需精通网络安全方面技能,及时加强企业出口防火墙安全策略配置等工作,保障企业内网安全高效运行。企业发展只能对网络依赖越来越高,要求运维人员知识储备丰富,在故障出现时,能按照故障现象,快速定位及时解决。
熟练掌握数通技能,以及常见网络协议与网络架构。
网络运维最基本的要求是保障网络畅通以及网络安全。实现网络互通,尤其是跨设备之间网络互通,就需要配置静态路由(Static)或者动态路由协议(比较经典的就是ospf)。为了实现网络的“健壮性”、或者说“可靠性”,一般采用设备堆叠(比如华三的irf堆叠协议),为了避免出口网关单设备运行风险,采用两台以上设备配置vrrp虚拟网关冗余协议;考虑单链路在网络规划中的风险性,建议链路冗余,一般采用聚合技术,或者交换机开启生成树协议(防止二层网络环路重要协议-stp)。企业中内网中成百上千的ip地址,如何访问互联网,就需要在边界路由器或者防火墙上配置NAT转换技术,实现公司内网访问互联网。在中大型企业中,一般配置有DHCP服务器,也可以在网络设备中配置DHCP,实现公司内网IP地址自动获取,避免人为分配IP地址,可能疏忽导致IP地址冲突而带来的烦劳。近几年无线终端普及速度迅猛,无线覆盖越来越受宠,如何规划无线网络也是运维人员必须掌握的技能。网络设备远程管理配置telnet/ssh协议,是网络运维基础,在日常网络运维中,检查交换机以及其他网络设备都是远程登录到设备进行,而不是直接到现场处理。
熟练掌握设备配置命令,最简单的办法就是在eNSP、HCL,搭建各种实验环境,绘制拓扑图,按规划在模拟器中设备配置命令实现预期功能,这是最基本也是最有效的方法。
如图1,是典型的三层网络架构(前面提到的各种网络协议要在这里就要大显身手):接入层-汇聚层-核心层。网络中直接与终端连接(比如PC/摄像头等)的交换机称为接入层交换机,接入层就是允许终端设备连接到网络,接入层交换机一般端口比较多,是它的特点。位于接入层和核心层之间的部分称为汇聚层,汇聚层是多台接入层交换机的网络汇聚点,它的性能必须能够及时处理自接接入层设备的转发流量,并具备提供到核心层的上行链路,一般情况下企业网络中,网关部署在汇聚层,也可以部署在核心层,根据实际情况而定。核心层的主要目的高速转发数据流量,具备高的可靠能和数据吞吐量,是企业网络中的“首脑”,一般千兆乃至万兆交换机。
图1 网络三层架构
附:某办公楼6楼办公室网络不稳定分析,排查过程。(深入剖析故障根源)
步骤1、检查办公楼leaf(汇聚)交换机下行接口光强度情况。发现leaf-port 2/0/9, RX接收光强度偏离正常值,Rx -26.20 db ,如图2,正常值范围: -3.00~-22.08db。
图2 光强度检查
步骤2、根据经验,光衰大一般情况是交换机连接的尾纤故障导致,更换尾纤后。RX接收光强度变为-6.82db,符合正常值,如图3。但是故障依旧,还是报修不稳定。
图3 光强度检查
步骤3、继续检查leaf(汇聚交换机)连接的所有接入层交换机。
通过命令“dis stp brief”发现其中一台交换机,port 1/0/11显示 DISCARDING。
“DISCARDING”属于端口阻塞,说明这台交换机连接的网络存在环路。继续观察,该接口状态不定期在“DISCARDING(阻塞)”与“FORWARDING(转发)”交替变化,这就是故障原因,当接口堵塞的时候,port 1/0/11 连接的下行网路中断。如图4。
图4 port 1/0/11显示 DISCARDING
步骤4、继续排查发现其中一个办公室网络链路连接异常,如图5。
图5 网络环路
L1蓝色网线正常情况下与信息面板连接,另一端与PC5连接。由于PC5电脑移走后,不清楚谁不小心将L1这条网线一端连接信息面板,另一端链接到SW2的交换机,这样,如图5,就构成了环路,拆掉L1网线,故障排除。注意:SW1\SW2都是办公室自行配置的8口非管控交换机。
原因找到这儿,那又是什么原因导致的不稳定?
步骤5、继续检查
将L1的这条网线,用测试仪测试,并不断晃动网线,发现网线线序3,时断时续。到此故障原因彻底明白了,当这条网线线序3正常连接的时候,构成环路,port 1/0/11就处于阻塞状态,sw2交换机连接的终端无网络;当网线线序3断开的时候,环路破除,port 1/0/11就处于转发状态,sw2 连接的终端网络正常。RJ-45各脚功能,如表1。
1 |
传输数据正极 Tx |
5 |
备用 |
2 |
传输数据负极 Tx- |
6 |
接收数据负极 Rx- |
3 |
接收数据正极 Rx |
7 |
备用 |
4 |
备用 |
8 |
备用 |
表1 RJ-45各脚功能
善于使用ping、tracert、ipconfig、arp、nslookup命令,以及Wireshark抓包等软件排除故障。
在日常运维中,ping以及tracert两个命令使用非常多,ping命令用来检查网络是否通畅,tracert命令用于跟踪路由信息,可以查出数据从本地到目标主机经过的路径。Wireshark抓包软件,通过抓取不同位置报文,分析故障,在工作中经常使用。继续分享工作中运维“琐事”。
前几天,同事联系我说,公司与华为云之间有个网段不通,其他网段数据正常,公司与华为云之间是通过ipsec-vpn实现数据互通,有网络正常网段的,说明公司与华为之间隧道正常。通过“tracert”追踪路由信息。如图6是公司与华为云之间建立隧道,业务正常网段路由追踪信息。图7是公司与华为云之间建立隧道,业务不正常网段路由追踪信息,发现路由追踪一直在核心交换机(IP:172.99.0.14)与防火墙(IP:172.99.0.13)之间来回切换,路由无法追踪到vpn设备,初步判断应该是路由问题,在防火墙中检查路由信息,仔细排查发现问题所在,缺少路由信息,新增如下路由信息故障排除, 路由追踪信息正常如图8。
ip route-static 10.10.1.0 24 172.99.0.94
图6 “tracert”追踪路由信息
图7 “tracert”追踪路由信息
图8 “tracert”追踪路由信息
网络丢包是运维中比较棘手问题,硬件故障、配置问题都有可能引起,比如网路环路、IP地址冲突等等都能引起丢包现象。在写这个稿子前,刚好处理一个丢包故障,我整理出来分享给大家,在处理故障时思路非常重要。
故障起因,安防系统在视频回放的时候卡顿严重,通过ping 视频存储磁盘阵列(共计4台)IP地址有丢包现象,与在磁盘阵列同一个交换机上通过网线连接上PC,配置与磁盘阵列同网段地址,PC-ping -磁盘阵列不丢包。故障初步判断在上联链路,检查汇聚交换机,发现与安防交换机连接的接口数据流量非常大,通过在交换机上配置聚合技术,解决由于数据流量大导致处理不及时而丢包故障,如图9,采用4条链路聚合。
图9 链路聚合
网络运维人员,应该具备善于总结经验,在出现故障时能熟练掌握处理问题的方法与思路,不断学习新的网路架构,比如SDN等新技术,同时具备编写网络规划方案的能力。
,