长期从事IT工作的人会发现很多网络问题,其中一些问题很容易诊断和纠正,但有些问题很难弄明白。如果遇到这些问题时能够通过一些简单的步骤来排除网络故障,以收集信息并缩小问题的范围。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(1)

结合理论和实际工作经验可以分为三种方法:分层诊断、分段诊断和“望闻问切”仿中医诊断。这三种方法综合使用基本能排除所有的网络故障问题,构成了一个立体网络故障诊断模型。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(2)

一、分层诊断网络故障

就TCP/IP协议而言网络包括物理层、链路层、网络层、传输层、应用层五层。分层诊断从物理层开始,逐层向上检查,直到应用层。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(3)

1、物理层故障主要在线缆方面是否存在不连通、衰减等问题;

2、链路层故障主要在数据帧丢帧错发问题,还有流量控制等问题;

3、网络层故障主要在路由协议是否加载或者路由设置错误,还有IP地址、子网掩码和网关等设置错误等问题;

二、分段诊断网络故障

分段诊断就是对网络源端到目的端所经过网络路径及网络设备进行分段处理,将网络故障定位到某一段的设备或相应的连接线缆及附件上。这种诊断又细分为迭代诊断和子网分段。

1、迭代分段是从源端开始,检查源端到网络中某一节点是否工作正常,如没问题,再检查源端到更远一个节点是否工作正常,以此类推,直到找到故障节点所在。

2、子网分段是用在不同的子网互联时诊断网络故障的方法。例如,有一种故障是两个子网连接在一起就有问题,断开其中一个子网就又正常了。是不是想到了VLAN,对!有时候trunk模式设置出问题就会出现这个情况。

三、“望闻问切”仿中医诊断网络故障

中医治疗疾病时候,讲究“望闻问切”。在网络出现故障的时候,这种方法同样非常适用。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(4)

1、望

望就是看、观察的意思。网络故障排除中,我们也要先通过查看PC机和路由器的初始化信息,网络设备的指示灯信息和操作系统或应用软件运行速度,以达到网络故障诊断和网络维护的目的。

设备指示灯是了解硬件是否处于正常工作阶段。如网卡、交换机、光猫、路由器等面板上的LED指示灯。通常情况下,绿灯表示连接正常,红灯表示连接故障,不亮表示无连接或线路不通。还有根据数据流量的大小,指示灯会时快时慢的闪烁。这些都是我们判断网络是否故障的重要依据。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(5)

2、闻

闻不单单是闻气味,也包含听声音。计算机和网络设备正常工作时,风扇和磁盘读取数据发出来的声音都是有规律的,如果出现异常声响,就要采取紧急措施,如关闭电源等。正常工作的机房或者机箱是不会有异味的,如果有闻到塑料的焦糊味,往往是电源或者芯片出问题了。现在的网络设备质量上基本没啥问题,但也不排除出现这种故障的可能性。KB小网管所管理其中一机房的一台H3C S3600交换机就出现风扇故障。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(6)

3、问

问就是网络故障时,应该向故障单位网管或者当事人询问以下问题:

a、故障什么时候出现?

b、故障表现是什么,如连续故障,还是间断故障。

c、故障发生的时候,操作者正在对计算机进行什么操作?

d、网络结构有没有发生了什么变化?比如新增路由器、交换机,以及网络配置更改。

e、网络用户组发生变化了吗?如由于工作关系一组用户变为另一组用户。域控环境。

4、切

切在中医上就是把把脉,用手敲两下,基本上就能确定下来什么病。同理网络故障诊断的时候,借助网络故障诊断工具找到故障所在地方。如测线仪、第三方抓包软件以及Windows自带网络命令工具等等。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(7)

第1步:检查网络配置

网络故障排除过程可以通过验证你所了解的主机来实现。方法是在两台主机上运行IPCONFIG命令,以确保它们使用的IP地址都在预期范围内。虽然操作很基本,但是运行IPCONFIG命令会暴露出问题根源。例如,一个系统如果没有接收到IP地址,可能是因为DHCP范围已经耗尽。

单独运行IPCONFIG命令可以显示分配给每个网络适配器的IP地址、子网掩码和默认网关。如果这些值没有问题,那么可以更进一步,运行IPCONFIG /ALL命令,这个操作会显示每个网络适配器的DNS服务器分配,验证系统是否使用预期的DNS服务器非常重要。

第2步:测试名称解析

验证了源主机和目标主机的IP地址配置,可以验证名称解析是否正常工作,测试DNS名称解析有各种不同的工具,但是最简单的方法是输入NSLOOKUP命令,然后输入另一个主机的完全限定域名。

NSLOOKUP命令可以显示正在使用的DNS服务器,并告诉您该DNS服务器是否对指定主机具有权威性。

从NSLOOKUP收到结果后,请检查以确保结果符合预期。DNS服务器的IP地址应与主机的网络适配器配置使用的DNS服务器的IP地址匹配。同样,名称解析的地址应与已分配给远程主机(或远程主机上运行的服务)的IP地址匹配。

网络不稳定慢老是掉线是什么原因(到底哪里出问题了)(8)

第3步:验证网络路径

如果您的检查到目前为止没问题并且已产生预期结果,则该过程的下一步是验证远程主机的网络路径。最简单的方法是输入Tracert命令,然后输入远程主机的完全限定域名。Tracert命令将显示数据包在路由到远程主机时所采用的路由。

如果某些跃点被报告为“请求超时”,无需太担心,因为这只意味着主机配置为不响应ICMP消息。重要的是确保Tracert不会显示目的地无法到达(有时用!H指示符表示)。目标主机不可达消息表示没有到目的地的路由或者IP地址无法解析为L2地址。

第4步:测试远程主机的响应能力

故障排除过程的下一步是测试是否可以与远程主机通信。有一次可能只是意味着ping远程主机。不幸的是,主机通常配置为不响应ping请求,因此这个测试可能并不可行。

在这种情况下需要进行某种测试,看看是否可以让主机响应。毕竟,响应验证两个主机之间是否存在连接以及远程主机是否仍然在线。

可以使用的响应性测试的类型根据远程主机的配置有很大的不同。如果不能使用ping命令,也可以通过建立远程PowerShell会话来验证远程主机的响应能力。

第5步:测试远程服务

如果已经确认本地和远程主机配置正确,并且名称解析和基本连接在两个方向上都正常工作,则问题很可能存在于网络堆栈的更高级别。例如,如果目标主机是Web服务器,则即使基本通信测试成功,系统服务也已停止或者存在权限问题。这时就需要测试远程主机提供的任何服务。

需要注意的是,有时服务可能会受到较低级别依赖项的不利影响。例如,笔者曾经在Exchange Server上遇到过一些严重的通信问题,经过详尽的故障排除工作后,最终将问题追溯到系统的时间错误设置。

,