使用交换机组网,已经成为许多网络管理员不二的选择,如此一来交换机的性能将直接影响局域网的整体运行性能。通常来说,二层交换机发生故障的机率不是很大,不过笔者最近遭遇到的一则离奇网络故障就与二层交换机有关,由这种因素引起的故障现象具有较强的隐蔽性,因此笔者在解决此类故障时多走了不少弯路!为了避免各位朋友重走弯路,现在笔者就将该故障的排除过程回放一下,希望能对大家有所启发!
故障现象:二层交换网络不通
单位局域网共有42台计算机,一台文件服务器,其中普通计算机直接通过两台二层交换机与局域网核心交换机相连,而文件服务器直接与核心交换机相连,核心交换机通过自身的路由功能直接与Internet网络保持连接。平时,局域网中的所有计算机都能顺利访问文件服务器,也能很方便地访问Internet网络中的内容。不过,最近不知道什么回事,突然局域网中有一部分计算机访问不到文件服务器中的内容了,不过另外一部分计算机仍然能够正常访问文件服务器中的内容。在故障发生的第一时间,笔者立即赶到局域网中心机房,仔细检查了网络中的一些主要网络设备工作状态,检查之后发现局域网中的某一台二层交换机所有端口信号灯工作状态不正常,原先处于闪烁、点亮状态的信号灯,现在全部处于点亮不闪烁状态了,很显然与该二层交换机保持连接的所有计算机都出现了无法访问网络的故障现象了。
排查过程:交换机发生了硬件损坏性现象?
刚开始,笔者简单地认为这种故障现象肯定是由交换机在长时间运行之后发生缓存溢出错误而引起的,由这种因素引起的故障现象也是时常发生,我们只要切断交换机电源,过一段时间后重新启动一下交换机设备,就能轻松地让交换机的工作状态恢复正常了;依照这样的思路,笔者立即关闭了二层交换机的电源,让该设备“休息”了大约五分钟后,又将其电源接通进行重新启动,等到系统启动稳定后,笔者随意找了一台故障计算机进行了网络访问测试,测试发现先前不能访问的文件服务器,现在变得能访问了。原以为故障就这样被顺利地解决了,可是没有多长时间,先前发生的网络不通故障又“卷土重来”了。
既然重新启动交换机不能解决故障现象,那是不是局域网中存在网络病毒或发生了其他故障了呀?尽管笔者知道单位局域网中,有许多计算机都感染了各式各样的网络病毒,不过这种网络不通故障要真是由网络病毒引起的话,那么局域网中的另外一台型号完全相同的交换机为什么能够正常工作呢?想到这里,笔者估计很可能是故障交换机发生了硬件损坏性现象。
考虑到交换机设备能发生硬件损坏的地方主要是背板部分、模块部分、电源部分、端口部分等,为此笔者打算就对这几个部位进行依次检查。在检查交换机连接端口时,笔者认为交换机端口不可能在某个时刻集体发生“罢工”,要发生损坏的话也只能是其中某一个或几个端口意外被损坏了,而目前的现状是连接到故障交换机中的所有计算机都不能上网,这说明交换机端口发生损坏的可能性很小;对于电源部分,由于故障交换机能够正常接通电源,并且所有信号灯都处于点亮状态,所以笔者估计电源发生损坏的可能也是很小。既然交换机的连接端口以及电源部位不大容易出错,那特别容易出错的地方自然就是交换机的模块部位或背板部件了,当然要是这些部位发生硬件损坏的话,那网络管理员唯一能做的就是重新更换其他正常的交换机设备了。
考虑到单位暂时没有可以替代的交换机能够使用,笔者打算先向单位领导申请购买新的交换机,待新交换机到位后再进行替换。趁一些故障计算机无法访问网络的间隙,笔者准备先对困扰它们的网络病毒进行一次全面的清除操作,以便尽可能地排除潜伏在局域网网络中的各种危险因素。在清除网络病毒期间,笔者的确从局域网中找到不少网络病毒,随意查阅了其中一个网络病毒的详细信息后,笔者看到这种类型的网络病毒能够引起局域网广播风暴现象。
看到这样的字眼,笔者头脑中突然闪出一个念头,有没有可能是广播风暴现象造成了交换机发生瘫痪故障的呢?考虑到目前局域网中的病毒都已经被清除干净了,笔者估计由病毒引起的广播风暴现象也应该自动消失了,那么交换机的工作状态理应该能够恢复正常了;想到这里,笔者立即将故障交换机重新连接到局域网中,并将其电源接通,刚开始的时候,交换机控制面板中的信号灯工作状态显示正常,此时从故障计算机中上网访问时,笔者发现网络不通故障现象已经消失。为了防止时间一长之后故障现象又会重新出现,笔者这次特意呆在机房中一直观看故障交换机的信号灯状态变化,然而十几分钟过去了,交换机控制面板中的信号灯工作状态仍然很正常,笔者于是断定网络不通故障不会再出现了,果然,又过了很长一段时间,局域网中先前不能访问文件服务器的计算机仍然还能正常访问网络,这说明由交换机引起的网络不通故障现象已经被成功排除了。
故障深究:幕后的“真凶”是谁
尽管由交换机引起的网络不通故障现象已经被解决了,不过笔者到现在还不明白,既然清除了网络病毒后,故障交换机的工作状态就能恢复正常,那说明网络病毒是网络不通故障的“罪槐祸首”,可是网络病毒为什么不会对另外一台二层交换机产生影响呢?
后来,到网上查阅相关资料后,笔者才找到幕后的“真凶”,原来发生故障的那台交换机“服役”时间相对长一些,从而造成该交换机发生了性能老化现象,而处于老化状态的交换机在抵抗网络病毒方面的能力比较差,最终导致该交换机发生了瘫痪故障;而另外一台工作时间相对较短的交换机,不存在性能老化现象,因此它不大容易受到网络病毒的袭击,最终它的性能也没有受到破坏。