梳理网络——故障排除点点通
计算机的网络系统是异常复杂的,网络软件甚至比网络硬件设备及计算机要复杂得多。作为有几年工作经验的网管员,我深知网络排障不是一件轻而易举的事情。在我所遇到的诸多问题当中,纯粹由于硬件的问题导致网络系统故障的,并不是很多。服务器、交换机、路由器和磁带机这些设备成年累月放在那儿,没人动它们,也很少出故障。说起网络排障,它是一种与其它技术相似的技术,排障是从网络系统中消除错误的实施过程。尽管排除计算机系统中的错误很难,但是遵照几个基本规则,可以很快地独立找出错误,从而最迅速地解决故障。
微软公司曾经对大量的专业的故障诊断人员进行调查,以期得知他们之所以能成功地处理故障的原因。这些专业人员将大部分的原因归功于对网络系统知识的熟练掌握和丰富的经验。
当然,不具备有关使用计算机的知识,或特定故障的处理经验,也可以诊断出一些故障。但是最迅速最有效地解决故障的人员均具有操作系统及硬件的知识和解决系统故障的经验,并且将所遇到的问题以及处理方法记录成文档。
在故障诊断方面微软的技术支持工程师们创造了一种DETECT模式。这种策略基于解决问题的调查研究之上,它包含以下六个步骤:
1.
发现问题——与用户在他们的水平上交谈,并请注意,他们使用的术语和过程也许不如你的精确。征兆是什么?他们运行的软件是什么发行版本?他们的硬件是否在硬件兼容列表(HCL)中?
2.
划定界限——自从系统最后一次正常工作到现在,都作了哪些变动?故障发生时,还在运行何种其它软件?故障是否可以重现?请检查你的故障库和TechNet以参考类似的故障,是否可以迅速修复?
3.
追踪可能的途径——因为你已经从第一次故障排除中学到了很多知识,在这个阶段,使用有效的方法将比试验——失败——再试验的方法好得多。
4.执行一种方法——请记住,要做这种方法无效的最坏的打算。你是否要备份关键系统或应用文件?
5.
检验成功——如果所采用的方法是成功的,那么这种故障能否重新出现?如果是,那么用户是否知道该如何处理?
6.做好收尾工作——
一旦确定该故障与用户关系密切时,将其反映在经验中。你如何建议用户下次再使用这种方法?归档其征兆、故障的原因以及解决方法。包括你是如何确定故障及解决方案的,最后与别人共享结果。
如果我们把网络系统中的设备看成一个个的物理点,也可以叫做网络故障点。那么问题就成了对系统中点故障的排查。
我们最好是把故障分成几类,由低到高,这样故障就变成了模块化和区域化的了,网络排障也就成了一件轻松的工作了!
最底层是物理层,如果网络端口出现问题,线路出现问题,就是物理层的故障。
然后是网络层,网络协议的配置,IP地址的配置,子网掩码和网关的配置,以及各种系统参数的配置,是排障时要查的主要内容。
还有就是网络操作系统层,是指运行在硬件设备上的各种网络操作系统,包括UNIX、WindowsNT/9X、Linux、NetWare
等。这一层大家最为熟悉,但这一层存在的问题也非常之多,主要是各种操作系统存在的系统安全漏洞及和许多应用软件之间的冲突。在这些问题导致的故障中,网管员能做的就是及时从网络操作系统软件产品提供商那里得到最新的补丁,以保证自己的网络系统的安全。
再往上是应用层的故障。如果各种网络应用都加上了,域名解析服务器(DNS)、DHCP服务器、邮件服务器和WEB服务器等,那就要关注它们的使用情况。可以利用各种网络监测与管理工具,比如任务管理器(Task
Manager)、性能监视器(Perfermance Monitor)及各种硬件检测工具等,当然利用注册表是一个最终也是最有效的方法。
还有一层是应用系统层,也是我们日常工作的地方,比如办公软件、财务软件、数据库软件,其中最大的问题就是病毒问题和被人非法访问更改的问题了。病毒问题当然最快的解决方法是使用杀毒软件,非法访问这类问题是信息安全的问题。如果有条件,加装防火墙拒绝许多IP的非法入侵是很有效的。如果非法访问来自企业内部,那么对企业信息的管理应该是你急需解决的问题吧!
我想,如果能够按这个思路来分析处理网络上面出现的故障,一个个故障点会迎刃而解的!
页:
[1]