您所在的位置: 首页 > 操作系统 >

Windows系统的主动监视技术

http://os.51cto.com  2006-01-12 21:35    微软  我要评论(0)
  • 摘要:现在,您会越来越常听到系统管理员提到“主动监视 (proactive monitoring)”这一术语。如今,在出现问题时,仅仅知道具体的解决办法,是不够的。懂得如何密切监视运行状况一切正常的服务器和服务的系统管理员,能够预先杜绝问题的发生。
  • 标签:Windows  技术

现在,您会越来越常听到系统管理员提到“主动监视 (proactive monitoring)”这一术语。如今,在出现问题时,仅仅知道具体的解决办法,是不够的。懂得如何密切监视运行状况一切正常的服务器和服务的系统管理员,能够预先杜绝问题的发生。本文介绍了有助于对 IT 环境进行主动监视的 Microsoft 产品和技术。

我们应该监视什么呢?

大多数 IT 环境中都有服务器和台式机。多数情况下,出于服务器所提供的服务和所服务的客户端数量,对它们的监视力度要大于台式机。与客户端相比,服务器停机所造成的商业影响更加严重。

我们所关心的服务器组件分为三个层次:应用程序、操作系统 (OS) 和硬件。这三个层次共同提供了各种各样的服务,因此应对每个层次都进行严密的监视。

因为操作系统被用作软件和硬件层间的调解人,所以监视操作系统,可以为我们提供有关操作系统、所连接(通过物理或逻辑方式)的硬件以及安装在操作系统上的应用程序的信息。

那么,我们如何确定什么是正常行为,而什么又是不正常的行为呢?首先,我们必须定义一个基准。用它来定义服务器的正常和异常行为。可以通过对服务器进行一段时间的简单监视,来建立这个基准。在下一节中,我们将介绍一些可加以应用的监视技术。

回顾 Perfmon

您觉得自己了解系统监视器(或简称 Perfmon),是吗?

自 Windows NT 问世以来, Perfmon 就包含在 Windows 服务器和台式机操作系统的管理工具组中,它是一种您在使用 Windows 时,希望避开的“快捷而质量不高”的专业监视工具之一。 不过,Perfmon 有助于我们进行主动监视。

Perfmon 可监视各类系统计数器,并可用于识别瓶颈,获取有关操作系统和硬件的统计数字。

例如,组织中有一名用户项 IT 小组抱怨说,他的计算机的运行速度变慢了。系统管理员对他的计算机进行了检查,发现磁盘一直在高速运行,随后他打开了 Perfmon,并添加了物理硬盘计数器和分页文件计数器。分页文件计数器显示了过多的页面调度,导致出现性能问题。更改分页文件的值可以排除上述问题,或者可采用其它解决办法。

Perfmon 除了可以提供有用的信息,供我们在图表、报表和直方图中查看外,我们还可以将其配置为在计数器达到预定的阈值时,执行某种操作,比如:通过网络发送警报,运行脚本,等等。有一个实用的说明按钮可帮助我们了解每个计数器及其所监视的内容。

Figure 1: System Monitor (Perfmon)
图 1: 系统监视器 (Perfmon)

Perfmon 的用法相当直接。只要选择您所要监视的对象(比如:处理器、RAM 或硬盘),然后选择所要监视的计数器(比如监视物理磁盘对象时的平均队列长度)。我们还可以选择所要监视的实例,比如面对一台多 CPU 服务器时,可以选择监视特定的处理器。

提示:Perfmon 还可充当 ActiveX 控件,供用户在浏览器中使用。每次需要查看 Perfmon 时,不必启动 MMC,只需加载 Perfmon,并配置所要的计数器,右键单击图表,选择“另存为”网页,就可以了。您可以将该网页发送给组织中的其它用户——对于支持远程用户,非常有用。

网络监视器

无法连接到网络? 网络监视器(或简称 Netmon)操作系统附带的另一个便利的工具。它可用于监视网络流量,使管理可以记录并分析在网络上传送的数据包。您会发现这个工具对于排查有关网络适配器或交换机的问题,或者监视网络上的各种活动,具有至关重要的作用。

虽然用起来比 Perfmon 要复杂一些,但是在某些情况下,非常有用。例如:

用户报告称打开映射网络驱动器后,一直都没反应。

用户报告称将文件保存到文件服务器所需的时间变长了。

IT 小组重新启动了网络交换机,但问题仍然存在。

默认情况下,Netmon 不安装在服务器上。可以通过在“添加/删除程序”控制面板的“添加/删除 Windows 组件”中,选择该工具来进行安装。使用该工具需要管理权限。

在客户端计算机上打开 Netmon 时,会显示该计算机正在发送网络广播。管理员可以通过该工具诊断出网段上的 DHCP 中继代理已停止运行,未给客户端计算机留下 IP 地址。在这种情况下,这些客户端计算机可能正在传输广播,寻找 DHCP 服务器,但是网段上不存在任何中继代理,来提取这些广播,并将它们转发给 DHCP 服务器。

您可以使用网络监视器,实时查看进出主机的网络数据包,并通过几种格式来保存数据,以备日后参考。

Figure 2: Network Monitor
图 2:网络监视器

哪里需要“更有分量的”工具

有时,在更为复杂的情况中调查问题,是一件很棘手的事情。譬如,我的一位客户(一家大型保险公司)遇到了终端服务方面的问题。他们在 WAN 上,对许多站点建立了终端服务连接。一些站点上出现了一个奇怪的问题。它们在运行期间断开了连接。IT 小组开始排查问题。他们检查了有关站点上的终端服务服务器和客户端计算机,但未发现任何异常情况。他们转而求助于为站点通信线路提供支持的公司,但还是一无所获。我们的解决方案是在总公司设置一台 Microsoft Operations Manager (MOM) 2005 服务器,监视终端服务服务器上的应用程序、操作系统和硬件。

使用Windows Terminal Server Management Pack for MOM 2005监视了几个小时后,MOM 向我们发出警报,指出网络接口卡发生了错误。IT 小组联系了提供服务器的硬件公司。他们更换了网络接口卡后,问题就迎刃而解了。

MOM 依靠在目标服务器上运行的各种代理,来监视我们所选的任何对象。MOM 的拓扑结构如“图 3”所示。

Figure 3: Microsoft Operations Manager Topology
图3:Microsoft Operations Manager 的拓扑结构

有了 MOM,我们不必定义所要监视的对象。我们可以使用管理包 ,来应对各种常见的系统、应用程序和硬件部署方案。截止本文撰写之时,MOM 已提供了仅两百个管理包,用于支持各类应用程序和技术(比如:Exchange Server、Active Directory、SQL Server 和 Biztalk Server)。另外,还有针对许多种服务器(比如:Dell、HP、IBM 等服务器)的特定硬件管理包。

管理包包含有:

规则 – 监视广泛的服务器运行状况指示器

警报 – 提请注意关键的可疑事件

知识 – 提供最佳实践指导

状态监视 – 跟踪服务器和应用程序的运行状况

任务 – 从控制台调查和解决问题

报表 – 测量运行性能和容量

为了建立 MOM 环境,需要:

一台 MOM 服务器,用于执行 MOM 管理任务,比如安装代理,导入相关的管理包。

一台 SQL Server 服务器,用于存储数据,以供日后查看跟踪记录和报表,并保存监视数据。

MOM 代理,安装在所要监视的服务器上。这些代理可在服务器上执行本地监视,并将有关信息转发给 MOM 服务器。

(责任编辑:城尘


微软 Windows 7 技术前瞻
Hyper-V 虚拟化技术专题
重复数据删除技术
2008年上半年IT技术图书阅读排行大盘点
汶川大地震 IT技术人在行动
 
 验证码: (点击刷新验证码)   匿名发表
  • Linux C编程实战

  • 作者:童永清
  • 本书系统地介绍了在Linux平台下用C语言进行程序开发的过程,集趣味性、实战性于一体的160多段代码实例,帮助读者快速掌握在Linu..
Copyright©2005-2008 51CTO.COM 版权所有