一.背景介绍
随着日常业務(wù)的不断扩展和信息化建设的持续深入,医(yī)院的IT环境也越来越复杂,各类业務(wù)如HIS系统、PACS系统、LIS系统等对信息系统及网络系统的依赖程度也越来越紧密,对IT系统运行的稳定性、可(kě)靠性要求越来越高。IT系统的安(ān)全平稳运行关系到医(yī)院自身业務(wù)以及信息化工(gōng)作(zuò)的质(zhì)量和效率。而与之相对应的是IT运维管理(lǐ)工(gōng)作(zuò)多(duō)年来一直处于手工(gōng)处理(lǐ)维护的状况,各种服務(wù)工(gōng)作(zuò)始终处于一种被动的状态之中(zhōng)。特别是近年来,随着各类应用(yòng)系统的推广规模、建设速度迅猛发展,系统维护所需要的人员也越来越多(duō),技(jì )术水平要求也越来越高,同时要求技(jì )术人员的综合素质(zhì)也越强,系统运行的稳定性、可(kě)靠性要求越来越高。对业務(wù)处理(lǐ)的效率、规范性、可(kě)追述性,可(kě)分(fēn)析性要求越来越高。因此,如何更有(yǒu)效地利用(yòng)现有(yǒu)的资源,建立高效、规范的一體(tǐ)化运行维护體(tǐ)系,提高IT运行维护服務(wù)水平,确保IT系统的稳定安(ān)全运行是医(yī)院面临的问题和考验。
运维规划
在本项目中(zhōng),建议建设基于业務(wù)、高度可(kě)视化的综合运维管理(lǐ)平台,实现统一的IT基础设施管理(lǐ)、业務(wù)价值分(fēn)析、数据中(zhōng)心机房环境、IT运维工(gōng)作(zuò)与绩效、IT自动化管理(lǐ)等,构建完整的IT管理(lǐ)體(tǐ)系,保持IT业務(wù)良性、稳定和長(cháng)效发展。在本期建设中(zhōng)先考虑基础的监控层面,把监控體(tǐ)系搭建起来,实现底层资源的统一管理(lǐ),未来可(kě)拓展至服務(wù)流程规范层面。旨在提升医(yī)院的IT服務(wù)的规范化和标准化,逐步实现管理(lǐ)流程化、运维服務(wù)化和全面运维管理(lǐ)的服務(wù)自动化。
医(yī)院业務(wù)监控管理(lǐ)平台以关键业務(wù)(如HIS、LIS、PACS等)為(wèi)中(zhōng)心,提供图形化的业務(wù)建模工(gōng)具(jù),根据实际环境,定义个性化的业務(wù)运行评估模型,从业務(wù)角度对被监测资源进行关联、重组,建立真实表达业務(wù)内部关系的影响模型图,帮助用(yòng)户快速搭建业務(wù)卡片视图,准确判断业務(wù)健康度、繁忙度、业務(wù)层级视图和业務(wù)告警等内容,客观评估业務(wù)运行水平。通过系统提供的层级视图,显示从业務(wù)应用(yòng)层的软件到计算层的服務(wù)器,再到网络层的各类网络设备,层级视图可(kě)以显示各资源间的连接关系和依赖关系。当某些资源(如服務(wù)器、网络等)发生故障时,能(néng)快速定位受影响的业務(wù)与故障根源点,评估分(fēn)析业務(wù)对用(yòng)户的影响度,并支持在业務(wù)卡片视图上直接查看多(duō)达6级的业務(wù)故障信息,在业務(wù)卡片视图上掌握业務(wù)系统的工(gōng)作(zuò)状态、性能(néng)状态和故障状态,直观反映关键业務(wù)系统的运行态势。
自动布局管理(lǐ),实现拓扑的自动布局方式,如星形布局、树形布局等,提供建立子拓扑和自定义拓扑的功能(néng),支持物(wù)理(lǐ)拓扑、逻辑拓扑。
拓扑图应能(néng)直接提供设备状态、链路带宽流量、告警故障信息,查看拓扑对象的事件信息;使用(yòng)不同方式展示管理(lǐ)对象的状态信息,如颜色、粗细、图标等方式,并能(néng)支持数据下钻功能(néng),查看每个设备和链路的详细信息,如设备的详细信息、告警详情、面板信息、机房定位、网络接口、业務(wù)结构图、配置管理(lǐ)、下联设备等。
光纤空间占用(yòng)小(xiǎo)。
能(néng)够实时展示网络设备的性能(néng)、端口利用(yòng)率、端口输入、输出双向的使用(yòng)情况端口流量、错误率和線(xiàn)路利用(yòng)率等信息,可(kě)以根据策略灵活定制关注的网络设备性能(néng)指标,以及性能(néng)指标的时间采集频率、以及各个指标的告警阈值,提供性能(néng)统计分(fēn)析报告。同时提供流量的记录与报告;能(néng)查看系统中(zhōng)所有(yǒu)的链路情况,并可(kě)以手动维护链路。在拓扑图中(zhōng)根据颜色、宽度、数值,显示不同链路的带宽、速率、还有(yǒu)端口链接情况等。
主机监控
针对本级网络中(zhōng)的各种物(wù)理(lǐ)主机资源管理(lǐ)和展现,通过SNMP、WMI、Telnet、SSH等协议实现对 Windows、IBM AIX、Linux、HP-UNIX、SCO-UNIX等多(duō)种类型主机资源的监控;结合软件主机相关资源的分(fēn)配、部署、应用(yòng)情况进行采集分(fēn)析,提供主机资源拓扑图、主机资源使用(yòng)情况及主机事件告警等功能(néng),实现对主机服務(wù)器资源的统一管理(lǐ)。
数据库监控
通过ODBC、JDBC方式支持市面主流多(duō)品牌数据库系统,数据库系统监控模块根据预定义的监控项目对Oracle、Sysbase、SQL Server 、Mysql、DB2等多(duō)种数据库进行监控。
中(zhōng)间件监控
应支持对市场主流的中(zhōng)间件进行性能(néng)、状态和故障信息的监测,包括J2EE(WebSphere、Weblogic、TOMCAT)、JBOSS、Tuxedo、Apache、Resin、IIS、Apache、Exchange、Domino等中(zhōng)间件和应用(yòng)。
应用(yòng)监控
实现J2EE应用(yòng)服務(wù)器的监控管理(lǐ),可(kě)以对WebSphere Application Server、WebSphere Portal Server、JBossAS、Oracle AS、WebLogic、Sun JES、Tomcat、ApusicAS等J2EE应用(yòng)服務(wù)器进行监控管理(lǐ)。服務(wù)器发现方式均為(wèi)WMI、telnet或SSH,对于每种应用(yòng)的管理(lǐ)通过相应的监听端口和管理(lǐ)用(yòng)户名(míng)及密码实现。支持对IIS、Apache、Exchange、Domino等基础应用(yòng)平台的基础信息、连接测试、基本负荷等重要信息的监测。
存储监控
通过SMI-S、SNMP等协议,可(kě)以监控HBA主机、FC交换机、存储设备(IBM、Brocade、EMC、NetAPP、浪潮、HP、Nexsan、华為(wèi)、3PAR、Dell、宏杉等)、光纤通道状态,以及数据存储磁盘分(fēn)配情况,并支持生成FC-SAN拓扑。
虚拟化监控
通过数据接口可(kě)实现对VMware 、Hyper-V、Citrix、H3C、华為(wèi)、KVM等主流虚拟化资源的管理(lǐ)和展现,结合虚拟化资源的分(fēn)配、应用(yòng)情况进行采集分(fēn)析,提供虚拟化资源拓扑图、虚拟化资源使用(yòng)情况及虚拟化事件告警等功能(néng),实现用(yòng)户对虚拟化设备资源的统一管理(lǐ)。
医(yī)院信息部门日常负责管理(lǐ)多(duō)个机房,机房环境的变化将对IT资源的正常运行产(chǎn)生直接影响,进而影响业務(wù)系统的正常运行。因此综合运维管理(lǐ)平台需从全局的角度实现对多(duō)个机房的统一管理(lǐ),对IT资源和环境元素的综合管理(lǐ),让运维管理(lǐ)全方位、不留死角。