随着信息化程度不断提高,计算机设备的数量越来越多、信息系统的规模越来越大、各系统之间关联越来复杂,计算机信息系统发生故障所带来的负面影响也越来越大。在难以通过不断增加专业人员来维护和管理日益庞大的计算机系统的情况下,大的计算机系统在可监、可控、可管的状态下运行,已经成为我们科技主管部门当前的重要任务。
广州交警IT运维服务管理实践
通过对以上六个ITIL服务支持模块的理解,我们认为六个模块中配置管理是基础,其次是服务台、故障管理、变更管理,最后是问题管理和发布管理。结合广州交警IT运维服务的实际情况,提出了广州交警IT运维服务管理的构思。
(一)建立配置管理数据库。配置管理数据库(CMDB)是关于所有信息设备和软件的信息,它是我们进行运维管理的基础。建立CMDB,首先要进行设备、系统的普查、建档、标签化,然后整理入库,最后还要调整流程,使各个环节工作能够及时更新CMDB。
(二)研究制定六个模块的管理流程,特别是理清这六个模式之间的关联关系。深刻理解这六个模块的含义和流程,以及如何将这些流程切实落实到我们的管理工作,是十分关键的,否则制定流程将会成为摆设,实施不了或者坚持不下去。
(三)研究制定多张控制表单,用于控制、监督流程的严格执行,同时用于规范维护人员行为,这是十分重要的工作。控制表单应该具有简洁、可行,布局合理、信息齐全等特点。制定控制表单体系,应充分体现流程之间的关联性。
(四)首先采用手工方式,执行这些流程和反映流程的表单,发现问题不断完善,不断改进这些流程和表单。经过手工阶段,验证了表单的实用性。然后研究开发运维管理系统软件,作为管理工具之一,进一步规范最终用户的报障、评价等行为,便于通过管理系统(网站)监督每一宗故障处理的环节、所花时间,便于科技主管部门处理各下属单位的投诉(有日志可追溯),判断过错责任,也可避免一些无理投诉,使科技主管部门有效地抓住了工作主动权。
运维管理最重要是落实。实践中,我们制定了许多措施,在实际操作中起到十分重要的作用。
(一)对服务外包公司建立服务评价方法。在发布招标文件、签定合同书阶段就明确提出服务评价方法,并且启用了经济杠杆,考核评价得分与合同支付(经济利益)挂钩,加强了科技主管部门对于服务提供商的监督、管理和控制力度,使服务提供商更加积极、主动采取有效措施提高服务水平和故障处理效率。
(二)建立有效监督机制,保证维护工作不出现漏洞。在分析运维管理的各个环节时,还要对照管理环的各个环节检查是否存在管理漏洞。在项目管理或者服务管理中,都有计划(启动)、执行、监督(控制、反馈)、关闭(总结、提升)四个环节。他们之间的关系如图2所示。其中,监督、控制、反馈是不可缺少的环节,维护服务的执行需要考核、监督才能更加有效,也需要通过控制才能决定其能够进入关闭状态(即服务项目的验收),通过反馈重新制定计划或者修订计划,再改变计划来影响执行效果。
(三)建立了系统巡检体系,主动预防、及早发现系统存在的隐患,并启用问题管理流程消除之。问题管理流程的启动条件,除了定期不定期进行故障统计分析外,还有主动出击,主动通过系统巡检发现系统隐患,然后通过问题管理跟踪表,启动问题管理流程,以及后续的变更管理等,首先由维护人员甚至服务提供商、设备原厂商的二线、三线人员提出建议方案,然后进入变更评估和审批环节,方案批准后执行,并启动配置管理,更新配置管理数据库,最后由用户考核、评价,执行监督环节后同意关闭。
文章来自:协力软件(www.twksoft.com)详细出处:http://www.twksoft.com/newsCenter.aspx?detailid=960