信息化建设解决方案之运维篇

发布时间:2015-03-16 15:20:16   来源:文档文库   
字号:

信息化建设解决方案之运维篇

1组织IT运维服务面临的问题

【导读】随着组织信息化建设的不断深入,信息化的重点从IT建设转向IT运维,IT运维难度不断增加、IT运维成本不断上升、IT运维服务水平参差不齐、突发事件频繁发生给IT管理者造成了一定的困扰,那么根源是什么?

1.1 IT运维服务面临的困惑

随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题,据统计,IT运维服务占到IT部门工作量的80%左右。国内企事业单位的IT运维普遍存在以下现象:

(1)IT运维工作忙而不受重视。

IT运维服务人员工作的一个普遍现象是“很忙碌,坐不下”,每个IT运维服务人员都很忙碌,到处在各个业务部门间解决和处理问题,就像“救火员”。虽然如此忙碌,但业务人员还是经常抱怨“找不到人”、“解决问题太慢”等等。IT运维服务人员的工作始终得不到业务部门的认可,而且工作量也难以量化。运维或信息部门作为单位的业务支撑部门,在信息系统的战略规划项目立项等工作中话语权较弱,更谈不上决策权,往往是项目建设完成之后才介入系统的管理和维护,等到发现问题为时已晚。

(2)IT系统复杂,维护难度高,风险压力大。

随着组织信息化的不断投入,组织的硬件设施、软件系统不断增加,软硬件设备的增加在一定程度上增加IT运维的复杂性,包括各类开发系统、各类应用架构、不同品牌厂商设备等等,需要不断增加人力投入,IT运维成本居高不下。对业务连续性要求较高的单位,系统一旦宕机损失是巨大的,运维部门压力可想而知。有的单位由于缺乏系统的资产管理,运维部门很难准确了解公司到底有多少IT资产,公司是否需要购置新机也缺少数据支撑。在年底审计时全团队奋战多日才能完成单位的IT资产清查工作,然而来年又会因为设备报废,或员工离职而发生很多变化,还是无法做到实时掌握准确数据。

(3)技术人员难培养,流动性大。

大多数时候,运维人员都在进行着简单重复的工作,且很难得到最终用户的肯定,他们私下用“碌碌无为”、“穷忙族”来形容自己,人心涣散,自我认可度低,团队人员流动率较大。 情况往往是某人好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内出现波动。

(4)服务商难管理,技术水平参差不齐,服务不及时,有问题不能及时解决。

IT运维服务外包存在一定风险,关键在于对于IT运维服务外包供应商的管理不到位,具体体现在招标环节疏于审查、过程监督环节疏于监管、以及事后评价环节疏于考核。通过在招标环节加强对供应商资质、能力水平、案例等考察可以有效包括准入关;通过在服务过程中加强监督可及时发现供应商服务提供能力的异常;通过事后评价可以建立供应商的退出机制,保证供应商提供优秀的服务。

1.2 IT运维服务问题分析

从以上现象可以看出,IT运维服务的所有问题的根源都不是技术问题,而是管理问题,包括流程管理的问题、评价管理的问题、应急管理的问题等等。主要包括:

(1)IT运维服务管理方式缺乏创新。

IT 运维服务管理方式包括自营管理和外包管理,随着IT系统复杂程度的增加,对于IT运维能力的要求也越来越高,自营服务的成本已远远大于外包服务的成本,在某些非关键的领域,应该引入IT运维服务外包这一创新管理模式以降低服务成本,同时将组织自身的IT运维人员解放出来,做更有价值和意义的工作。

(2)IT运维服务管理不规范。

IT运维服务人员很忙碌却得不到业务部门认可的根本原因是双方缺少IT运维服务沟通的基本语言,也就是IT运维服务管理规范不明确,导致业务部门对于IT运维服务部门提供哪些服务不清晰、提供服务的流程不清晰、对于服务的评价指标不清晰,同时也导致IT运维服务人员工作职责不清晰、人员间工作交接不顺畅、服务过程缺少监督等。

(3)工作分工设计不合理,忽视梯队建设。

人员管理问题,根源在于运维工作分配不合理,业绩无法考核。若将运维人员分成一、二、三线支持,不同运维人员各司其职,能使有限的运维力量得到合理利用,整体工作效率将明显提升;同时也方便对各自的工作业绩进行评估。再据此制定相应奖惩措施,或针对不同岗位提供不同服务技能培训,亦能提高员工工作积极性。同时,加强运维团队内部知识系统的建设,有利于沉淀内部知识积累,快速培训新员工,减少核心员工离职带来的冲击。

(4)IT运维服务供应商管理不到位。

IT运维服务外包存在一定风险,关键在于对于IT运维服务外包供应商的管理不到位,具体体现在招标环节疏于审查、过程监督环节疏于监管、以及事后评价环节疏于考核。通过在招标环节加强对供应商资质、能力水平、案例等考察可以有效的对供应商的资格进行把关;通过在服务过程中加强监督可及时发现供应商服务提供能力的异常;通过事后评价可以建立供应商的退出机制,保证供应商提供优秀的服务。

2科学的IT运维服务管理之道

【导读】解决IT运维服务问题,需要借鉴国内外优秀企事业的最佳实践,建立适合自身的IT运维服务管理体系,并引入IT外包等先进管理模式,来解决IT运维服务能力、质量、水平、成本之间的矛盾。

2.1 IT运维服务管理概述

根据国家标准GB/T 28827IT运维服务定义为:采用信息技术服务和手段,依据需求提供的服务级别要求,对其所使用的信息系统运行环境、业务系统等提供的综合服务。

IT运维服务包括自有运维、外包运维、自有与外包相结合的方式。下面将对两种不同模式下的管理进行阐述。

2.2 基于最佳实践的IT运维管理

2.2.1 ITIL概述

IT运维管理作为IT服务管理的主要范畴,目前国际上的研究和论证比较成熟,主要成果包括ISO20000系列的国际标准以及ITIL最佳实践方法论,两者从理论基础上是一致的,区别在于标准和标准的实践。下面以ITIL为例介绍IT运维管理的最佳实践。

ITIL(IT Infrastructure Library)诞生于1980, 由英国政府发起, 委托CCTA(Central Computer and Telecommunications Agency)组织, 后成立 OGC(Office of Government Commerce)专门负责英国政府和其它公共事业组织对 IT资源的有效及低成本利用。目前ITIL已经成为IT行业服务管理的理论基础。在此基础上建立的非赢利性ITSM论坛(itSMF-IT Service Management Forum)已成为公认的ITSM的权威性社区。

ITIL 是基于流程的方法论。IT部门可用其检查是否用一种可控的和训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织, 无论其规模大小, 或采取何种技术。ITIL被用来建立和交付服务管理流程;这些管理任务可被某些服务及系统管理工具所简化。

ITILIT服务管理实践中涉及的许多重要问题进行了系统的分析, 包括全面的检查清单(checklist)、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。

ITIL V3的核心设施是基于服务生命周期的, 服务生命周期框架下图所示, 服务战略是生命周期运转的轴心;服务设计、服务转换和服务运营是实施阶段;服务改进则在于对服务的定位,基于战略目标对有关的进程和项目的优化改进。

2.2.2 ITIL五大模块

ITIL V3包含的各模块内容如下:

1服务战略(Service Strategy)

服务战略为组织在设计、开发和实施服务管理从组织能力和战略资产两个战略角度来提供指导。该部分内容提出了服务管理实践过程中整个服务生命周期的策略、指南和过程。服务战略是服务设计、服务转换、服务运营和服务改进的基础,它的主题包括了市场开发、、内部和外部的服务提供、服务资产、服务目录,以及整个服务生命周期过程中战略的实施。 

2服务设计(Service Design)

服务设计描述了对服务及服务管理过程设计和开发的知道,它包括将战略目标转变成服务投资组合和服务资产的原则和方法,服务设计的范围不仅限于新的服务,它还包括为保持和增加客户价值而实行服务生命周期过程中必要的变更和改进,服务的连续性,服务水平的满足,以及对标准,规则的遵从性。它指导组织如何开发设计服务管理的能力。

3服务转换(Service Transition)

服务转换为如何将新的或变更的服务转换到运营过程中有关能力的开发和改进的指导,服务战略需求通过服务设计进行编码,而服务转换则是探讨如何将这种编码有效导入到服务运营的体系中,与此同时,还应控制失败的风险和服务的中断。

4服务运营(Service Operation

服务运营包含了在服务运营方面的实践,它对如何达到服务支持和交付的效果与效率,确保客户与服务供应商的价值提供了指导,并最终通过服务运营实现战略目标。

5持续服务改进(Continual Service Improvement

服务改进为创造和保持客户价值而用更优化的服务设计、转换和运营提供指导。它结合了质量管理、变更管理和能力改进方面的原则、实践和方法。组织要学会在服务质量、运营效率和业务连续性方面的不断提高和改进意识。此外,它还为改进所取得的成就与服务战略、服务设计和服务转换之间如何建立关联提供指导,为基于戴明环(PDCA)形成计划性变更的闭环反馈系统的建立提供思路。

2.2.3 ITIL关键流程

IT运维服务体系中,ITIL是一套基于流程的方法和规则。在组织信息化建设中,ITIL可以指导信息化部门向用户提供更为高效可靠的服务。下面对这些关键流程进行简要的介绍。

1服务台

服务台是用户与IT部门进行沟通的唯一平台。服务台为用户提供了服务联系点,利用这个联系点促进组织业务流程与服务管理基础架构的集成。服务台的主要设计目标是加强用户与IT服务部门之间沟通,为组织的信息化建设服务。

2事件与故障管理

事件与故障管理的主要功能包括对事件与故障进行记录,分类,并安排专家管理故障处理的全过程。事件与故障管理的目标是在避免影响客户和用户业务的前提下让IT系统能够迅速恢复到安全级别。

3问题管理

问题管理流程是指通过事件发生的原因进行分析,制定问题的解决方案以及预防措施,降低因问题和事件而产生的消极影响。与故障管理单纯强调故障的处理速度不同,问题管理模块的核心功能是找到事件发生的深层次原因,并相应的提出合理的解决方案防止问题的再次发生。

4配置管理

配置管理模块负责识别和确认系统配置项、记录和报告配置项状态和变更请求、检验配置项的正确性和完整性等活动。设置配置管理的主要目的在于为组织提供IT基础架构的逻辑模型,对变更管理和发布管理提供有效的支持。

5变更管理

变更管理是在最短的时间内完成系统架构,并在服务的任一方面发生变更时对其进行控制的服务管理流程。该模块的设计目标是确保在变更实施过程中使用标准的方法体系并提高变更的效率,并降低由业务变更导致的业务中断对组织产生的影响。

6发布管理

发布管理流程负责对经过测试后导入实际应用的新增或修改的配置项进行分发和宣传。发布管理之前进行的是软件的控制和分发,该过程由变更管理流程进行管理。

7服务级别的管理

该项管理的目的在于为签订服务级别的协议而进行一系列活动所组成的服务管理流程,其中主要的活动包括协议的计划、草拟、以及签订服务级别等方面。有效的服务级别管理可以保证IT服务质量在不提高成本的前提下能够稳步提高。

8IT服务财务管理

IT服务财务管理模块主要是指IT服务过程中所需的成本进行预算和核算,根据预算情况向客户收取相应的费用。所涉及的费用主要包括投资预算、服务成本的核算以及服务计费三部分。合理的财务管理以及计费方法可以通过量化服务成本降低开销,避免风险的发生并引导客户的合理行为。财务管理流程产生的预算和核算信息可以为IT服务提供有效的辅助决策信息。

9IT服务持续性管理

IT服务持续性管理指当系统发生故障时有可靠的技术、财务和管理资源保证组织的IT服务能够正常运行。保持IT服务持续性的关键在于当故障发生时,系统仍可以提供预定级别的服务,从而确保系统的业务可以稳定持续的运行。

10能力管理

能力管理既考虑运营成本也考虑业务需求,对服务能力进行合理配置从而达到IT资源发挥最大效能的目的。该流程包括服务能力管理、业务能力管理和资源能力管理等方面。

11可用性管理

可用性管理流程通过分析用户和业务方的可用性需求并以此为依据来优化和设计IT基础架构的可用性,有效的可用性管理可以在控制成本的前提下提高系统的可用性。有效的可用性管理可以通过定位业务以及对用户的可用性需求进行分析,从而使IT服务的设计能够满足用户的需求,并且可以避免IT服务运作中可用性级别过高的情况发生,这一设计思想对于降低IT服务的运作成本具有重要意义。

2.3 风险可控的IT运维服务外包

IT外包是指组织为了实现自己的目标, 通过合同或协议的方式将部分或全部的信息技术职能交由外部的服务提供商提供的一种管理模式。IT外包一般还伴随着组织的IT 资产、人员、租赁资产交由IT 服务商管理。

选择IT外包有以下好处:专业公司提供的外包服务,比组织自身服务部门的工作更为高效、专业;利用第三方的资源和技术优势,降低组织管理与运行成本;组织自身则集中精力发展其核心业务,增强核心竞争力;以组织业务特点定制的解决方案,完全人性化的集成及服务;单一的联系点,全面支持客户众多品牌的软硬件产品,避免多厂商IT设备条件下的协调成本等。

2.3.1 IT运维服务外包的基本阶段

对于外包的客户方组织而言,要成功实施 IT 外包服务,主要经过以下几个阶段:

1)组织的内部分析和评估(准备阶段)

在这一阶段,组织的高层管理者主要工作是确定外包的需求并制定实施的策略。要从外包中获得效益,组织的最高决策层必须采取主动的态度,因为只有最高决策层才具有外包成功所必需的视角和推动变革的力量。

2)选择合适的外包商(选择阶段)

在选择外包商时,要先将自己要求的底线与外包商所能提供的服务进行比较。通过识别潜在的外包商,向外包商发布信息并邀请竞标,接收和分析外包商的标书,审阅外包商的证明文件,验证他们在提供外包服务上的经验与能力,甄选最终外包商并进行合同谈判。

3)完成内部服务向外包服务的过渡(过渡阶段)

该阶段涉及到人事过渡、资源移交、工作场所变更、系统切换等过程。

4)外包的实施和管理阶段(整合阶段)

这一阶段对外包关系进行管理,并就任何外包关系的维护与变化进行协商或者谈判,加以实施。客户在这一阶段要保持对外包业务性能的随时监测和评估,并及时与外包商交换意见,保证外包工作的顺利进行。

2.3.2 IT运维服务外包风险管理

IT外包风险是由许多不确定因素造成的。其中可能涉及配合外包服务提供商的需求进行一些额外工作,包括协调成本、签约金和监督外包商进展的支出,这些可能导致实际成本远高于预期成本。另外,还有一些合同风险——在与外包服务提供商订立合同时,如果条款说明不明确或者漏掉重要条款,都可能会让组织遭受极大的损失。

由于外包必然会涉及风险,因而在外包决策前必须对风险进行管理,进行风险评估,要辨别、分析风险并按照优先次序对其进行排序,考虑如何才能消除或减小风险,同时还要考虑在外包协议生效期间产生的管理费用。

IT外包风险管理是指根据信息资源对于组织的价值,对风险进行预测、识别、评估、分析,识别、评价组织的信息资源的威胁和脆弱性,并在此基础上有效地处置风险,从而使风险达到可接受的水平。主要包括以下几个步骤:

风险识别:识别和评估潜在的风险领域

风险分析:分析外包关系可能会产生的风险

风险排序:对风险的优先级进行排序

风险控制:考虑采用什么样的方法对它们进行管理与控制。

2.3.3 IT运维服务外包合同管理

外包合同管理是外包服务管理的一个重要组成部分。由于外包项目经常涉及到的交易金额庞大,而且外包服务对于组织的高效运营非常关键,因此需要专业的法律文件支撑。合同应该灵活而又能够解决交易中真正问题,使客户和外包商双方均受到保护,能

对价值的创造和风险的管理起到支持作用。

外包服务合同包括服务水平协议(SLA - Service Level Agreement)。外包合同一般为 5 年、10年。合同条款是外包服务中最重要的环节,合同条款制定的详细程度和明确性直接影响合同的履行。合同条款涵盖的内容非常全面,包括:合同的适用范围和预期客户资源需求、合同条件、基准及衡量办法、有效期、终止原因、知识产权、合同转让、关键项目实施人员及补救办法、未来价格灵活性、未来服务的灵活性、付款方式和时间、风险管理以及其它法律规定的合同必备条款。好的外包合同条款对合同中的工作有清楚的界定,能够在双方出现分歧时成为解决争端的依据。

2.3.4 IT运维服务外包关系管理

IT 服务外包中,合同是要求双方履行承诺的主要约束力。然而仅靠合同并不能保证外包的成功。由于外包合同在多数情况下是不完善的,合同是逐步实施并且不断变化的,所以在合同中不可能对外包服务需求的所有环节都做出具体的规定,如果客户在外包职能范围内出现新的需求,而且需求在合同中没有做出具体规定,就无法靠合同解决。

在这种关系下,客户方需要与外包商建立起相互协作和相互理解的关系,这样外包商才会对变化与额外的需求做出善意反应。因此,外包商和客户之间的稳固关系显然是长期业务外包关系成功的关键,也是解决外包中分歧的有效方法。

要正确维系与外包商之间的关系,需要进行关系管理。外包关系管理是指一整套能够使外包关系运营的人事、流程、工具和系统。外包关系管理是组织确保实现合同价值的最重要的工作。

实践经验显示,成功实施外包关系管理的组织通常非常关注以下几个关键成功因素:

(1)双方协商的、可测量和可检验的客观绩效标准

成功的外包关系焦点在结果而不在手段。需要制定客观的绩效度量标准,能够保证结果的可度量性。只有通过与绩效的客观标准相比较,顾客才知道他们正在接受的服务正是期望获得的服务,外包商才知道他们正在满足顾客期望的需求。

(2)正式的关系管理结构

正式的、多层次的关系管理结构可以将客户和外包商连在一起。外包关系要求用它自己的管理结构去替代以前内部的管理系统,这种新型结构通常采用联合管理团队的形式。管理团队或大型合同的多个管理团队负责日常的、战术和战略方面的关系管理。每个团队的职责、议程、会议频度以及与其他团队的关系都有明确的界定。这种关系管理结构建立起识别、解决问题的重要机制,能够实现问题的及时上报、处理和解决。

(3)基于绩效的定价标准

基于绩效的定价可以确保不断地激励外包商去达到或超越设定的绩效标准。当绩效超过标准时,就给予奖励;当绩效低于标准时,就给予处罚。对处于外包关系中的双方的员工来说,这些激励也可转化为绩效标准。把所有的基于绩效的风险和收益转换成个人的绩效标准时有利于双方关注焦点的适当调整。

(4)关于商业目标和关系管理的内部培训及交流

负责为顾客管理外包关系的员工应接受专门的职业培训,包括全面理解合同的商业目标,双方认可的具体的绩效标准,以及他们个人的角色、职责、权力和报告结构。此外,最终用户也应该接受适当的培训,以理解商业的总体目标、问题的识别和解决方式、沟通的渠道等。培训和交流也可以减少客户可能存在的不满或抵制情绪。

5)知识和技能持续不断的交流

两个组织之间持续不断的、自由的知识和技能的交流是成功的外包管理的标志。每方都有他们自己的特长,当这些特长被共享时,它不仅对双方关系的成功有所贡献,而且对己方的成功也有所贡献。培训计划、岗位经验、与专家交流、技术和工序都是有助于实现交流的具体方式。

3MaxValue IT运维服务

【导读】作为专业的IT运维服务供应商,我们向客户提供包括咨询、服务外包、工具一系列的IT运维服务,帮助客户实现IT运维的高效管理。

3.1 MaxValue IT运维服务总体框架

完整的IT运维服务框架包括管理咨询、外包服务以及工具服务,以IT运维咨询服务为先导进行顶层设计,规范组织内部IT运维和IT外包业务;以IT运维外包为过程环节,实现IT运维的专业化和高效化;以IT运维服务工具为支撑,实现流程的固化和实时监测,提高IT运维服务的效率。总体框架图如下:

3.2 MaxValue IT运维服务内容

针对客户的实际需要,我们将提供如下服务项目:

3.2.1 IT运维管理咨询服务

IT运维管理咨询服务就是以IT治理思想为指导,以推动IT与业务的动态融合为出发点,基于ITIL最佳实践经验,为客户建设以服务为导向的IT运维管理体系;帮助制定规范化的ITIL服务流程,建立信息部门和业务部门之间沟通的桥梁,辅助信息部门选择或开发规范化的日常管理工具。

具体内容包括:

IT运维现状评估:通过现状、访谈、研讨等形式了解客户IT运维现状,并基于ISO20000体系进行评估;

IT运维体系设计:基于ITIL最佳实践,搭建组织IT运维组织职能和流程;

IT服务外包管控设计:设计IT服务外包的管理体系。

通过咨询,帮助企业梳理现有的IT运维业务流程,建立基于ITIL最佳实践的运维流程和组织职能,通过引入服务台、服务水平管理等最佳实践,有效提高IT部门对业务需求的响应速度,建立IT与业务的沟通语言和沟通桥梁,平衡IT与业务的关系,平衡IT服务质量与服务水平,提高业务满意度,提高IT资产价值利用率。

3.2.2 IT运维服务外包服务

针对IT运维工作量大,技术繁琐,专业性高等特点,提供专业的基于IT全生命管理工具平台的MaxValue IT运维外包服务,帮助用户实现以花费更少、历时更短、风险更小、更为专业服务维护信息技术应用

桌面管理服务

帮助用户解决桌面级管理运维工作繁锁且占用大量工作时间的困惑,提供基础档案维护、软件维护及设施维护等专业运维服务,专业的人做专业的事,更迅速,效率更高,使组织总成本更节省

基础设施维护

提供基础设施相关的档案、物理环境、计算机网络的运维以及应急救援服务,保证用户现有基础设施正常运行,降低整体管理成本,同时根据日常维护的数据和记录,提供用户基础设施整体建设规划和建议,更好地为用户信息化发展提供有力保障。

系统软件维护

提供系统软件相关档案、主机存储设备、应用软件、系统数据的运维以及应急救援服务,保障用户系统软件正常运行,降低整体管理成本。同时,协调各业务应用系统内部运作,提高系统可用性。

信息安全维护

提供信息安全相关档案维护、监测预警、风险评估、安全加固、应急救援的运维以及信息安全意识培训服务,及时掌握网络安全系统资源现状和配置信息,全面提高系统信息安全性。

3.2.3 IT运维应急救援服务

针对机房中物理设备、计算机网络设备、服务器存储设备、应用软件系统突发的重大事件,包括信息安全事件,以最快的时间进行故障排查定位和应急处理,帮助客户实现事件发生后控制事态,限制影响,避免或减少次生灾害的发生。

主要内容包括:

基础设施应急救援:包括网络故障、设备宕机等故障救援

软件系统应急救援:包括系统不可用、系统性能差等故障救援

信息安全应急救援:包括网络受攻击、病毒攻击、系统被篡改、泄密等故障救援。

3.2.4 IT运维服务辅助工具

MaxValue IT 全生命周期管理平台作为运维服务辅助工具,具有全面的运维监控分析管理功能,全面覆盖IT运维工作的各个阶段。

运维信息收集

IT全生命周期管理平台的机房中心、监控中心、网络中心、安全中心能够全面收集运维过程中出现的各种事件、告警、问题、变更等信息。能够全面地收集各种资产的监控指标,并根据客户实际业务系统整合监控指标和组合算法进行核心业务的监控。将系统的可用性、性能情况、容量估算等可视化数据实时推送到用户端。

统一分析和告警机制

系统采用统一的事件分析规则引擎。事件综合分析包括事件关联分析、逻辑关联分析、影响范围分析等手段,根据事件的影响范围、破坏性、可恢复性等风险评估结果对事件进行分级,根据分级结果对事件进行处理。

运维管理

运维中心是运维系统的管理平台。系统采用全球IT运维最佳实践的ITIL作为管理流程设计的依据。运维中心包括服务台、服务级别管理、事件管理、问题管理、配置管理、变更管理、发布管理、日常运维管理等功能模块,全面覆盖运维管理的整个过程。

报表和展示

报表中心能够对 IT 系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为决策提供支持信息。报表支持多种格式的导出与自动发送功能,根据不同角色人员的需要,灵活定制报表的内容和格式。

展示方面系统支持PORTAL平台形式的可定制首页功能, 更能支持手机、PAD等终端的访问,支持大屏幕的展示。

辅助运维工具

资产管理。资产管理问题是IT运维工作的核心问题。IT全生命周期管理平台提供全面的IT资产管理解决方案,能够对资产的购进、使用、变更、处置等全生命周期进行管理

运维知识库。运维服务人员处理问题的工具库。系统提供的运维知识系统,不仅能够帮助运维运维查询知识解决一线支持问题,还能够培训考核新员工,加强内部交流。运维知识系统能够提高问题解决效率,降低运维人员的工作强度,提高服务满意度。

MaxValue IT全生命周期管理平台架构图

4最佳实践介绍

【导读】针对IT运维服务管理,国内外的大量实践已经为我们提供了优秀的经验。

4.1 借助第三方咨询力量可有效实现IT运维服务管理最佳实践落地

很多客户都希望加强自身内部的IT运维服务管理或者加强对IT外部服务的管控,但是苦于没有经验,在实际建设过程中出现设计不完善、不能落地的现象。

实践证明,通过引入第三方咨询服务可以有效解决此问题。第三方咨询服务依靠大量的服务实践和成熟的实施方法论,可以帮助客户在最短时间内实现适合客户自身特点的IT运维服务管理体系的设计,并能辅导客户实现管理体系与日常管理的有效融合,帮助客户最大程度上发挥最佳实践的功效。

4.2 IT运维服务外包可实现IT运维成本与质量的平衡

IT运维服务过程中,很困扰客户的一个问题就是业务对于IT运维服务质量的要求与IT运维服务能力和服务成本间的矛盾。伴随着组织IT系统复杂程度的不断增加,为保证IT运维服务质量,IT运维服务成本激增,如何来解决?

通过引入IT运维服务外包,将部分或全部IT运维服务交付给专业的第三方IT运维服务提供商,可有效解决IT运维成本与运维质量的矛盾。

选择IT外包有以下好处:专业公司提供的外包服务,比组织自身服务部门的工作更为高效、专业;利用第三方的资源和技术优势,降低组织管理与运行成本;组织自身则集中精力发展其核心业务,增强核心竞争力。

4.3 应用自动化巡检工具能够降低运维工作强度,提高巡检效率

信息系统的运维工作,涉及对网络、业务应用、桌面、安全、告警、运维服务模块等上百个指标的检查,对于这些指标的检查如果通过人工巡检的方式进行,巡检效率低,并且可能出现漏检、重检的情况。

自动巡检时,巡检中心按照巡检表要求定时启动巡检;巡检指令由适配器接收并执行,并将检查结果反馈到巡检中心;巡检中心实时展现当前巡检过程执行情况,发现异常情况即以工单、告警等方式及时通知给应急维护人员;针对每次巡检过程,能够自动产生巡检结果报告。对于所有历史巡检结果报告,支持按照多种查询条件进行快速检索。自动巡检系统还能够根据设定,定期自动产生统计分析和趋势分析报告,支持高层领导决策。

相对于人工巡检,自动巡检系统由中心和适配器分工协作实现自动巡检。运维中心负责执行巡检计划、分发指令、人机交互等;适配器通过调用资产数据接口或执行命令脚本,实现对资产信息状况的检查。自动巡检很好的解决了上述这些问题,是运维巡检的最佳实践之一。

4.4 应用服务水平协议有助于提升服务质量和服务认可度

服务水平协议(Service Level AgreementSLA)是一种由服务供应商与用户签署的法律文件,其中承诺只要用户向服务供应商支付相应费用,就应享受到服务供应商提供的相应服务质量,是定义服务提供者和用户之间关系的一个文件。

服务水平协议内容一般包括提供的服务、服务水平、问题管理、法律适用和解决争端、客户的义务和责任、安全、知识产权和机密资料等。

有效的应用服务水平协议,将有助于确定并界定用户需求、提供便于理解的框架、简化复杂问题、减少冲突范围、在发生争议时加强对话、消除双方不切实际的期望等。服务水平协议将建立服务双方共同的愿景和考量标准,实现对服务水平的统一理解,有助于改善服务接收方对服务提供方服务水平和服务质量的认可度。

4.5 持续监测有助于防患于未然,降低IT故障发生几率

持续监测就是通过部署监测工具对IT系统的关键指标进行7*24小时不间断的监测,一旦指标出现异常,将自动通过邮件、短信等方式提醒IT运维服务人员进行关注并分析。

通过持续监测IT系统的关键指标,IT运维服务人员可以在故障发生前提前介入并进行调查分析,并将故障在萌芽阶段予以排除,实现提前预警、提前处理,避免故障发生给业务造成的影响,降低客户损失,提高IT系统的可用性。

4.6 定期巡检是一种比较经济的故障预防手段

由于持续监测需要部署专业工具,还需要IT运维人员24小时的驻场服务,总体投资比较大,对于可用性要求比较高的IT系统是必须的。如果客户所应用的IT系统并不要求非常高的可用性,持续监测这种服务方式就显得昂贵了,此时采用定期巡检的方式不失为一个好的选择。

定期巡检就是周期性地对IT系统进行一次全面的健康检查,周期的频率取决于客户对于IT系统可用性的要求。定期巡检的检查项目与持续巡检检查项目一致,通过规定项目的定期检查和日志分析,可以判断IT系统的健康状况,查找系统漏洞和安全隐患,并采取措施进行加固。由于定期巡检不需要一次性的工具和人员投入,也能取得较好的故障预防效果,是一种投入产出比较高的故障预防手段。

4.7 配置管理数据库是IT运维管理工作的基础

配置管理数据库(Configuration Management DatabaseCMDB)是用于存储配置项及配置项关系的数据库。在数据库中,配置项及其关系利用关系数据库的方式对客户IT服务的整体架构进行了描述,包括IT服务、IT基础设施、IT应用系统、IT人员、IT文档等。

配置管理数据库是IT运维服务工作开展的基础。通过配置项的上下级关系将帮助IT运维人员实现由故障点上下快速定位;通过配置项的横向关系将帮助IT运维人员实现故障影响范围的快速确定;通过配置项的属性信息实现配置项关键信息的信息存储和检索。总的来说,配置管理数据库是IT运维服务工作快速、高效、准确的利器。

4.8 运维知识库能够加强知识积累和内部交流,提升效率

运维知识库是系统知识积累的重要方式,是员工日常工作的重要工具。通过对知识库维护和使用,不仅可以在故障自动处理和人工处理的过程中从知识库中得到相关故障维护的分类和快速定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务帮助功能,能使相关人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。

运维知识库一般具有的功能有知识的录入和查询、知识的分类展示、知识的转移和版本管理。知识的录入一般支持多种方式,手工录入、模版导入、批量导入、事件关联等。在知识查询上一般支持多种搜索方式,关键字搜索、条件搜索、高级搜索、附件全文检索等。版本管理能够管理不同版本的知识,做到知识可追溯,修改有依据。

运维知识库系统还能具备个人知识的学习、员工的在线培训和考试、知识问答等功能,提升运维工作的支持效率,加强了内部交流和知识积累。

本文来源:https://www.2haoxitong.net/k/doc/44309a694431b90d6c85c7a6.html

《信息化建设解决方案之运维篇.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式