最新IT运维服务管理体系资料

发布时间:2019-10-30 07:39:04   来源:文档文库   
字号:

IT运维服务管理体系

IT运维服务管理体系参照国际标准化组织相关标准,并结合国内IT运维的实际情况及需求而制定。

1 总则

IT运维服务管理体系包括IT运维服务模型与模式、IT运维服务管理体系、IT运维服务支撑要求以及IT运维服务和管理能力评估与提升途径。

2 参考标准

(1) ISO/IEC 20000-1:2005 信息技术服务管理-第1 部分:规范

(2) ISO/IEC 20000-2:2005 信息技术服务管理-第2 部分:实施指南

(3) ISO/IEC 27001:2005 信息技术 安全技术 信息安全管理体系要求

(4) GB/T XXXX (200X) 信息安全技术 信息系统安全等级保护定级指南

(5) GB/T XXXX (200X) 信息安全技术 信息系统安全等级保护基本要求

(6) GB/T XXXX (200X) 信息安全技术 信息系统安全等级保护实施指南

3 术语、定义和缩略语

3.1 术语和定义

3.1.1 IT运维服务

IT运维服务是指IT运维服务供应商或IT运维部门综合利用各种IT运维支撑工具提供的确保IT基础设施和应用系统正常、安全、高效、经济运行的服务。本体系规定的IT运维服务包括IT基础设施运维服务、IT应用系统运维服务、安全管理服务、网络接入服务、内容信息服务以及综合管理服务。

3.1.2 IT运维服务管理流程

IT运维服务管理流程是指为了支持IT运维服务的实现和提供,以确定的方式执行或发生的一系列有规律的行动或活动。

3.1.3 IT运维服务管理体系

参与IT运维的各方为支持IT运维服务目标所使用的信息化工具,是支撑IT运维服务实施的平台。

3.2 缩略语

ISO International Organization for Standardization 国际标准化组织

IT Information Technology 信息技术

ITIL Information Technology Infrastructure Library IT 基础架构库

OA Office Automation 办公自动化

SLA Service Level Agreement 服务级别协议

SNMP Simple Network Management Protocol 简单网络管理协议

SMI Structure of Management Information 管理信息结构

WMI Windows Management Instrumentation 视窗管理规范

4 编制原则和方法

本系列规范采用ISO20000系列标准的思想,并参考ITIL框架规定的方法进行编制。IT运维服务管理框架如图1所示。

1 IT运维服务管理框架

IT运维服务管理框架包括IT运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

IT运维服务管理框架以ITIL/ISO20000为基础,以适应各种管理模式为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对IT运维服务全过程的体系化管理。

5 IT运维服务模型与模式

IT运维服务模型由IT运维管理对象、IT运维服务提供者和IT运维服务使用者三个层面组成。IT运维管理对象主要包括IT资源和使用IT服务的IT用户两类元素;IT运维服务提供者由IT运维服务管理体系和IT运维人员构成;IT运维服务使用者主要是指IT运维服务的使用和管理人员。他们之间的逻辑关系如图2所示。

2 IT运维服务模型

在该运维服务模型中,IT资源及IT用户共同构成IT运维管理的对象,对IT资源的使用体现为IT服务,IT用户是IT服务的使用者;作为IT运维服务的提供者,IT运维人员使用IT运维服务管理体系,并通过IT运维服务管理体系与IT运维管理对象之间的接口交互管理信息,对所负责的IT运维管理对象进行管理;IT运维服务提供者与不同的IT运维服务使用者之间分别签署不同级别的服务协议,并根据服务协议的规定提供相应的IT运维服务,IT运维服务的使用和管理人员代表IT运维服务使用者,按照相关的服务协定使用和管理IT运维服务。

在实际的运维过程中,由于参与IT运维活动的往往是多个企业或者部门,而且这些企业或者部门往往承担模型中的一个或者几个角色,这就构成了多种多样的IT运维服务模式。典型的IT运维服务模式存在如下几种形式:

3a 自运维环境 3b 完全外包运维环境

3c 混合运维环境

(1) 自运维模式:IT资产拥有企业自行负责对所拥有的所有IT资源的运维工作。一般情况下,相关的维护工作由本企业IT部门负责,即本企业IT部门为本企业提供IT运维服务,这种模式下的运维环境如图3a所示。

(2) 完全外包运维模式:IT资产拥有企业通过与其他企业签署运维外包协议,将所拥有的全部IT资源的运维工作外包给其他企业,即外包企业为本企业提供IT运维服务。一般情况下,由本企业IT部门负责运维外包管理工作,这种模式下的运维环境如图3b所示。

(3) 混合运维模式:IT资产拥有企业对所拥有的一部分IT资源自行运维;同时,通过与其他企业签署运维外包协议,将所拥有的另一部分IT资源的运维工作外包给其他企业。一般情况下,由本企业IT部门负责运维工作和外包管理,即本企业IT部门和外包企业共同向本企业提供IT运维服务,这种模式下的运维环境如图3c所示。根据企业的管理特点,企业根据IT基础设施和应用系统的实际特点、自身组织机构设置情况采用自运维模式或者混合运维模式,通常不采纳完全外包运维模式。在混合运维模式下,根据运维服务是否涉及各企业的核心业务、关键任务等因素,对外包服务管理的具体要求各不相同。对涉及核心业务或关键任务的外包服务,需要对外包服务的过程和结果进行精细化管理;对只涉及非核心业务和非关键任务的外包服务,只需要对外包服务的结果进行粗放型管理。由上述运维环境的分析可以看出自运维模式是混合运维模式的一种特例。因此,本系列规范将基于混合运维模式环境规定IT运维服务管理支撑系统应用需求和技术要求,相关的应用需求和技术要求也同样适应于其他运维模式。

6 IT运维服务管理体系

IT运维服务管理体系规定了IT运维活动涉及的各类实体,以及这些实体间的相互关系。相关的实体按照IT运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的IT运维服务。

组成IT运维服务管理体系的实体包括运维服务管理对象、运维活动角色及运维管理组织结构、运维服务管理流程、运维服务支撑系统和运维服务五个要素。

IT运维服务管理对象主要包括IT基础设施、IT应用系统、IT用户和IT供应商。广义概念下,有时也将企业内部从事IT运维活动的部门和人员作为运维服务管理对象。

IT运维活动角色是指从事IT运维活动的所有企业、部门或者具体工作人员,一般包括IT运维服务提供者、IT运维服务使用者、以及IT运维服务管理者三类角色。各类角色在IT运维活动中所构成的组织形式构成了IT运维管理组织结构。

IT运维服务管理流程是指联系IT运维服务提供者、IT运维服务使用者以及IT运维服务管理者之间开展规范化协同工作的机制和方法。完整的IT运维服务管理流程应该覆盖IT运维服务的规划、设计、运行和持续改进等各个环节,本系列规范主要规定支撑IT运维服务运行阶段的相关流程。IT运维服务管理流程的信息化可借助IT运维服务支撑系统得以实现。

IT运维服务管理系统是支撑IT运维管理组织中各运维角色按照规定的IT运维流程开展IT运维活动的信息化系统。一方面,IT运维服务管理系统要支持IT运维服务提供者对IT运维服务管理对象进行管理,以实现IT运维服务的能力;另一方面,要支持IT运维服务提供者按照商定的服务级别协议方便地向IT运维服务使用者提供IT运维服务;同时,要支持IT运维服务管理者对整个IT运维服务的考核、监督和评估。

IT运维服务IT运维服务提供者向IT运维服务使用者提供的服务产品,相关的IT运维服务质量应该可度量,服务提供方式应该符合规定的流程。在本部分中规定的IT运维服务包括IT基础设施运维服务、IT应用系统运维服务、安全管理服务、网络接入服务、内容信息服务以及其他综合管理服务。IT 运维服务的自动化实施需要依靠IT运维服务支撑系统。

组成IT运维服务管理体系的五个要素的详细组成及其相互关系如图4所示。

4 IT运维服务管理体系

6.1 IT运维服务管理对象

IT运维服务管理对象包括IT基础设施、IT应用系统、IT用户、IT供应商、以及IT运维部门和人员,具体内容如下:

(1) IT基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等。

(2) IT应用系统包括OA及内部办公系统、政府网站、面向企业和组织的应用系统、面向公众的应用系统等。

(3) IT用户包括使用如上IT应用系统的用户。

(4) IT供应商包括IT基础设施和应用系统的供应商以及IT运维服务的供应商。

(5) IT运维部门和人员包括相关企业参与IT运维活动的相关部门和人员,以及提供IT运维服务的企业和相关人员。

管理对象类别

管理对象

IT基础设施

网络类:交换机、路由器、通信链路、其他网络设备组件、网络软件等;

主机系统类:小型机、服务器、主机系统设备组件、主机系统软件、数据库系

统、中间件等;

存储、备份系统类:存储设备、备份设备、备份软件等;

终端系统类:台式机、笔记本、打印机、扫描仪、其他办公设备、终端设备系

统软件和应用软件等;

安全系统类:安全设备、安全管理软件等;

机房环境类:机房专用精密空调、机房专用不间断电源、机房环境设备组件等。

IT应用系统

OA及内部办公系统;

政府网站;

电子政务核心应用:面向企业和组织的应用系统、面向公众的应用系统等。

IT用户

企业内部用户;

企业外部用户。

IT供应商

包括IT基础设施供应商、IT应用系统供应商、IT运维服务供应商等。

IT运维部门和人员

IT运维部门和人员;

IT运维管理部门和人员;

IT运维服务供应商和人员。

1 IT运维服务涉及的管理对象

6.2 IT运维活动角色及IT运维管理组织结构

从事IT运维活动的所有企业、部门以及具体工作人员构成IT运维活动角色,企业、部门和人员的结构良好而有力的组织形式是提供IT运维服务的重要保障。

6.2.1 IT运维活动角色

IT运维服务管理主要涉及3类角色:IT运维服务提供者、IT运维服务使用者、以及IT运维服务管理者。

在自运维模式下,运维部门作为IT运维服务提供者负责为本企业提供IT运维服务,IT运维部门可借助或不借助IT运维服务管理体系对IT基础设施、IT应用系统、IT用户和IT供应商实施管理。该模式下,IT运维管理部门负责对IT运维服务的设计、评估和改进。

在完全外包的运维模式下,IT运维服务供应商作为IT运维服务提供者,遵照其与购买服务的IT运维管理部门签订的服务级别协议提供IT运维服务。IT运维服务供应商可借助或不借助IT运维服务管理体系对IT基础设施、IT应用系统、IT用户和IT供应商实施管理。IT运维服务供应商负责所承担的IT运维服务的设计、实施、评估和改进。该模式下,IT运维管理部门作为IT运维管理者负责对IT运维服务的选择、使用和评估。

在混合运维模式下,IT运维服务供应商的职责与完全外包运维模式下相同,IT部门则综合了IT运维部门和IT运维管理部门的职责。

在各种运维模式下,IT运维部门和IT用户都是IT运维服务的使用者。

6.2.2 IT运维管理组织结构

为实现以流程为导向、客户满意和服务品质为核心的IT运维服务管理,并适应不同运维模式下的管理需要,IT部门需采取合理、高效的IT运维管理组织结构。一般情况下,IT运维管理组织由运维领导工作组和运维执行工作组构成。

领导组的负责人应由企业信息化主管领导担任,成员由业务部门和信息化部门具有决策权的领导或者代表构成。在采用外包模式的情况下,领导组还应包括IT运维服务供应商代表。

执行组成员由企业信息化部门人员构成。在采用外包模式的情况下,执行组还应包含IT运维服务供应商参与运维的人员。

组织结构的构成要素与IT运维活动角色相对应。其中,运维领导工作组对应于IT运维服务管理者,运维执行工作组对应于IT运维服务提供者和使用者。

6.3 IT运维服务管理流程

IT运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范。

6.3.1 服务台

服务台是支持IT运维服务的核心功能,与各个流程联系密切。所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员。

6.3.2 事件管理

事件管理流程的主要目标是尽快恢复IT服务提供并减少其对业务的不利影响,尽可能保证最好的IT服务质量和可用性等级。事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。

6.3.3 问题管理

问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,负责确保解决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息。

6.3.4 配置管理

配置管理流程负责核实IT基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态。

6.3.5 变更管理

变更管理实现所有IT基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。

6.3.6 发布管理

发布管理负责对硬件、软件、文档、流程等进行规划、设计、构建、配置和测试,以便为实际运行环境提供一系列的发布组件,并负责将新的或变更的组件迁移到运行环境中。其主要目标是保证运行环境的完整性被保护以及正确的组件被发布。

6.3.7 服务级别管理

负责协商并记录所提供的服务、相应的服务级别目标以及工作量特性,协商并记录服务级别协议、支撑服务约定、供方合同以及相应的程序。服务级别管理还监视并报告服务级别,支持查看和定期的评审,以确保服务级别协议的更新和持续有效。

6.3.8 财务管理

财务管理负责管理服务提供的成本,制定预算、帐务和收费需求。

6.3.9 能力管理

能力管理是通过优化服务成本、安排采购时间和部署IT资源,从而履行与客户签定的协议。能力管理主要涉及资源管理、性能管理、需求管理、模拟测试、能力规划、负载管理以及应用选型。能力管理主要通过重点关注需求的规划和整合,从而确保约定的服务级别可以实现。

6.3.10 可用性管理

可用性管理流程负责定义、分析、计划、测量和改进服务的所有可用性方面,从而保证IT基础设施、流程、工具、角色等与协议达成的服务级别中的可用性目标相适应。

6.3.11 服务持续性管理

服务持续性管理流程的目标是确保向客户承诺的协商一致的服务持续性在任何风险下都能得到满足。该流程负责管理可能严重影响服务的风险,制定服务持续性计划并定期评审。

6.3.12 知识管理

知识管理流程负责搜集、分析、存储和共享知识和信息,其主要目的是通过确保提供可靠和安全的知识和信息以提高管理决策的质量。

6.3.13 供应商管理

供应商管理目标是管理供应商及其所提供的服务。该流程负责供应商信息维护,以及对供应商的归类和评估。

6.4 IT运维服务

IT运维服务的提供者基于服务级别协议(SLA)向IT运维服务的使用者提供各类IT运维服务。不同服务级别对应的服务质量指标是服务级别协议的重要组成部分。服务质量指标体现服务供应商所提供的IT 运维服务的质量。

6.4.1 IT运维服务分类

IT 运维服务可分为IT 基础设施运维服务、IT 应用系统运维服务、安全管理服务、网络接入服务、内容信息服务和综合管理服务等。

6.4.1.1 IT 基础设施运维服务

IT基础设施运维服务对IT基础设施进行监视、日常维护和维修保障。服务涉及的基础设施包括网络系统、主机系统、存储/备份系统、终端系统、安全系统、机房动力及环境等。

6.4.1.2 IT 应用系统运维服务

应用系统运维服务对应用系统进行设计、集成、维护及改进。应用系统运维服务涉及的应用系统包括OA及内部办公系统、政府网站、面向企业和组织的应用系统、面向公众的应用系统等。

6.4.1.3 安全管理服务

安全管理服务对IT环境涉及的网络、应用系统、终端、内容信息的安全进行管理,包括安全评估、安全保护、安全监控、安全响应及安全预警等服务。

6.4.1.4 网络接入服务

网络接入服务提供网络规划和接入,包括互联网接入服务、专网接入服务等。

6.4.1.5 内容信息服务

内容信息服务对内容信息进行采集、发布、巡检、统计、编辑、信息挖掘以及汇报,为内容信息的获取和进一步处理提供支持。

6.4.1.6 综合管理服务

综合管理服务包括咨询与培训服务、技术支持服务、综合系统服务等。

6.4.2 IT运维服务的质量指标

服务质量指标要根据各企业的需求可定制、可扩充。各类IT 运维服务的质量指标通常包括但不限于:

(1) IT基础设施和应用系统运维服务

监控类服务:异常报告及时率、异常漏报率等。

日常维护类服务:维护作业计划的及时完成率、故障隐患发现率、异常主动发现率、故障服务请求及时满足率、业务服务请求及时满足率、问题解决率等。

维修保障类服务:服务响应及时率、到达现场及时率、故障修复及时率。

(2) 安全管理服务:漏洞扫描覆盖率、安全报告呈报及时率、安全漏洞遗漏数量、安全漏洞遗漏率、加固设备覆盖率、安全补丁安装及时率、安全事件次数等。

(3) 网络接入服务:平均响应时间、问题解决比率等。

(4) 内容信息服务:检索成功率、响应及时率等。

(5) 综合管理服务:平均响应时间、问题解决比率等。

6.5 IT运维服务管理和支撑能力要求

6.5.1 IT运维服务管理和支撑能力分类

IT运维服务管理和支撑能力体现在6个维度,他们分别是:资产管理能力、监控管理能力、安全管理能力、流程管理能力、综合管理能力以及外包管理能力,如图 4所示。

4 IT运维服务管理和支撑能力

其中,资产管理能力支持对各类IT基础设施和应用系统的类型、归属、费用、使用情况等资产相关信息的维护和统计工作,实现IT资产生命周期管理,支持对IT资源投资和维护的辅助决策。

监控管理能力支持对IT基础设施和应用系统的监控,对资源进行直观呈现和调度、对告警进行实时处理、对故障进行预警,具体能力包括视图管理、配置管理、故障管理和性能管理等。

安全管理能力支持通过权限控制、访问和操作日志、通信和操作管理等方法,实现信息安全事件管理、风险评估和等级保护。

流程管理能力支持采用各类电子化手段将IT运维服务支撑系统、IT运维部门和人员、IT用户等角色有机联系在一起,保证整个IT运维活动规范、有序、闭环地执行。流程管理包括服务台能力以及配置管理、变更管理、事件管理、问题管理、发布管理、服务级别管理、知识管理、财务管理、供应商管理、值班管理、作业计划管理、考核管理、应急预案管理和培训管理等各管理流程。

综合管理能力支持在资产管理、监控管理、安全管理、流程管理和外包管理等能力的基础上,实现IT整体运维信息统计分析,并对管理决策提供支持。

外包管理能力对外包IT运维服务的质量、效果和过程实施控制。

6.5.2 IT运维服务管理和支撑能力等级划分

6.5.1节规定了IT运维服务企业或者部门可以具备的IT运维服务管理和支撑能力的全集,在本企业或者部门运维服务管理和支撑能力的实际提升过程中,根据不同阶段所具备的运维服务管理和支撑能力的不同,可以在6个维度上分别评估或界定其达到的运维服务管理和支撑能力成熟度等级。结合各企业的实际情况,建议分别对其具备的资产管理、监控管理、安全管理、流程管理、综合管理、外包管理等IT运维服务管理和支撑能力按照如下等级进行划分:

(1) 资产管理能力成熟度等级划分

在覆盖所有IT资产管理信息的前提下,依据所实现的IT资产管理能力的不同,资产管理能力成熟度划分为2个等级,具体如表 2 所示。

2 资产管理能力等级划分

各等级具备的能力和提升方式如下:

等级1,实现静态资产信息的维护、资产信息的分析统计、资产生命周期管理并支持辅助决策;

等级2,在等级1的基础上实现资产信息的自动采集和更新。

(2) 监控管理能力成熟度等级划分

依据监控管理的主动性和实时性程度的不同,监控管理能力成熟度划分为2个等级,具体如表 3 所示。

3监控管理能力等级划分

各等级具备的能力和提升方式如下:

等级1,实现基于事件触发的IT基础设施和应用系统的监控,对IT资源进行定期巡检;

等级2,借助监控工具实施对IT基础设施和应用系统的实时、主动监控。

(3) 安全管理能力成熟度等级划分

依据安全管理内容范围的不同,安全管理能力成熟度划分为2个等级,具体如表 4 所示。

4 安全管理能力等级划分

各等级具备的能力和提升方式如下:

等级1,实现人员和资产的安全管理,包括对环境、介质、资产、备份/恢复等安全制度的建立和执行;

等级2,在等级1的基础上,实现网络和系统行为的安全管理,包括信息系统的安全防护,安全状态监控、分析和报告,安全事件管理等。

(4) 流程管理能力成熟度等级划分

依据流程管理的规范化程度以及信息化支持程度的不同,流程管理能力成熟度划分为2个等级,具体如表 5 所示。

5 流程管理能力等级划分

各等级具备的能力和提升方式如下:

等级1:基于规范的流程开展IT运维活动,但流程尚未信息化;

等级2:可以通过信息化手段对IT运维的业务流程提供支持。

(5) 综合管理能力成熟度等级划分

依据其实现的综合管理能力范围的不同,综合管理能力成熟度划分为2个等级,具体如表 6 所示。

6 综合管理能力等级划分

各等级具备的能力和提升方式如下:

等级1:实现统计分析能力;

等级2:在等级1的基础上实现决策支持的能力。

(6) 外包管理能力成熟度等级划分

依据对服务外包控制程度的不同,外包管理能力成熟度划分为2个等级,具体如表 7 所示。

各等级具备的能力和提升方式如下:

等级1:实现对外包服务质量和效果的控制;

等级2:在等级1的基础上实现对外包服务提供过程的控制。

7 外包管理能力等级划分

6.5.3 IT运维服务管理和支撑能力组合

对于本企业IT运维服务管理和支撑能力的评价,可以通过对6.5.2节中定义的6个维度的不同等级进行界定。不同维度、不同等级的IT运维服务管理和支持能力可以灵活组合以适应不同企业的不同应用场景。表 8 列出了IT运维的几种典型的场景,以及在这些场景下,相应的IT运维服务管理和支撑能力的组合:

(1) 场景1具备静态资产信息管理能力,对IT资源实施被动监控和定期巡检,实现对人员和资产的安全管理,基于规范的流程开展IT运维活动,但流程尚未信息化,具备统计分析的能力;

(2) 场景2具备静态资产信息管理能力,对IT资源实施被动监控和定期巡检,实现对人员和资产的安全管理,基于规范的流程开展IT运维活动,但流程尚未信息化,具备统计分析的能力,可实现对外包的结果控制管理;

(3) 场景3具备静态资产信息管理能力,对IT资源实施被动监控和定期巡检,实现对人员和资产的安全管理,可通过信息化手段对IT运维的业务流程提供支持,具备统计分析的能力,并可实现对外包的结果控制管理;

(4) 场景4具备静态资产信息管理能力,对IT资源实施被动监控和定期巡检,实现对人员和资产的安全管理,可通过信息化手段对IT运维的业务流程提供支持,具备统计分析和决策支持的能力,可实现对外包的结果和过程控制管理;

(5) 场景5 具备静态和动态资产信息管理能力,对IT资源实施主动监控和实时监视,实现对人员和资产的安全管理,以及对网络和系统行为的安全管理,可通过信息化手段对IT运维的业务流程提供支持,具备统计分析和决策支持的能力,可实现对服务外包的结果和过程的控制管理。在其管理和支撑能力提升过程中,各企业可从上述五个场景中选取之一作为其基线场景,并可根据实际需求,在该基线场景的基础上增、减相应的能力。此外,除了上述典型场景对应的能力组合方式外,各企业也可根据实际需求灵活采取其他组合方式。

8 IT运维的典型场景和相应的能力组合

7 IT运维服务支撑系统要求

IT运维服务支撑含资产管理、监控管理、安全管理、流程管理、综合管理、外包管理等6大方面,为实现企业IT运维服务管理和支撑能力的信息化,必须建立与企业IT运维服务管理和支撑能力相匹配的IT运维服务支撑系统。相应的,IT运维服务管理和支撑能力映射为IT运维服务支撑系统的功能。

7.1 资产管理

资产管理功能应实现对网络设备、服务器、PC、打印机、各种配件(显示器、显卡、网卡、硬盘)、软件、备品备件等IT 资产信息的维护、统计以及资产生命周期管理。根据资产信息获取方式的不同,资产管理可划分为静态资产信息管理和动态资产信息管理。

7.1.1 静态资产信息管理

7.1.1.1 资产信息维护

系统应支持资产信息的维护,包括资产信息的获取与更新、查询、导出和打印。功能要求如下:

- 资产信息获取与更新:系统应支持多种形式的数据导入;系统应支持资产信息的增加和删除,支持资产信息的手工录入和修改功能;

- 资产信息查询:系统应允许用户设定单个或者多个条件的组合进行资产信息过滤查询,并以表格和图形的方式呈现;系统应允许模糊查询;

- 资产信息导出与打印:系统应支持将查询出的资产信息导出为通用格式文件进行保存,应具有将查询出的资产信息进行打印的功能。

7.1.1.2 资产信息分析统计

系统应实现IT资产信息的统计分析功能,具体包括:

- 系统应支持IT资产信息的统计分析,并以表格、饼图、直方图或趋势线等方式进行显示,并提供保存和打印功能;

- 系统应实现各类IT资产的利用率计算功能,以反映资产的使用情况,辅助用户合理使用资产;应实现基于资产生命周期状态的统计功能;

- 系统应支持将资产信息的分析统计结果向信息化管理部门和财务部门汇总和同步。

7.1.1.3 资产生命周期管理

系统应实现对IT资产的采购、入库、维修、借调、领用、折旧、报废等生命周期各阶段的管理功能。

7.1.1.4 辅助决策

系统应能对资产信息进行分析和计算,分析和计算的结果可作为辅助决策的依据,包括:

- 系统应具有预警功能,如资产过保修期预警、资产报废预警等;

- 系统应支持基于规则的运维费用的计算,运维费用包括资产维护费用和相关的维护人员费用,应支持计算规则的灵活调整。

7.1.2 动态资产信息管理

动态资产信息管理在静态资产信息管理的基础上应支持资产信息的自动发现和采集,资产信息的自动同步和更新。

7.2 监控管理

监控管理包括对IT基础设施和应用系统的监控管理,实现IT基础设施和应用系统的视图管理、配置管理、故障管理和性能管理等功能。

7.2.1 视图管理

系统应以图形方式呈现IT基础设施和应用系统的信息。能够动态实时显示各类资源的运行状态,方便用户直观地了解资源的分布与状态信息以及对网络中的资源进行监控。各类视图之间应能灵活进行关联。系统应支持以下视图:

- 网络拓扑图:以地理视图、层次图等方式显示物理、逻辑网络拓扑结构;

- 机房平面图:提供机房内设备物理摆放位置的视图;

- 机架视图:提供设备在机架上物理摆放位置的视图;

- 设备面板图:对被管理的设备应以与设备同样的物理构成直观进行显示。对不同类型的设备应该提供模版,方便设备面板图的维护,设备面板图应同时可以显示正面面板和背面面板;

- 应用拓扑视图:呈现从用户、应用系统到IT 基础设施间的依赖关系;

- 自定义视图:支持灵活的视图自定义管理功能,管理员可新增、编辑、删除拓扑图。支持用户自定义应用系统的基本信息、组成部件、依赖的基础服务、与硬件设备的关系、使用该应用系统的企业和用户信息。支持视图元素的星形、圆形、树形自动排列,并支持按照左、右、中间方式进行对齐。

系统应支持拓扑视图与故障、性能等功能的关联,能够在拓扑图上直观地显示被管资源的运行状态,并且支持告警的传递显示。

系统应支持把视图导出为Visio 格式和图片格式的文件。

7.2.2 配置管理

系统应实现IT 基础设施、应用、人员和供应商等各类资源信息的维护和分析统计,以及配置信息的下发等功能。具体包括:

- 资源信息维护:系统应支持对动态资源信息的自动采集,以及方便的静态资源信息手工录入,并支持对资源信息的更新、同步等维护手段;

- 资源模型编辑:系统应支持资源管理模型的编辑功能,通过模型的编辑工具,可快速实现管理功能的调整;

- 可视化监控:系统应支持提供直观的可视化管理功能,通过形象的展现方式直观展现设备工作情况;

- 配置信息下发和配置文件管理:系统应支持对可配置资源管理信息的下发控制。支持通过一个按钮即可快速批量设置整个IT 环境的工作模式。

系统应支持对网络设备配置文件的管理功能,包括配置文件上传、配置文件下载以及配置文件比较等功能;

- 资源信息统计分析:系统应支持对资源信息进行灵活查询与统计,报表统计的结果应能以图形(如直方图、曲线图、饼图等)或表格方式显示。

7.2.3 故障管理

系统应完成对IT 基础设施和应用系统的故障管理功能,包括告警信息采集、处理、显示、清除和故障定位等功能,系统应提供故障知识库功能。具体包括:

- 系统应支持告警信息的实时采集,支持对IT 基础设施和应用系统等资源的运行状态进行任务化的监视,支持设置不同的任务执行策略,完成不同监测粒度的需要;

- 系统应支持告警的过滤、升级和压缩,并支持用户对告警过滤、升级和压缩条件的灵活设置;

- 系统应将用户关心的告警信息以列表、视图、颜色等形式呈现给运维人员,并支持对告警显示过滤条件的灵活设置;

- 系统应支持将这些事件信息通过电子邮件和短信息的方式及时告知相关运维人员,并支持信息发布规则的灵活设置,包括设置首次前转条件、间隔前转条件、延时前转条件、升级前转条件等;

- 系统应提供故障根原因分析手段,能够准确定位网络故障的根原因,能够自动压缩重复告警,记录告警的重复次数;

- 系统应提供自动和手动的告警清除功能,应支持灵活设置自动清除的周期和清除时保留的告警时间窗口;

- 系统应记录故障发生的现象和处理的方法,为管理人员提供故障处理经验库。当故障发生时,能够方便地查看该类故障的处理经验。

7.2.4 性能管理

系统应完成对IT 基础设施和应用系统的性能管理功能,包括性能数据采集、处理、统计分析和性能门限管理等功能。具体包括:

- 系统应支持采用任务方式对IT 基础设施和应用系统进行性能数据采集,性能数据应反映IT 基础设施和应用系统的运行情况和运行质量,系统应支持对性能数据采集任务进行灵活的设置;

- 系统应支持对不同的性能指标进行阈值设置,提供相应的阈值管理和越限告警机制,系统应支持按照对象类型和针对具体对象两种方式设置性能门限;

- 性能数据可保存到数据库中,实现统计、分析和比较功能,统计、分析和比较的结果应支持图形呈现,应能生成性能趋势曲线;系统应支持同时选中多个对象,在同一坐标系中进行性能趋势对比,对比曲线应支持直接存为图片;

- 性能数据趋势分析应支持性能门限提醒功能。在性能趋势分析图中,应绘制出该对象的性能门限阈值线。

7.3 安全管理

系统的安全管理功能对应于可以通过信息化手段实现的安全管理支撑能力,安全管理应包括但不限于通信及操作管理、访问控制、信息安全事件管理以及风险评估和等级保护。在具体实施中应依据信息安全管理体系和信息系统安全等级保护的相关国家标准。安全管理功能应与流程管理中的事件管理和问题管理相关联。

7.3.1 通信及操作管理

系统应支持防范恶意代码和移动代码;支持依据既定的备份策略对信息和软件进行备份并定期测试;应能对网络进行充分的管理和控制,以防范威胁、保持使用网络的系统、应用程序和信息传输的安全;系统应支持对可移动媒体的管理;支持对通过物理媒体、电子消息以及业务信息系统交换的信息进行安全控制;系统应具有审计日志、管理员和操作者日志、错误日志等日志功能,并提供对日志信息的保护、分析和呈现。

7.3.2 访问控制

系统应支持对网络访问的控制,包括远程用户的鉴别、网络设备识别、诊断和配置端口的物理和逻辑访问控制、网内隔离、网络连接控制和网络路由控制等;系统应支持对应用系统和信息的访问控制,进行统一集中的身份认证、授权和审计;系统应支持移动计算和远程工作管理。

7.3.3 信息安全事件管理

系统应能发现并报告信息安全事件,并对安全事件做出响应;系统应能跟踪、记录安全事件及其处理过程;系统应支持对安全事件的统计分析,能够量化安全事件的类型、数量、成本,并支持统计分析结果的输出。

7.3.4 风险评估和等级保护

系统支持安全风险的评估以及评估结果的上报,支持依据评估结果生成相应的等级保护方案,等级保护的方案应可映射到环境、资产、设备、网络、系统等安全系统运维的各个方面,系统应支持等级保护方案的上报。

7.4 流程管理

系统应支持服务台功能,支持配置管理、变更管理、事件管理、问题管理、发布管理、服务级别管理、知识管理、财务管理、供应商管理等标准流程,以及值班管理、作业计划管理、考核管理、应急预案管理、培训管理等辅助流程。

7.4.1 服务台

服务台是IT 运维服务提供者与用户间的单一联系点。服务台管理事件和服务请求,实现与用户的沟通。服务台应实现以下功能:

- 支持通过电话、网络、电子邮件等方式向用户提供单点联系接口;

- 支持对所有的故障和服务申请进行预处理,检查用户输入信息的正确性和完整性;

- 支持用户通过服务台咨询、短信或电子邮件等方式了解投诉或服务申请的处理过程;

- 支持对故障和服务申请的跟踪,确保所有的故障和服务申请能够以闭环方式结束;

- 能够提供对知识库的查询功能。

7.4.2 配置管理

配置管理流程负责核实IT 基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来,确保配置管理数据库能够准确地反映现存配置项的实际版本状态。系统应支持以下功能:

- 支持对配置项的登记和管理;

- 支持对配置项属性的记录,如序列号、版本号、购买时间等;

- 支持配置项间关系的建立和维护;

- 支持配置项及其关系的可视化呈现;

- 支持对配置管理数据库访问权限的控制;

- 支持对配置项变更的历史审计信息的记录和查询;

- 支持配置项的状态管理;

- 支持针对配置项的统计报表;

- 支持与事件管理、问题管理、变更管理等其他管理流程的集成。

7.4.3 变更管理

变更管理实现所有IT 基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。系统应支持以下功能:

- 创建并记录变更请求:系统应支持信息的输入,并确保只有授权的人员方可提交变更请求;

- 审查变更请求:系统应支持对变更请求进行预处理,过滤其中完全不切实际的、不完善的或之前已经提交或拒绝的变更请求;

- 变更请求的归类和划分优先级:系统应支持基于变更对服务和资源可用性的影响决定变更的类别,依据变更请求的重要程度和紧急程度进行优先级划分;

- 系统应支持对变更请求的全程跟踪和监控,支持在变更全程控制相关人员对变更请求的读、写、修改、访问;

- 系统应支持将变更请求分派到合适的授权人员;

- 系统应支持对变更请求的审批流程,并支持对变更请求的通知和升级处理;

- 系统应提供可定制的管理报表,如按类型、级别对变更进行统计和分析、变更实施的成功率、失败率等等;

- 支持与事件管理、问题管理、配置管理等其他管理流程的集成。

7.4.4 事件管理

事件管理负责记录、快速处理IT 基础设施和应用系统中的突发事件。事件管理应支持自定义事件级别、事件分类,提供方便的事件通知功能,支持对事件进行灵活的查询统计。并可以详细记录事件处理的全过程,便于跟踪了解事件的整个处理过程。事件管理应支持以下功能:

- 支持事件记录的创建、修改和关闭;

- 支持向事件记录输入描述和解决方案信息,支持创建事件记录时自动记录创建时间、创建日期和事件流水号;

- 支持将事件记录自动分派到相应支持组和个人;

- 提供对事件记录的查询功能;

- 支持灵活定制相关报表,可利用历史事件记录生成管理报表;

- 支持与问题管理、配置管理、变更管理等其他管理流程的集成。

7.4.5 问题管理

问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。系统应支持以下功能:

- 支持问题记录的创建、修改和关闭,创建问题记录时自动记录创建时间、日期;

- 支持对事件、问题和已知错误的区分;

- 支持自动分派问题记录到定义的支持组或个人;

- 支持对问题记录定义严重等级和影响等级;

- 支持对问题记录的跟踪和监控;

- 支持生成可定制的管理报表;

- 支持向问题记录输入描述和解决方案信息;

- 提供对问题记录的查询功能;

- 支持与变更管理、配置管理、事件管理等其他管理流程的集成。

7.4.6 发布管理

发布管理负责对硬件、软件、文档、流程等进行规划、设计、构建、配置和测试,以便为实际运行环境提供一系列的发布组件,并负责将新的或变更的组件迁移到运行环境中。其主要目标是保证运行环境的完整性被保护以及正确的组件被发布。系统应支持以下功能:

- 支持发布的分发和安装;

- 支持与配置管理、变更管理、服务级别管理等流程的集成。

7.4.7 服务级别管理

服务级别管理提供IT 部门和IT 运维服务供应商之间关于IT 运维服务的提供质量的约定、检查功能,其目标在于确保所有当前的及双方协议过将要交付的IT 运维服务的提供处于协议水平。系统应支持以下功能:

- 服务级别协议(SLA)模板定制功能:系统应能提供统一创建、浏览、修改和删除SLA 模板的功能;

- SLA 违例通知功能:一旦发生SLA 违例情况,系统应及时发送通知给IT 运维服务的相关各方;

- SLA 报告生成功能:系统应支持SLA 报告自动生成功能,并支持将生成的报告自动推送给IT 运维服务的相关各方;

- 支持生成可定制的管理报表。

7.4.8 知识管理

知识管理流程负责搜集、分析、存储和共享知识和信息,其主要目的是通过确保提供可靠和安全的知识和信息以提高管理决策的质量。知识管理应支持以下功能:

- 添加知识:提供支持人员提交经验和知识输入的接口或界面,支持Word/Excel/TXT 等格式文档作为附件的输入;

- 支持知识库的更新;

- 查询知识:提供完善的查询功能,如查询关键字、知识列表等;

- 提供模糊匹配、智能查询、点击统计等增强功能。

7.4.9 财务管理

财务管理完成预算编制、审核、批复和下发等功能,实现对费用支出的管理,实时监管每一笔费用的支出,并对超出预算或异常的费用及时给出预警提示,实现从预算到使用,再到考核的闭环管理。财务管理应提供如下功能:

- 费用预算制定;

- 费用申请管理;

- 费用执行管理;

- 费用考核管理。

7.4.10 供应商管理

供应商管理流程管理供应商及其所提供的服务,系统应支持以下功能:

- 供应商信息的录入、查询、增删、分类等;

- 对供应商进行定期评估,并支持对评估结果的查看;

- 对合同信息的录入、查询、增删、分类等;

- 对合同执行情况的定期评价和统计汇总。

7.4.11 辅助流程

7.4.11.1 值班管理

系统应支持对值班的管理,应实现以下功能:

- 值班信息的记录:值班信息应包括班次编号、值班人、记录时间、监控项是否正常、问题及处理等。

- 值班信息的查询;

- 值班信息的统计。

7.4.11.2 作业计划管理

系统应支持对作业计划的管理,实现以下功能:

- 提供基于模板的作业计划制定功能,快速完成作业计划(年计划、月计划)的制定;

- 对于待执行的作业计划,系统提供自动提醒功能;

- 对于作业计划的执行情况,系统提供统计分析功能。

7.4.11.3 考核管理

系统应支持对员工工作量、工作绩效进行考核,并对考核结果进行统计分析,应实现以下功能:

- 支持对工作任务、工时和工作完成情况等信息的收集;

- 综合工作任务类别、工时和任务完成情况对员工的工作量和工作绩效进行量化;

- 对任务类别、工时、任务完成情况、工作量等信息进行分析统计,如分析工时、工作量、工作任务的分布和比例等。

7.4.11.4 应急预案管理

系统应支持针对重大故障和灾难的应急预案的管理,应实现以下功能:

- 支持应急预案的制定、审批、更新、批准执行等流程;

- 支持应急预案的输入、修改、删除、查询;

- 支持应急预案操作人员的权限控制;

- 支持应急预案执行报告的发布。

7.4.11.5 培训管理

系统应支持培训管理,应实现以下功能:

- 提供基于模板的培训计划制定功能,帮助用户完成培训计划的制定;

- 对于待执行的培训计划,系统提供自动提醒功能;

- 对于已实施的培训,系统支持培训效果的测评和分析,以及分析结果的发布。

7.5 综合管理

系统应在资产管理、监控管理、安全管理、流程管理和外包管理功能的基础上,实现IT 整体运维信息统计分析,并支持管理决策。

7.5.1 统计分析

系统应能在收集到的各种事件信息和配置信息的基础上进行综合分析,帮助运维人员进行故障问题的定位。同时,系统应支持在各类管理信息的基础上建立综合分析指标,来反映IT 环境的总体运行趋势。

系统应支持通过界面、邮件和短信等多种方式发布分析结果。对分析结果发布的规则可以灵活设置,能够为IT 运维的不同角色提供不同界面和分析结果。

7.5.2 决策支持

决策支持应该包括数据、模型、推理和人机交互四个部分。系统应支持管理者就IT运维相关的人员、费用以及资源配置等管理关注的方面制定决策目标,通过建立、维护并运行决策模型,利用综合资产、监控、安全、流程以及外包管理的特征数据,借助知识推理功能,以人机交互方式进行半结构化或非结构化决策。

7.6 外包管理

系统的外包管理功能应面向企业IT管理者,实现对外包的IT运维服务的结果控制管理和过程控制管理。

7.6.1 结果控制管理

结果控制管理应支持对外包IT运维服务质量和效果的控制。具体包括:

- 系统应支持对服务级别协议的查询;

- 系统应支持基于服务级别协议中规定的内容定制并提交服务质量报告;

- 系统应支持服务级别违例报告。

7.6.2 过程控制管理

过程控制管理应实现对IT运维服务提供过程的控制。具体包括:

- 系统应支持查询外包运维工作的详细情况,如事件和问题处理情况、变更执行情况等;

The Bi 勬簮- 系统应支持服务级别违例相关的服务质量恢复和处理情况的查询和报告;

- 系统应支持对外包企业和外包运维人员的工作量和绩效进行查询、统计和定期报告。

The Juan 嶅彲鎶楀姏

Lu ф灦8 IT运维服务和管理能力评估与提升途径

Plank burnt 鏉冩秷鐏 ?8.1 IT运维服务和管理成熟度

Does the Huan Juan hook Chen?IT运维服务和管理成熟度用来测度各企业所具备的IT运维服务支撑能力和管理能力。其中,IT运维服务支撑能力体现为企业IT部门承担自运维工作时自身所具备的IT基础设施和IT应用系统的运行维护技术、工具和方法的储备,并以此为基础对部门内各类运维服务用户所提供的支撑能力。一般情况下,这些能力主要体现在资产管理能力、监控管理能力和安全管理能力等方面。

The Juan Bi 勬湰IT运维服务管理能力着重体现为对部门内部具备的运维服务、以及采购的外包运维服务的管理能力。一般情况下,这些能力主要体现在流程管理能力、综合管理能力和外包管理能力等方面。相关能力的详细内容如下:

(1) 资产管理能力:主要体现在对资产管理信息的覆盖程度和管理信息分析能力。

The 鍒嗘 閰嶉?(2) 监控管理能力:主要体现在对被监控实体的覆盖程度、管理信息的实时处理能力和智能化分析能力。

(3) 安全管理能力:主要体现在对不同安全管理内容、范围的支持能力。

(4) 流程管理能力:主要体现在流程的覆盖程度、规范性。

The Yue 呭熀鍦 issues the Jiao 鐢ㄦ潈(5) 综合管理能力:主要体现在信息分析统计能力和决策支持能力。

The Lu ц繍鎵 Ku Juan?(6) 外包管理能力:主要体现在对外包服务的过程控制和结果控制能力。

The Wa Juan ? 閮ㄩ ?5 IT运维服务和管理成熟度

IT运维服务和管理成熟度的评估主要围绕这6个维度展开。如图5所示,对于以上每一个维度,可以分别规定各自详细的成熟度等级,这些不同维度的不同成熟度等级的组合构成整个IT运维服务和管理成熟度。

5中的阴影部分给出了在资产管理、监控管理、安全管理方面具备1级能力,在流程管理和综合管理方面具备2级能力的IT运维服务和管理成熟度表示。

8.2 IT运维服务和管理成熟度提升途径

IT部门可结合本企业的实际情况,从IT运维服务和管理成熟度的6个维度出发,评估本企业IT运维服务和管理能力的成熟度,并以此为基础,选择相适应的IT运维服务支撑工具,同时充分借鉴已有经验,必要情况下选择IT运维服务咨询公司提供咨询服务,确定IT运维服务管理中迫切需要解决或提高的关键问题,循序渐进,有步骤、分阶段地提出改进目标,不断提高企业的IT运维服务的水平。需要不断提升自身IT运维服务管理和支撑能力的企业,可结合自身实际情况引入IT运维服务和管理的咨询服务,并在咨询服务的指导下,开展IT运维服务支撑系统的建设。具体的咨询工作一般包括如下几个方面:

(1) IT运维服务和管理成熟度的确定

通过调研、诊断,从IT运维和管理能力的6个维度出发,评估企业当前的IT运维服务和管理成熟度。并根据企业当前成熟度水平、企业IT运维规模、电子政务应用对IT运维的要求等因素确定其应该选择或达到的目标成熟度

(2) IT运维服务管理体系的规划

根据已确定的IT运维服务和管理的目标成熟度水平,规划与之相对应的IT运维服务支撑系统。明确需要以信息化手段实现的6个维度的IT运维和管理能力,明确资产管理、监控管理、流程管理、安全管理、综合管理和外包管理的功能范围,对涉及的IT资源和管理流程进行整理和梳理。IT运维服务管理体系规划同时涉及IT运维服务支撑系统技术指标以及支撑系统与IT资源、与其他信息化系统对接接口等内容。

(3) IT运维服务管理体系的建设实施咨询

针对系统建设实施过程所需要的需求分析、设计、产品测试、项目招投标、项目实施、项目测试、项目初验和试运行、项目竣工和系统移交等各个阶段,提供指导、帮助或监理。

(4) IT运维服务管理体系的改进和优化

IT运维服务管理体系运行过程中对系统进行评估,提出系统优化和改进方案,以适应企业业务和管理需求的不断变化。

本文来源:https://www.2haoxitong.net/k/doc/ff2a6f8a1611cc7931b765ce050876323012747e.html

《最新IT运维服务管理体系资料.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式