《整体运维服务方案.docx》由会员分享,可在线阅读,更多相关《整体运维服务方案.docx(92页珍藏版)》请在优知文库上搜索。
1、整体运维服务方案广州贝塔信息科技有限公司目录第1章项目概况61.1 项目背景61.2 项目目标61.3 需求分析7第2章运维服务管理体系建设82.1IT服务管理概述82.2运维服务管理流程体系92.2.1服务支持102.2.2服务提供182.3 运维服务管理规划222.3.1 第一阶段:服务磨合阶段232.3.2 3.2第二阶段:主动服务阶段262.3.3 第三阶段:战略规划阶段302.4 运维服务质量管理302.5 建立运维管理规范332.5.1运维管理规范概要33第3章信息系统运行保障方案353.1统一服务台建设353.2 建立文档管理制度363.3 一般信息化设备及相关软件运维管理421
2、. 3.1一般信息化设备服务范围423.3.4一般设备服务方案453.4防(杀)病毒服务523.4. 1防病毒服务需求522. 4.2制定合理的防病毒策略和安全管理制度。533. 4.3客户端防病毒升级软件544. 4.4防毒组件及时更新545. 4.5每周防毒系统部署情况统计556. 4.6每周对产生的病毒事件进行评估553.5 信息资产巡检及普查服务553. 5.1主动巡检554. 5.2信息资产普查573.6 其它有关说明及要求57第4章运维服务计划方案584.1 运维服务准备584. 1.1签定必要的协议和约定585. 1.2人员准备586. 1.3工具准备594.2 项目人员组织59
3、4.2.1人员结构594.2.2人员职责与岗位要求614. 3.2进场初始阶段625. 3.3第一个服务阶段636. 3.4第二个服务阶段644. 3.5服务总结和延续阶段64第5章应急服务方案655. 1灾难应急措施655. 1.1应急措施体制图与总则657. 1.2大型灾难紧急行动方案665.2运行服务应急方案705. 2.1启动应急流程706. 2.2成立应急小组737. 2.3应急处理过程738. 2.4应急处理结果评估749. 2.5统计和报告75应急流程管理报告填写指南76第6章服务水平质量承诺及服务管理788. 1服务水平体系786.1.1报告服务786.1.2管理类服务796.
4、1.3主动式服务796.2服务承诺816.2.1服务级别承诺816.2.2服务质量承诺826.3服务管理836.3.1服务管理总则836.3.2服务流程管理846.3.3服务台支持管理846.3.4事件管理886.3.5问题管理896.3.6知识库管理906.3.7服务记录管理91第1章项目概况1.1 项目背景近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约290台,打印机约50台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着XXXX对整体IT系统(硬件、软件、网络通讯)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系
5、统安全稳定可靠运行的最有力的手段。XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。1.2 项目目标结合XX企业业务工作及信息化建设实际,完善运维管理
6、体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。1.3 需求分析本次项目XX企业需求主要包括两个部分,1、运维管理体系建设要求;2、信息系统正常运行保障服务。其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。信息系统正常运行保障涵盖了1、 一般信息化设备及软件的运维管理;2
7、、 防病毒服务;3、 办公区域内设备及软件巡检普查;4、 提供符合XX企业实际的服务响应水平及质量保障;5、 信息化资产管理第2章运维服务管理体系建设5.1 IT服务管理概述现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:如何把有限的IT资源最有效的作用于核心业务的发展如何最快地获取专业的支持能力如何实现对系统的完善管理,提高系统的可靠性和可用性如何提高用户的
8、工作效率,增加最终用户满意度如何跟上IT技术的发展,及时更新相关技术如何提高对IT系统利用的灵活性如何更好地管理IT运营成本以提高服务能力,将会是单位可能面临的问题。IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论JTIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。通过参考这些
9、标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITlL的指导建立和拓展自己的IT服务流
10、程。5.2 运维服务管理流程体系运维务管理最核心的是“服务支持(SerViCeSUPPort)和“服务提供(SerViCeDeliVery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。如下图所示:2.2.1服务支持服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:2.2.1.1服务台我们为企业建设服务台,提供统一报障电话,统一报障、统一维修接口,XXX可以通过统一的报障电话申请服务、查询服务处理进程,监控服务质量。服务台(ServiceDesk)是IT服务组织和用户相互联系的接入点。服务台曾经被称为帮助台(HelpDesk)。
11、HelpDesk的主要任务是记录,分解和监控提出的问题。一个服务台可以具备更宽范的角色,如接收变更请求(RFC),并且可以支撑多种流程中的操作。服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。在任何对SLA产生影响的事件面前,服务台处于第一线,并维护高速的信息流通道。围绕突发事件,服务台有可能在其权限
12、范围被授权实施变更。此类变更的范围可能被预先定义。当所有相关变更发生时,变更管理流程将被告知。基本上,当对任何Cl的规范做出修改之前,变更流程都需要对其进行预先审批。2.2.1.2突发事件管理突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。服务台接近于突发事件管理流程和问题管理流程,并处于它们之间。如果没有适当的控制,变更有可能引入新的突发事件。因此需要建立有效途径对变更进行跟踪。这是为什么建议持续不断地将突发事件记录在同一个CMDB中,并分类为“问题”,“已知错误”,“变更记录”等信息,以促进服务台界面的信息沟通能力,
13、简化事件调查和报告。突发事件的优先权及其升级需要作为服务级别管理流程中的一部分进行协商,并在SLA中备案。突发事件管理的目标:突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。突发事件流程如下图所示:2.2.1.3问题管理对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。如果问题被怀疑存在于IT架构内部,问题管理流程将会
14、瞄准其潜在的根源。一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。流程:2.2.1.4配置管理配置管理致力于控制一个变化中的IT架构(标准化和状态监控),鉴别配置项目
15、(清册,相互关联,审核与注册),收集和管理有关IT架构的文档,为所有其它流程提供IT架构的相关信息。配置管理是所有其它服务管理流程不可分割的一部分。拥有当前架构中所有部件的最新的,准确的,全面的和详细的信息,并管理其变更,使这些信息有效而高效地支持其它流程运行。变更管理可以与配置管理集成。至少,建议在配置管理系统中控制变更的登录和实施,并自在配置管理系统的帮助下对变更影响做出评估。因此所有变更请求应该被输入配置管理数据库(CMDB),并随着变更请求的进展随时更新记录,直至其实施。配置管理系统识别一个变更项目和架构中其它部件的关系,将这些部件的所有人召集到影响评估流程中来。不管一个变更是否在架构中实施,相互关联的配置管理记录应该在CMDB中得到更新。最好在变更发生时,使用集成工具自动地更新记录。CMDB应该开放给整个服务支持组,使所有人理解部件失效可能的原因,从而使突发事件和问题可以