腾 山 方 案

运维方案

1、运维工作人员

  • 我司针对本项目成立专门的运维团队和项目管理机构,负责保障服务期内本项目安全、稳定地运行。我司明确运维团队组织、人员、岗位职责、工作流程等,须建立详细的运维保障体系,并提供方案。
  • 系统运维团队须具备安全防范系统工程设计、施工和维护能力。
  • 系统运维团队须熟练掌握系统配置技术,包括但不限于网络及安全设备管理、系统参数配置、核心设备调试维护等技术。
  • 系统运维团队须具备视频服务管理能力,精通各种视频监控设备与平台,精通视频资源目录服务体系管理,精通各种可视调度系统设备维护。

2、巡检排故工作

  • 对重点设备的维护工作,采取分工负责的措施;节假日期间,或有重要的会议及有关活动期间,应专门安排值班,同时作好应急准备工作,必要时安排专人在现场值班,以确保系统正常运行。
  • 维护人员应围绕系统功能、系统的各项技术指标及操作运行情况,逐点、逐台、逐项地进行检验,边检边进行记录,并排除发现的故障。

3、用户信息反馈及持续改进工作

  • 建立客户意见反馈渠道,收集对维护工作的希望、要求和意见。
  • 建立维护工作联系卡,提供公司相关部门负责人及维护工作人员联系电话,保证与客户联系的畅通、维护工作的及时、有效。
  • 每维护年度对客户满意度作统计分析,提交书面报告
  • 及时修正维护工作方案、方法及纠正维护工作的不足之处,回复客户的意见和要求,提高维护工作质量和服务水平。

4、服务响应要求
(1)运营维护服务要求
我司提供服务期内详细的运行维护保障服务方案,包括服务内容、服务形式和服务保障措施。我司的运维服务方案应完全满足以下具体要求:
1)系统质量保证:服务期内,我司保障系统能以技术要求的性能有效运行。
2)我司每月应对系统和关键设备进行巡检,写出巡检报告并提交;应对设备进行安检、除尘保洁、线路等维护,对系统进行优化等。
3)服务期内,我司设立7×24小时热线服务电话,受理采购人系统故障申告、技术咨询。我司在收到采购人系统故障申告后,必须按要求及时解决I~IV级故障处理完毕后,我司在三日内向采购人提交书面的故障处理报告。
4)我司为各级监控中心(室)提供技术服务人员。
5)我司在采购人本地建立备品备件库。如果设备故障在规定时间内仍无法排除,我司在随后24小时内提供不低于故障设备规格型号档次的备用设备供采购人代替使用,直至故障设备修复,对无法修复的硬件免费更换原厂产品,确保系统的正常运行。
6)服务期内,我司根据采购人的要求对系统进行完善。对系统进行的任何配置、数据改动及其它可能对系统和业务造成不良影响的操作,必需经采购人确认后方可进行。
7)服务期满后系统出现故障,我司配合,尽快解决故障,并提供技术支持。
(2)应急处理方案要求

  • 我司提供系统核心部分及主要设备发生故障时的应急处理方案;我司保证对故障设备的及时维修和更换。
  • 针对备品备件要求,我司提供的设备应以至少6年使用期设计,如果设备停产,需要提供相同性能或者性能更优的替代品。
  • 我司保证不同时期提供的同类产品兼容。

售后运维服务

运维服务范围

我公司对系统的运维服务包括对构成系统的所有建筑设施、硬件、网络、供电设施、防雷设施、第三方软件、应用软件等的维护、维修、更换故障设备和产品升级。
我公司应与设备供应商签订合理的运维服务保障协议,保证提供充足的备品备件资源。

运维服务内容

我公司提供的运维服务内容包括日常运作、服务咨询、巡检保养、主动监测、故障修复、特殊保障和升级优化。

日常运作

我公司按招标文件中的系统功能和性能要求,维护系统的日常运作。

服务咨询

我公司设立专门的服务咨询中心,提供免费的服务热线电话,接受系统故障保修、使用帮助要求、业务和技术咨询、服务投诉等。该服务咨询中心应该7×24小时全天候运行,配备足够的咨询人员或技术工程师,热线电话的拨通率应达到90%以上。在热线电话发生故障情况下,提供其它备份的方便和迅速的联系方式。

巡检保养

(1)定期巡检服务
a.每季度对工程敷设线路及前端安装点进行巡检,并填写巡检记录表,对可能影响线路及前端的情况要及时协调,防止因线路中断等情况造成系统中断;
b.每季度对工程范围内的设备箱、设备及其供电系统进行一次保养性维护,包括设备除尘、排除故障隐患等,并填写设备养护记录表;以确认所有设备及系统工作正常;
c.每季度对工程范围内的摄像机除尘清洁一次,并填写记录表;
d.每半年对防雷系统进行一次检测,填写检测登记表,对不达标的防雷地极进行相应处理。
(2)定期抽检服务
每周进行随机抽查,对系统的运行情况进行检测,并填写记录表。

主动监测

(1)设备监控
我公司建立设备管理监控体系,有效地对系统的监控设备运作情况和传输线路的性能、通断情况进行实时监控,及早发现问题,排除故障。
(2)图像监控
我公司对每个监控点的图像显示是否正常进行主动监测,以减少故障时间。

故障修复

(1)紧急抢修
我公司当承担合同期内系统发生任何故障的抢修任务。
(2)备用方案
如特殊原因造成系统无法正常使用,我公司提供备用方案和措施确保系统运行正常。
(3)易损易耗件
我公司建立备品仓库,储存足够的备用易损易耗件。备品仓库应合理分布,或者在用户的使用现场(例如监控室)储存,保证能满足故障抢修的要求。备品仓库应定期进行检查。
(4)更换设备
若某个设备在1个月内连续发生3次以上(含3次)故障,中标人应更换使用新的同型号或者性能不低于原型号的替代产品,以保障设备的连续正常使用能力。

特殊保障

(1)临时保障
采购方(或用户单位)如有重大事件、临时现场监控等较特殊的保障措施,我公司按时提供服务。
(2)安全保障
采购方(或用户单位)如有安全保卫、系统接管等较特殊的要求,我公司按照要求提供服务。

更新升级

(1)文档更新
我公司建立完备的资料库,包括用户的电路资料、装机地址、备份情况、应用特性以及用户配置等,这些资料应作为成果提交给采购人(用户)。一旦资料进行了版本更新,应在3天内向采购人(用户)提供最新版本的资料。
(2)升级服务
我公司免费提供设备内嵌软件、产品操作系统、第三方采购软件和应用软件的升级服务。
(3)系统优化
我公司根据运行情况定期向采购方提供系统优化、使用优化和管理优化建议,确保系统以最优状态运行。

运维服务报告

在整个运维服务周期内,我公司与用户建立完善的沟通协调机制,我公司及时提供运维服务的各种报告。包括每日运维服务日志、重大故障维修报告、每月故障总结报告、每季度的设备和系统管理报告、每季度的系统维护总结报告,有针对性的系统优化方案报告等。此外用户还可根据实际情况需要,要求我公司就特定事件提交说明报告。
我公司提供各种设备管理的原始数据(包括设备故障数据),接受用户和监理单位的独立检查。若我公司建立了远程集中的设备管理系统,那么我公司保证该系统的所有设备维护数据真实,没有被篡改或者删除,并向用户提供该系统的管理数据。用户也可以随时检查、使用该系统获取设备管理信息。
我公司提供部分报告的实例样本如下。
2.故障处理分析报告
ST.FO05-96 故障处理分析报告
报告编号:          服务日期:     年    月    日


信息

合同编号:

 

合同名称:

 

响应服务报告编号:

 

备    注:

 

故障现象

 

故障分析

 

故障处理

 

预防措施

 

确认

服务人员 :           日期:

意见:
客户签字:           日期:

4.重大故障报告
本项目我方项目副经理全权负责一线和二线资源调配,按照用户方规范做好事件通报和应急处理,同时按照公司事件通报机制通报事件。系统恢复后需要提交《ST.FO05-94 响应服务报告》,故障解决后需要提交《ST.FO05-96 故障处理分析报告》。
事件通报制度:
在服务期内,系统一旦发生故障,服务经理首先要评估故障等级。系统全阻故障需要立即电话或短信通知工程大区主管,主管负责协调资源支援服务经理处理故障,随后服务经理每1小时汇报故障处理进展情况,直至业务恢复完毕。
5.故障报告
情况统计:

    • 本月用户申告次数为X次;
    • 发生重大的故障X次;
    • 发生系统类故障X次;
    • 设备类故障为X个,主要故障X个,产生原因;
    • 故障总历时为XXXX分钟,平均历时为XXX分钟,造成时间较长主要原因。修复及时率为XXX%。
    • 发生安全事故X次。
    • 发生电源系统故障X次。

8.季度系统维护总结报告
(1)客户视频监控系统介绍
(2)客户视频监控平台容量占用情况
(3)客户视频监控网络运行质量情况分析;故障及投诉情况汇总分析
(4)客户视频监控网络评价分析:对用户网络的结构健壮性、合理性进行分析。  
对客户网络优化建议。
9.服务总结报告


****维护项目

****(年度/季度/月度)维护总结
主要包括一下内容:

  • **维护服务内容介绍
  • 服务内容总结
  • 平台维护服务情况总结
  • 平台故障情况总结
  • 服务类型情况总结
  • 巡检服务内容
  • 维护服务总结和改进建议

服务时间

提供7×24小时服务承诺

我公司承诺提供6年全天候7×24小时的故障维护服务和技术业务咨询服务,并有专业的技术人员负责及时解决系统出现的任何故障。

故障修复时限承诺

服务期内,我司设立7×24小时热线服务电话,受理采购人系统故障申告、技术咨询。我司在收到采购人系统故障申告后,必须按要求及时解决。
I~IV级故障处理完毕后,中标人应在三日内向采购人提交书面的故障处理报告。

运维服务期的管理

我公司根据运维服务要求,参照国际上有关通信和信息系统运行服务标准的要求建立完善的视频监控系统运维服务管理体系,保障承诺的运维服务内容的实施。

运维服务组织机构

我公司建立以高级经理为首的运维服务管理机构,设立专门的运维服务咨询中心,设立专门的技术服务队伍,配备包括视频监控、光纤管道、电气设备、电力和网络等各类维护工程师。
服务咨询人员和维护工程师应经过专门的培训,具备相应的沟通能力、业务能力和技术能力。
详细描述组织机构的构成、人员配备及其各层级的职责分工。

运维服务组织架构

根据本项目的实际情况,我公司设立专项项目运维项目部,采用项目经理负责制,有项目经全权负责本项目的运维管理工作。运维服务组织架构图如下:

相关人员职责

项目经理:全权负责本项目的运维工作,是本项目运维的直接责任人。
运维区域主管:负责本区域的运维管理工作,是本区域运维的直接责任人。
维护工程师:项目维护的直接操作人,保证按运维要求完成本区域的维护工作。
运维管理主管:对项目运维工作进行管理,充分做好后勤保障工作,保证一线运维的正常工作和运维情况总结、分析等。为项目经理提供相关决策资料。
服务台接线员:故障情况接报和相关资料传递给故障派单员。
故障派单员:分析接线员传递过来的故障情况,将故障情况传递给相应的区域负责人。
故障分析员:对疑难故障进行分析、总结和归类,为疑难故障处理提供依据和解决方案。
监督员:监督故障处理流程和结果,定期向用户做回访,保证运维服务质量。
资料管理员:资料整理、归类和存档。
后台技术支持工程师:解决疑难故障,为一线运维提供技术支持,提供电话支持和邮件支持等。

项目运维人员情况

本项目运维人员情况,请详见本文件承担本项目主要技术人员和售后服务人员情况章节)内容。

服务组织保障

维护项目组设置有项目经理、服务台管理、事件管理、问题管理、配置管理、变更管理等6个角色。项目经理负责整个维护服务项目。
项目经理来自工程总部,对维护工作进行紧密跟踪和管理,协调与用户方之间的重大问题。在合同范围内,项目经理和项目副经理有充足的二线人员调动权,必要时能够直接快速调动二线人员解决问题,允许事后再走事件管理流程。
常驻人员必须常驻用户指定的办公场所,或者用户根据需要要求常驻人员常驻用户方指定的场所,非常驻人员留守维护方办公场所,处于待命状态,用户可以根据需要要求非常驻人员到场服务。
所有参与本项目的项目组成员都与用户签订保密协议。

服务体系组成

我公司的服务体系主要由客户服务呼叫中心、项目管理部、客户服务部、应用工程事业部等部门组成。在”平安阳江”社会治安视频监控系统(四期)设备平台系统建设综合服务项目中,整个体系将以整合运作的方式为该项目服务。

  • 客户服务呼叫中心 

全面协调、跟踪和监督软件开发、系统集成及售后服务等环节,提供全天24小时的技术支持服务,及时帮助客户解决疑难问题,使客户的请求或投诉有效地、受控地得到处理。

  •      客户服务部

负责解决系统集成方面的客户请求,同时负责对系统集成方面重大售后服务质量问题的分析、解决和预防,并负责系统集成相关工程项目的实施。该部门服务工程师有多人分别取得华为HCNE认证、HCSE认证、ORACLE OCP认证、IBM工程师认证等。

  • 应用工程事业部

对进入维护期的项目进行应用系统维护工作:进行程序和数据问题处理,解答用户应用软件技术方面的咨询。
负责在系统维护期内解决数据库系统、应用系统的调试及维护工作,指导用户进行系统安全管理、数据管理; 对重大问题进行用户现场问题处理。
负责处理客户有关应用软件产品的请求,建立/更新用户档案,并根据问题性质决定解决问题的方法并跟踪其执行,同时把信息反馈给用户。

  • 项目管理部

对项目进行过程监督和文档管理,对软件开发项目组织内部测试; 委派产品项目负责人进行项目进度的控制; 负责产品配置管理和产品配置管理环境的维护。
建立完善的管理制度、制定工作流程、人员考核制度(月度考核),确定维护人员的岗位职责(包括人员的上班时间、休息及备勤时间,上班时间的分配等内容),能够对维护人员的工作进行跟踪及质量监督,要求有完备的文档资料产生。
编制维护手册(建立相应的系统检测指南,规范系统检测步骤),建立完备的维护过程文档资料,统一格式、做好分类,最终建成维护文档库(利用日常积累的故障及解决方案对系统现状进行预先判断),并采用一定的管理软件(如性能监控工具Tivoli等)进行过程管理和维护的状态管理。
针对客户计算机设备及系统出现大面积紧急故障或由于其他原因导致服务工程出现人手不够,不能及时完成任务时,维护方公司将给予全力支持提供应急服务分析常见的、关键的薄弱环节,搭建模拟测试环境找出解决方案,指导常驻人员解决问题。
确保和提高系统设备的使用率,做好各类设备运行状况的记录工作,保证维修工作快速有效,制定定期检修及所有设备的巡检计划(按单位分类,每季度至少一次,做好登记并形成文档形式递交),提高监控设备的完好率和降低故障发生率。
对所有设备进行分类并登记在册形成文档,做好设备的管理、分配、调拨等工作,协助做好固定资产登记的工作。
维护对象和范围中,关键设备的维护需要很好的备件支持,我公司方提出一个备件设置方案,内容包括:备件需求分析、备件清单及其合理性说明。在维护过程中,制定备件库的领用登记办法,确保备件能在需要时顺利提供,同时确保备件保管的安全性。
维护人员未经申请并获审批同意,不能擅离职守。维护人员确需要离开工作岗位的,首先向公司主管提出申请,然后公司主管审批并提出工作交接方案,报用户方审批,用户方收到申请后在两个工作日内作出书面答复。用户方同意后,方能办理公司内部的请假手续,并在规定的时间内返回工作岗位。

人员素质能力

我公司承诺:维护人员具备一定的表达和沟通能力,能够对用户进行所需的操作培训,解决常用软件操作的问题;维护人员经过业务系统培训(用户方组织),能够迅速掌握用户方服务器系统的安装、调试和故障排除能力,并协助用户方的技术人员或指定的技术人员进行这些设备及系统的安装、调试和故障排除。维护人员具有企业信息系统维护经验,能够较快熟悉业务流程,技术细节,制定详细的维护流程和方法,维护方案中给出业务应用信息系统维护的实施方案。

人员考核制度

每项关键指标评估结果:

  • 6分表示杰出的,完全超出预期
  • 5分表示全部完成,明显超越
  • 4分表示全部完成,有所超越
  • 3分表示基本完成,已努力,有所不足
  • 2分表示未完成、已努力、存在明显差距
  • 1分表示未完成、为努力、不可接受

人员离岗审批

维护人员请假离开工作岗位的规定:维护人员未经申请并获审批同意,不能擅离职守,否则,每发现一次,要求整改一次。维护人员确有原因离开工作岗位的,首先向公司主管提出申请,然后公司主管审批并提出工作交接方案,报用户方审批,用户方收到申请后在两个工作日内作出书面答复。用户方同意后,方能办理公司内部的请假手续,并在规定的时间内返回工作岗位。

人员保险福利待遇

我公司承诺参与维护的人员工资待遇处于行业中上水平,通过加强员工管理和正向激励,让维护人员始终保持最佳的工作状态。
我公司为维护人员购买了意外保险,对于维护人员因为工作在用户方引起的各种工伤、安全事件和事故,用户方免于一切责任。

运维服务流程

我公司参照国际运维服务标准体系,建立各项运维服务标准流程,制定服务规章制度,应按照流程要求提供高质量、响应快的服务。
服务流程应该包括服务台管理、事件管理、问题管理、配置管理、服务质量管理、服务考核评估等。
我公司在投标文件详细描述相应的服务流程和规章制度,并提供服务流程的实例样本。

服务台管理

我公司建立了客户服务中心的服务台管理制度,服务台为客户和维护组织之间提供一个统一的联系界面,并在第一时间受理客户的各种服务需求和故障申报、投诉等。我公司制定相应的规章制度,对服务台进行严格管理,提高服务台人员素质,理顺工作流程,为客户提供优质服务。
服务邮箱:
服务监督:

事件管理

事件管理(Incident Management)目的是减少或消除存在或可能存在于IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己的正常工作。也就是说事件管理的目的就是排除隐患及快速恢复业务。
排除隐患主要是通过巡检提前发现隐患、通过培训降低人员误操作。
快速恢复业务是运维的关键诉求,事先准备应急预案及择机演练是保证业务能够被快速恢复的首选方法,从历史事件中获得业务快速恢复是备选方法,集中人力和物力解决意外事件(首次发现)并形成解决方案供后续事件查阅是必要的。如果存在软件BUG或硬件故障,需要生成问题管理工单,从根本上杜绝事件再次发生。
服务台接收到的事件(Event)主要包括故障(Incident)和服务请求(Service Request)。事件管理负责事件的调查、诊断、修复,其主要目标是尽可能快地解决故障,以恢复受影响的业务。

问题管理

对于服务台识别的突发问题,我公司建立完善的问题管理机制,对突发问题的潜在原因加以诊断,迅速制定解决办法,改正基础设施的错误并进行问题预防指导。
主动的问题管理主要是进行网络和机房基础设施的巡检、分析和建议。被动的问题管理主要是分析网络和机房基础设施的故障,定义问题,并提出可能变更以解决问题的建议。

变更管理

我公司建立变更管理机制,对系统配置变更进行严格管理和控制,规避变更可能产生负面的影响。项目副经理作为服务器维护项目组变更管理员,配合用户变更经理,按照既定的变更管理流程,进行变更的审核和审批。
对于实际变更项目,即用户下达的维护、维修事项或者小宗工程,我公司将遵照以下流程及时限要求处理:
(1)用户下达任务书;
(2)我公司一般在2天内、紧急的在1天内,提出解决方案或设计图纸及报价;
(3)服务监理和用户审批同意后;
(4)我公司组织人员实施;
(5)我公司在实施完成后,编写任务完成报告;
(6)监理联合用户进行现场检查、评价,决定是否通过和关闭。

发布管理

发布管理是使用经过测试的软件与硬件以实施变更的流程,目的是通过正式的流程确保只有经过完整测试与得到授权的软件与硬件才能够进入正式运行环境,以确保变更后生产环境的质量。

配置管理

我公司建立配置管理机制,对包括基础设施和服务在内的设备进行识别和控制,在系统运行过程中对设备维护和检测,保证系统设备的完整性和可持续运行,保护客户利益。
配置管理数据库(CMDB)主要有两种形式:关系型数据库Oracle和文档数据库Visual Source Safe。Oracle主要存放关于网络设备的资产信息,VSS存放、管理描述网络配置的Word文档。网络维护项目组委派专职的网络配置管理员,负责网络和分支机构的机房的配置管理,包括资产信息维护和文档维护。

能力管理

能力管理通过已经建立的针对网络和机房环境的各种监控工具软件,进行网络监控、流量分析等,并结合今后业务的发展对监测的结果进行能力评估,提出将来可能出现的问题和趋势,并提出整个网络和基础设施今后进行能力提升、改善的建议、报告。

服务连续性管理

制定网络和基础设施的恢复方案,进行恢复演练,确保在设备发生故障甚至崩溃后,通过执行恢复方案,尽快地恢复系统的正常运行。这就需要服务提供方提供合理的备件库,以备恢复时,通过配置管理中记载的系统信息,尽快恢复设备运行。

可用性管理

在维护和管理过程中,准确记载故障发生时间、响应时间、解决时间等重要时间点,以便进行网络可用性的统计,这些统计数据为网络的服务管理、绩效管理、服务水平管理提供重要的决策参考。

日常巡检流程

设备更换流程

服务质量管理

我公司设有专业的质量控制管理部,负责制定各项详细的考核指标,并接受用户的投诉,同时对内部各专业部门进行严格的监督考核,以保证向客户提供高质量的服务。

服务考核评估

我公司制定严格的服务考核评估体系,对运维服务质量进行考核,提高运维服务水平:

  • 系统运行的主要统计项目
    • 系统可用率。
    • 设备完好率。
    • 网络设备的可用率、CPU利用率,内存占用率、磁盘空间占用率。
    • 系统、设备发生故障的次数、类型和历时。
    • 重大故障次数和历时。
    • 用户申告次数和修复及时率。
    • 发生安全事件的次数、类型和影响。
    • 各类设备发生事故的次数和历时。

故障申报及处理

故障受理
客户服务中心负责统一受理客户故障申告。
故障转派
客户服务中心在受理故障申告后,及时进行故障转派:根据机房计算机信息设备、机房基础设施、前端设备故障、光纤网络故障分类进行派单,由相应的维护人员接障。
故障解决
各类维护人员收到客户服务中心报障后,立即组织协调、解决故障。若维护人员如遇到重大故障和疑难问题则向售后维护部提交,售后维护部负责进行技术支撑;售后维护部如遇到重大故障和疑难问题则向总经理助理提交,总经理助理负责进行技术支撑。
故障上报
各单位遇到重大故障在积极处理的同时上报售后维护部,并由售后维护部统一处理。
故障通报
当各类维护人员发现影响业务的系统平台故障时及时通报售后维护部;客户服务中心对相关故障进行拦截。
故障分析报告
重大故障处理完毕后按相关维护管理规定向所属上级部门提交详细的分析报告。
故障维护考核
各类维护人员及时判断故障段落,指挥故障的修复,并清楚记录故障处理情况,按要求及时通知用户,在故障通报过程中,各工序间要进行横评配合度考核。

设备管理方案和运维数据采集

日常的检查、维护保养

  • 进行系统工作状况检查并填写设备运行状况表;
  • 各接地点、接口的检查及系统设备运行状况登记;
  • 设备的整理、保洁;
  • 对每天检查中发现的各种不稳定、不正常情况及时排除,消除系统设备的故障隐患。同时,将因外部因素引起而不能正常工作的故障点告知各级应用部门。

备件仓库管理
按照仓库物资管理制度,对备件进行有效管理。
1)    加强仓库管理,做好物资的收发和保管工作。做到保质、保量、及时、成套地完成物资的收发任务。
2)    做好仓库管理是加强物资管理的一项重要任务,为此每位仓库管理人员必须根据储存物资的特点,做好“五无”——无霉烂变质、无损坏和丢失、无隐患、无杂物积尘、无老鼠;做好“六防”——防潮、防冻、防压、防腐、防火、防盗。
3)    保证物资管理的安全,严防贪污,严防坏人破坏,严防一切事故发生,严禁无关人员进入仓库,不准在仓库内吸烟、烧电炉。
4)    物资进仓须有严格验收手续,对物资的数量、规格、质量、名称等做到准确无误,同时做好进仓的登记手续。
5)    物资出库发放必须严格执行发料须有领料凭证,并且手续完备、齐全,否则仓库管理人员有权拒发材料。
6)    不断改善仓库的物资管理工作,做到科学管理仓库,提高工作效率。
7)    开展技术革新,不断改善仓库的物资管理工作,减轻笨重体力劳动,做到科学管理仓库,提高工作效率,使物资尽快地投入生产,充分发挥物资的作用。
定期检查、维修

  • 每季度对设备进行不少于一次的维护、检查,并对各设备使用情况及工作状况进行登记;
  • 每月对系统的网络设备、主机等主要设备进行一次技术性能检查,如实记录。对问题设备立即制定维修计划报业主确定。

计划维修
每月的维护计划在当月第5个工作日之前报送业主审核。
故障设备修理

  • 更换下来的故障设备在2日内进行维修,在5个工作日后修理解决。若需送厂家修理,自更换后2个工作日内报业主确认。
  • 所有更换下来的维修设备,造册登记,详细纪录故障时间、安装地点、故障现象、故障原因、处理结果及修复情况。每周报送业主。

文档管理

文档范围
文档范围是指本项目在运维过程中规定的项目交付成果中所涉及的文档,也包括在项目实施过程中所产生的不在规定之列的有关文档(包括临时过渡性文档)。
文档管理员
文档管理员即是对文档的变化进行跟踪管理的专职人员。该专职人员由我公司委派。考虑到文档是重要的成果资料,在项目运维的生命周期内其维护具有不断延续性,且是一个动态的跟踪过程。
文档状态
文档状态是在文档正式形成过程中即文档签发前文档所处的阶段。从对文档变化的动态跟踪和文档的标识角度来分析,文档状态(文档所处阶段)可以由一些关键点来体现。这些关键点包括:文档名称、提交方(文档的编写小组)、负责人、初稿编写提交、内部审核、内部修改、同行评审(或会议评审)、同行(会议)评审修改、复审、签发。其中的初稿编写提交、内部审核、内部修改、同行评审(或会议评审)、同行(会议)评审修改、复审、签发等关键点和具体的时间对应。
从文档状态演变的过程图中可以看出:
文档的初稿编写提交到内部评审其过程是单向的;
内部评审到内部修改过程是双向的,即内部修改后还有可能需要内部评审,有一个反复的过程;
内部修改到同行(会议)评审过程是单向的,同行评审和会议评审是二选一的过程;
同行(或会议)评审到同行(或会议)评审修改过程是双向的,即这种修改和评审过程可能需要反复。
在同行(或会议)评审到复审过程是单向的;
复审合格后即进入签发过程。
文档命名
文档命名的原则:文档名必须和该文档中的实际名称相同,不能另外命名或采用其文档中实际名称的缩写。
当文档签发后其版本号由项目组统一指定。该版本号标识位于文档封面中的文档实际名称之下。该文档的版本号不同与配置管理工具中的版本号,配置管理工具的版本号是为配置工具内部管理服务的,而文档的版本号是该文档对外发布的版本号。
文档版本控制
文档的版本控制是基于配置管理工具而言的,是文档动态演进过程中配置工具的内部版本标识。
为了加强文档的管理,避免对文档版本库中的同一文件可能出现的多用户并发修改动作以及不允许利用配置工具中的合并(merge)功能对同一个文档不同修改结果进行合并。文档版本控制的具体方法是(不同的配置工具方法相同):
由项目实施小组确定各文档入库前的baseline。
在baseline数据库中有“XXX系统”项目,该项目下按文档的分类有许多子项目,分别对应于不同的文档内容。库中保存有所有文档的演变过程版本(由版本号标识),当产生milestone时,库中会置相应的标签(label或tag)。和版本库中最新版本保持一致的Copy统一放于文挡管理服务器的某固定目录下,供开发合测试人员只读用。以上的工作由质量组专职人员完成。
如要修改某文件,需先到小组长处申请(不填申请单),批准后,由质量组成员或配置管理员从库中将需要修改的文件check out到某约定的目录下,修改者将要修改的文件Copy到自己的PC上修改。该文件check out后不准再做第二次check out 命令,待修改提交(check in)后才能再次做check out命令,再供他人修改。
如果库中的某文件需要多人同时对其修改,其管理的机制不在配置管理工具内部实现,其办法是:获修改批准后,将要修改的文件check out 到小组长约定目录下,具体修改动作和任务分配由小组长负责,多人修改后的合并(merge)及修改内容详细说明也由小组长完成,之后由小组长提交质量组成员或配置管理员做入库的相关工作。
文档的修改后,必须详细填写修改说明,以便入库是作为comment用。入库前必须由修改人或小组负责人填写“入库申请单”,获小组长批准后交质量组成员或配置管理员入库,入库后由质量组完成更新文挡服务器某目录下文挡Copy,以保证文档Copy的内容与库中最新文件版本一致。
文档备份
文档备份是文档管理的一个重要环节。万一文档库崩溃,备份是恢复文档库的唯一途径。其方式备份有两种:
配置管理工具服务器的库备份。如果库是以文件方式存储,则备份文件;库是以数据库方式存储则必须备份数据库,对数据库的备份可根据具体情况采用数据库的逻辑或物理备份,一般来说数据库中数据量较小时用逻辑备份即可。
对库备份的同时,还必须对和库中最新版本保持一致的文档服务器中的文档Copy进行备份。
备份的原则是:在开发阶段,备份周期以每三天一次,一个星期将备份结果刻入光盘,作永久保存,同时保存原来的副本,保存时间为一个月;在维护阶段,可以在文档修改申请入库后做备份,并视情况将备份结果刻入光盘。
具体备份工作由文档管理员来负责。
业务管理
建立人员知识更新制度。包括能力的持续性培养,建立素质模型,明确岗位设置,全面掌握新产品新设备的特点、性能及维护要领,明确维护工作的任务、责任和质量要求。
前期准备工作

  • 对维护队的工具进行检查,发现短缺、损坏补齐;对测试仪表进行检查和校准。
  • 对参与本工程的车辆进行安全检查,确保病车、坏车不上路。
  • 对参加本次维护项目的全体人员进行安全生产、文明代维等方面进行学习。
  • 安排现场管理人员以及部分维护队长对设备点进行提前切入,到设备点熟悉。

人员稳定性措施
为客户提供优质的服务,保持人员的稳定性十分重要。根据维护业务的性质并结合我公司的实际情况,在保持人员稳定性方面采取以下三方面的措施:

  • 对参与本项目的人员签订补充协议,在本项目结束前不得由于个人员原因离开。
  • 适当的保持部分人员的本地化,是保持维护人员相对稳定的有力保证。
  • 对部分骨干人员采取项目期满后给予一定的奖励措施。

人员培训考核

定期考核维护人员
根据公司规定每三个月对维护人员进行考核定级,检查维护人员对用户的各种维护制度的掌握情况,对机房各种设备的认识和实际操作情况,对模拟故障的分析处理情况,对突发事件的应变情况,对维护过程中各种问题出现后的流程情况,从而提高维护人员的工作能力,保证维护的工作质量
不定期的故障模拟抢修
由项目组安排,不定期对运维队伍进行故障模拟抢修考核,检验运维队伍的反应时效和到达故障现场的时限是否符合要求,保证故障抢修的及时性。
培训管理
对运维队伍的技术培训工作是维护质量保证的重要方法,经多年的工作经验,制定以下3点措施。
1)内部培训:公司每三个月会对运维队伍分批进行一次内部培训,培训内容主要是针对现系统基本原理、日常维护所要注意的事项和一些日常出现的故障的处理办法。
2)外派培训:公司每年会从运维队伍中考核选拔出一部分人,参加厂家举行的培训,或到有关培训机构参加培训。
3)技术交流:定期组织公司内部的维护人员和用户举行技术交流会,拿出近期出现的典型的故障案例进行探讨和分析,业务的发展趋势,以及我们应该注意的事项。

安全管理

安全运维管理
在进行运维时,要通过采用计划、组织、技术等手段,依据并适应生产中人、物、环境因素的运动规律,使其积极方面充分发挥,而又利于控制事故不致发生的一切管理活动。如在运维过程实行作业标准化,组织安全点检,安全、合理的进行作业现场布置,推行安全操作资格确认制度,建立与完善安全管理制度等。
1)      严格执行安全生产的法律法规,贯彻“安全第一,预防为主”的方针,加强工程运维的安全管理,规范作业人员的操作行为,确保人身安全和设备的安全。
2)      组建现场运维安全管理组织。
3)      制定运维安全生产的岗位责任。
安全运维措施
1)      运维班组坚持上岗交底,运维前对进入现场的维护人员,进行专业性的有针对性的安全教育方可进场运维。
2)      严格执行持证上岗制度,维护人员必须持有效的操作证和特殊工种操作证上岗。
3)      对运维所用的车辆、电器设备,手持电动工具、电源线、登高梯等,使用前经安全员检查后合格后,方可使用。
4)      所有驾驶员(专职、兼职),都必须参加安全学习和安全教育活动,树立良好的安全意识,严格按照安全操作规程,保证安全行车。
5)      运维前运维班组人员,在外运维时,必须随身携带胸卡、安全帽、安全带及试电笔。
6)      运维时,禁止赤脚、穿拖鞋或凉鞋作业,必须穿有绝缘胶底软鞋。
7)      运维现场配备专职安全员,行驶检查、监督、指导等职能。
8)      运维现场有专门的安全管理人员监督和检查,做好运维现场的围蔽、保护、和设置车辆导向标志牌和运维告示牌,防止维护人员和设备受到伤害或损失,保护行人、车辆的安全。
9)      检查、消除、防范现场已存在的或可能存在的各种不安全的事故隐患。
10)    对运维现场使用的电源线,按照不同的运维环境,合理接至设备,不得随意乱拖、乱拉、乱接电源线。
11)    强化运维现场生产管理,严禁违章操作、违章指挥。
12)    加强对运维场地周围环境的管理,运维中不准往上、朝下、向外乱抛铁丝、材料、工具等物,一旦发现,采取罚款处理。
13)    禁止与工程无关人员进入运维现场。
14)    对业主在安全检查中提出的问题,制定整改措施,定时、定人实施整改。
15)    作业完毕必须将现场清理干净,将存在隐患排除,做到文明运维。

  • 事故是指系统非计划性全阻
  • 平均修复时间(MTTR):包含检测时间和解决时间的平均停机时间
  • 平均故障间隔时间(MTBF):平均正常运营时间
  • 平均系统无故障时间(MTBSI):两次事件之间的平均时间

每套系统在建设中时都有可用性要求,相关的设备配置情况也不同,总体来说,可用性高的系统,就会考虑双网双平面、冗余设备、冗余应用。我公司承诺积极主动维护、完善应急预案,规避宕机风险,达到系统设计可用性。

文明运维

文明运维的组织管理
1、组织和制度管理
1)  运维现场成立以项目经理为第一责任人的文明运维管理组织。
2)  编制文明运维的规定。
3)  设专人进行运维现场文明检查、考核及奖惩管理。
2、 加强文明运维的宣传和教育
1)  在坚持岗位练兵基础上,并采取派出去、请进来、短期培训、上技术课、看录像、看电视等方法狠抓教育工作。
2)  特别注意对新进员工的岗前教育。
3)  专业管理人员要熟悉掌握文明运维的规定。
现场文明运维的基本要求
1)      维护人员在运维现场要佩戴工作证。
2)      运维现场的材料、设备、仪器和机械堆放不得侵占场内道路及安全防护等设施。
3)      运维现场的用电线路、用电设施的安装和使用必须符合安装规范和安全操作规程,并按照运维组织方案进行架设,严禁任意拉线接电。运维现场必须设有保证运维安全要求的夜间照明;危险潮湿场所的照明以及手持照明灯具,必须采用符合安全要求的电压。
4)      运维机械进场前必须经过安全检查,经检查合格的方能使用,禁止无证人员操作。
5)      保证运维现场道路的畅通,保持场容场貌的整洁,随时清理运维垃圾。在车辆、行人通行的地方运维,将设置运维标志。
6)      维护人员必须佩戴劳动保护器具。
7)      运维现场的各种安全设施和劳动保护器具必须定期进行检查和维护,及时消除隐患,保证其安全有效。
8)      做好运维现场安全保卫工作,采取必要的防盗措施,在现场周边设立围护设施。
环境保护
1)      进入机房的维护人员要自觉接受机房管理人员的监督检查,并自觉遵守机房的各项规章制度,服从机房管理人员的管理。
2)      不准在机房内吸烟、饮食、睡觉。
3)      不准在机房堆放材料和物品。
4)      进入机房的维护人员在走前必须检查机房清洁情况,如发现不干净,必须清扫后才能离开。
5)      未经用户同意,不得任意抄录、复制监控系统数据,不得随意修改系统数据。
6)      维护人员将严格遵守安全保卫及通信保密制度,不得在监控机房做违反安全生产的工作,不得泄露通信机密。
7)      爱护监控设施,不得随意移动监控设备,不得随意输入与监控无关的软件。
8)      维护人员在进行维护工作过程中必须保持衣着整洁,在日常维护工作中涉及同客户协调时一定要保持良好形象、文明用语。
9)      在维护完毕后,填写修障单,记录修复情况和数据的更新,并作存档处理。

运维考核

从业务可用性、故障响应、人员表现三个方面对运维服务进行总体考核;业务可用性考核(占总考核的50%)、故障响应和处理(占总考核的25%)、人员考核(占总考核的25%)。考核机制由业主单位和我司共同制定,并按最终考核得分支付合同款项。
服务评价
服务评价分为两种:

  • 常规服务评价;
  • 非常规服务评价。

常规服务评价是指用户方在每月末根据合同和各项服务要求,结合当月服务任务完成情况,给出的综合评价。评价内容主要是服务管理的各个流程的执行情况和成效。
非常规服务评价是指用户方根据合同和各项服务要求,结合故障处理、非常规任务的完成情况,给出的综合评价。评价内容主要是具体的案例的成效,包括完成时间和服务质量方面。

系统安全运行的保障措施

  • 建立健全的安全保障制度、安全保密制度、用户信息安全管理制度;建立健全的负责人、直接负责人、维护人员三级信息安全责任制和信息发布的审批制度;
  • 建立专门的标准机房,放置网络服务器,配备后备式 UPS,及足够功率的空调;
  • 机房门窗安全、牢固,防撬防盗性能好,非工作人员不得随意进入;
  • 设备性能稳定、安全性好。;
  • 系统均安装了正版的防病毒软件,对计算机病毒、有害电子邮件有整套的防范措施,防止有害信息对网络系统的干扰和破坏;
  • 信息管理系统建立双机热备份机制,一旦主系统遇到故障或受到攻击导致不能正常运行,保证备用系统能及时替换主系统提供服务;
  • 关闭操作系统中暂不使用的服务功能,及相关端口,并及时用补丁修复系统漏洞,定期责杀病毒;
  • 网络提供集中式权限管理,针对不同的应用系统、终端、操作人员,由网站系统管理员设置共享数据库信息的访问权限,并设置相应的密码及口令。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏自己的口令。对操作人员的权限严格按照岗位职责设定,并由网络系统管理员定期检查操作人员权限;
  • 设备平时处于锁定状态,并保管好登录密码;
  • 后台管理界面须设置超级用户名及密码,并绑定IP,以防他人登入;
  • 所有信息发布之前必须经分管领导审核;
  • 工作人员采集信息必须严格遵守国家的有关法律、法规和相关规定;
  • 用户信息由网络工作人员专人负责管理,并执行严格保密制度,未经允许不得向他人泄露。设备管理方案和运维数据采集

日常的检查、维护保养

  • 进行系统工作状况检查并填写设备运行状况表;
  • 各接地点、接口的检查及系统设备运行状况登记;
  • 设备的整理、保洁;
  • 对每天检查中发现的各种不稳定、不正常情况及时排除,消除系统设备的故障隐患。同时,将因外部因素引起而不能正常工作的故障点告知各级应用部门。

备件仓库管理

按照仓库物资管理制度,对备件进行有效管理。
1)    加强仓库管理,做好物资的收发和保管工作。做到保质、保量、及时、成套地完成物资的收发任务。
2)    做好仓库管理是加强物资管理的一项重要任务,为此每位仓库管理人员必须根据储存物资的特点,做好“五无”——无霉烂变质、无损坏和丢失、无隐患、无杂物积尘、无老鼠;做好“六防”——防潮、防冻、防压、防腐、防火、防盗。
3)    保证物资管理的安全,严防贪污,严防坏人破坏,严防一切事故发生,严禁无关人员进入仓库,不准在仓库内吸烟、烧电炉。
4)    物资进仓须有严格验收手续,对物资的数量、规格、质量、名称等做到准确无误,同时做好进仓的登记手续。
5)    物资出库发放必须严格执行发料须有领料凭证,并且手续完备、齐全,否则仓库管理人员有权拒发材料。
6)    不断改善仓库的物资管理工作,做到科学管理仓库,提高工作效率。
7)    开展技术革新,不断改善仓库的物资管理工作,减轻笨重体力劳动,做到科学管理仓库,提高工作效率,使物资尽快地投入生产,充分发挥物资的作用。

定期检查、维修

  • 每季度对设备进行不少于一次的维护、检查,并对各设备使用情况及工作状况进行登记;
  • 每月对系统的网络设备、主机等主要设备进行一次技术性能检查,如实记录。对问题设备立即制定维修计划报业主确定。

计划维修

每月的维护计划在当月第5个工作日之前报送业主审核。

故障设备修理

  • 更换下来的故障设备在2日内进行维修,在5个工作日后修理解决。若需送厂家修理,自更换后2个工作日内报业主确认。
  • 所有更换下来的维修设备,造册登记,详细纪录故障时间、安装地点、故障现象、故障原因、处理结果及修复情况。每周报送业主。

业务管理

建立人员知识更新制度。包括能力的持续性培养,建立素质模型,明确岗位设置,全面掌握新产品新设备的特点、性能及维护要领,明确维护工作的任务、责任和质量要求。

前期准备工作

  • 对维护队的工具进行检查,发现短缺、损坏补齐;对测试仪表进行检查和校准。
  • 对参与本工程的车辆进行安全检查,确保病车、坏车不上路。
  • 对参加本次维护项目的全体人员进行安全生产、文明代维等方面进行学习。
  • 安排现场管理人员以及部分维护队长对设备点进行提前切入,到设备点熟悉。

人员稳定性措施

为客户提供优质的服务,保持人员的稳定性十分重要。根据维护业务的性质并结合我公司的实际情况,在保持人员稳定性方面采取以下三方面的措施:

  • 对参与本项目的人员签订补充协议,在本项目结束前不得由于个人员原因离开。
  • 适当的保持部分人员的本地化,是保持维护人员相对稳定的有力保证。
  • 对部分骨干人员采取项目期满后给予一定的奖励措施。

人员培训考核

根据公司规定每三个月对维护人员进行考核定级,检查维护人员对用户的各种维护制度的掌握情况,对机房各种设备的认识和实际操作情况,对模拟故障的分析处理情况,对突发事件的应变情况,对维护过程中各种问题出现后的流程情况,从而提高维护人员的工作能力,保证维护的工作质量

由项目组安排,不定期对运维队伍进行故障模拟抢修考核,检验运维队伍的反应时效和到达故障现场的时限是否符合要求,保证故障抢修的及时性。

对运维队伍的技术培训工作是维护质量保证的重要方法,经多年的工作经验,制定以下3点措施。
1)内部培训:公司每三个月会对运维队伍分批进行一次内部培训,培训内容主要是针对现系统基本原理、日常维护所要注意的事项和一些日常出现的故障的处理办法。
2)外派培训:公司每年会从运维队伍中考核选拔出一部分人,参加厂家举行的培训,或到有关培训机构参加培训。
3)技术交流:定期组织公司内部的维护人员和用户举行技术交流会,拿出近期出现的典型的故障案例进行探讨和分析,业务的发展趋势,以及我们应该注意的事项。

安全管理

安全运维管理

在进行运维时,要通过采用计划、组织、技术等手段,依据并适应生产中人、物、环境因素的运动规律,使其积极方面充分发挥,而又利于控制事故不致发生的一切管理活动。如在运维过程实行作业标准化,组织安全点检,安全、合理的进行作业现场布置,推行安全操作资格确认制度,建立与完善安全管理制度等。
1)      严格执行安全生产的法律法规,贯彻“安全第一,预防为主”的方针,加强工程运维的安全管理,规范作业人员的操作行为,确保人身安全和设备的安全。
2)      组建现场运维安全管理组织。
3)      制定运维安全生产的岗位责任。

安全运维措施

1)      运维班组坚持上岗交底,运维前对进入现场的维护人员,进行专业性的有针对性的安全教育方可进场运维。
2)      严格执行持证上岗制度,维护人员必须持有效的操作证和特殊工种操作证上岗。
3)      对运维所用的车辆、电器设备,手持电动工具、电源线、登高梯等,使用前经安全员检查后合格后,方可使用。
4)      所有驾驶员(专职、兼职),都必须参加安全学习和安全教育活动,树立良好的安全意识,严格按照安全操作规程,保证安全行车。
5)      运维前运维班组人员,在外运维时,必须随身携带胸卡、安全帽、安全带及试电笔。
6)      运维时,禁止赤脚、穿拖鞋或凉鞋作业,必须穿有绝缘胶底软鞋。
7)      运维现场配备专职安全员,行驶检查、监督、指导等职能。
8)      运维现场有专门的安全管理人员监督和检查,做好运维现场的围蔽、保护、和设置车辆导向标志牌和运维告示牌,防止维护人员和设备受到伤害或损失,保护行人、车辆的安全。
9)      检查、消除、防范现场已存在的或可能存在的各种不安全的事故隐患。
10)    对运维现场使用的电源线,按照不同的运维环境,合理接至设备,不得随意乱拖、乱拉、乱接电源线。
11)    强化运维现场生产管理,严禁违章操作、违章指挥。
12)    加强对运维场地周围环境的管理,运维中不准往上、朝下、向外乱抛铁丝、材料、工具等物,一旦发现,采取罚款处理。
13)    禁止与工程无关人员进入运维现场。
14)    对业主在安全检查中提出的问题,制定整改措施,定时、定人实施整改。
15)    作业完毕必须将现场清理干净,将存在隐患排除,做到文明运维。
文本框: 事故文本框: 事故

  • 事故是指系统非计划性全阻
  • 平均修复时间(MTTR):包含检测时间和解决时间的平均停机时间
  • 平均故障间隔时间(MTBF):平均正常运营时间
  • 平均系统无故障时间(MTBSI):两次事件之间的平均时间

文明运维

文明运维的组织管理

1、组织和制度管理
1)  运维现场成立以项目经理为第一责任人的文明运维管理组织。
2)  编制文明运维的规定。
3)  设专人进行运维现场文明检查、考核及奖惩管理。
2、 加强文明运维的宣传和教育
1)  在坚持岗位练兵基础上,并采取派出去、请进来、短期培训、上技术课、看录像、看电视等方法狠抓教育工作。
2)  特别注意对新进员工的岗前教育。
3)  专业管理人员要熟悉掌握文明运维的规定。

系统安全运行的保障措施

  • 建立健全的安全保障制度、安全保密制度、用户信息安全管理制度;建立健全的负责人、直接负责人、维护人员三级信息安全责任制和信息发布的审批制度;
  • 建立专门的标准机房,放置网络服务器,配备后备式 UPS,及足够功率的空调;
  • 机房门窗安全、牢固,防撬防盗性能好,非工作人员不得随意进入;
  • 设备性能稳定、安全性好。;
  • 系统均安装了正版的防病毒软件,对计算机病毒、有害电子邮件有整套的防范措施,防止有害信息对网络系统的干扰和破坏;
  • 信息管理系统建立双机热备份机制,一旦主系统遇到故障或受到攻击导致不能正常运行,保证备用系统能及时替换主系统提供服务;
  • 关闭操作系统中暂不使用的服务功能,及相关端口,并及时用补丁修复系统漏洞,定期责杀病毒;
  • 网络提供集中式权限管理,针对不同的应用系统、终端、操作人员,由网站系统管理员设置共享数据库信息的访问权限,并设置相应的密码及口令。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏自己的口令。对操作人员的权限严格按照岗位职责设定,并由网络系统管理员定期检查操作人员权限;
  • 设备平时处于锁定状态,并保管好登录密码;
  • 后台管理界面须设置超级用户名及密码,并绑定IP,以防他人登入;
  • 所有信息发布之前必须经分管领导审核;
  • 工作人员采集信息必须严格遵守国家的有关法律、法规和相关规定;
  • 用户信息由网络工作人员专人负责管理,并执行严格保密制度,未经允许不得向他人泄露。