×

微信扫一扫,快捷登录!

标签: 数据中心


3 标准应用成果
3.1 项目信息


    客户名称:中国建设银行股份有限公司广东省分行
    项目名称:计算资源池和备份资源池运维项目
    实施单位:广州南天电脑系统有限公司
    实施周期:2010.01-2013.11


3.2 挑战和压力
    中国建设银行广东省分行是中国建设银行辖下规模最大的一级分行,网点数量、员工数量、资产规模、自助设备规模等均排名第一。信息化基础设施建设已经形成了较大规模,形成了主数据中心及同城灾备中心的双数据中心模式。数据中心机房有1 000 多台主机设备,4 800 多台网络设备;业务系统230 多个,其中总行系统58 个,人民银行系统5 个,分行系统167 个,信息化建设的重点逐步由新系统的开发向新系统开发与运维管理并重发展。庞杂的运维工作由运行管理岗牵头,技术支持、网络、应用开发分别组成相应技术条件的专业团队提供具体的技术服务,由安全管理岗对全程生产进行质量保证。
    信息技术部面临的挑战和压力主要是:
    面对如此庞大的应用和设备,如何全面感知和发现系统的异常情况;如何保证内部运维团队和外部服务供应商的无缝融合,将运维过程标准化,以提高效率;如何应用先进技术,简化IT 架构的复杂性。

3.3 实施内容
    作为第一批参与ITSS 广东省验证试点单位,南天公司和广东省建行根据需求实际情况,重点选择和参考了《信息技术服务 运行维护 第4 部分:数据中心规范》标准来改进IT 服务能力。


3.4 实施过程


  ● 监控系统完善
    提前感知故障隐患和及时发现异常情况是运维工作的首要工作。广东省建行有230 多个业务系统,其中关键业务系统23 个,已实现操作系统、数据库、中间件、网络等99% 以上监控指标覆盖;重要业务系统53 个,一般业务系统150 多个。为了进一步提高业务的可用性,参考《信息技术服务 运行维护 第4 部分:数据中心规范》,除了原有关键系统100%覆盖以外,实现了一般系统的监控覆盖率从2010 年初的零监控提高到2011 年的99%,SOP 监控集中管理框架如图3 所示,CMPB 系统收集的监控数据送至SOP 平台,并对这些事件进行归一化处理,事件告警和统一展现,相关系统人员可通过标准操作平台(SOP) 进行系统运行状态监控及分析,实现了机房基础设施和系统平台( 网络设备、主机设备、数据库) 的集中监控。

      同时,为了实现应用级的监控,在现有基础上

   

建立统一的监控数据链( 机房基础设施+ 系统平台+ 应用系统) 是必要的,对授权支付、储蓄特色、金融服务、资金归结等关键业务系统,开发了与SOP系统相应的系统接口,通过参数化的配置和定制,428 个交易服务实现了交易笔数、交易成功率的监控,对20 多个应用守护进程、34 个应用服务实现了状态的监控。在此基础上,下一步将研发基于全行业务的运维指挥辅助管理系统。


● 流程和文档的标准化
    中国建行广东省分行已建立符合ITSS 的事件管理、问题管理、变更管理和配置管理四个关键流程,二线设有六个专业技术团队,包括Oracle、UNIX、监控、应用、虚拟化及存储备份团队,各团队需完成系统监控、巡检及日常维护工作,编制相关系统的运维文档等。为提高运维的可靠性和效率,实现多个运维供应商的统一管理,应对技术人员流失或岗位变动的影响,参考《信息技术服务 运行维护 第4 部分:数据中心规范》,对数据中心运维交付内容进行了标准化。整理项目文档模板八份,包括项目周报、月报、软硬件产品的预防性巡检模板、故障处理报告、值班工作单等,并着手梳理服务质量评价指标体系;技术文档方面,按主机、存储、操作系统、中间件、虚拟化、应用系统等组件分类,编制标准化的运维手册( 含系统安装、常见故障处置、巡检、应急处置等)15 份,知识库收纳应用系统资料90 份,标准化重启系统文档112 份,应急文档96 份,
有效提高了事件处理效率。


● 利用先进技术优化基础架构,减轻运维压力
    针对中国建行广东省分行庞大的服务群所带来的管理和维护压力,采用服务器虚拟化技术(VMWARE+ 刀片服务器) 对现有的基础架构进行优化,迁移及整合了包括WEB 合并整合、TS 运维操作、数据集市系统等50 多个应用系统共400 多台服务器至虚拟化平台上,所有虚拟机统一由CMPB 及SOP平台进行监控,而VC 管理服务器及物理服务器则通过短信平台进行统一发送报错信息。虚拟化技术的运用,提高服务器/ 管理员的配比( 从20:1 左右提高到200:1),加快了应用程序开发和部署的周期,提高了灾难恢复能力,将因硬件故障而造成业务中
断的影响降到最低,从而系统减轻了运维压力。


3.5 实施效果
    通过运用《信息技术服务 运行维护 第4 部分:数据中心规范》,结合自身的实际情况改进运维服务,中国建行广东省分行计算资源池的运维服务项目取得了良好的效果,保障并推动了建行业务的健康发展,关键系统、重要系统及一般系统的累计故障时间都较2012 年大幅下降10% 以上,所有系统实现100% 监控覆盖,实现了自动巡检,尽可能将故障的苗头扼杀在萌芽状态;所有重要的流程都做到了文档化、合规化和标准化;中国建行广东省分行信息化的建设有力地推动了其业务的发展,而IT 运维的标准化则为业务的稳定运行和高速发展提供了强有力的保障,由此将产生的巨大的经济效益和社会效益。


*************************************************************
    返回到首页 《数据中心规范运维标准要点及实施应用》连载http://www.ITILxf.com/thread-36986-1-1.htmlITSS、培训、服务、资格、评估、ITSS培训师、ITSS评估师、实施ITSS、ITSS符合性、ITSS服务工程师、ITSS服务项目经理、ITSS标准、ITSS咨询、ITSS工具、IT服务监理、ITSS体系、ITSS服务质量、评价、指标、运维、治理、咨询、ITSS出版物、ITSS产品、服务监理工具、服务质量评价工具、标准符合性评估工具、服务管理工具、服务治理工具、系统监控工具、辅助决策分析、服务支持管理、基础设施监控、ITSS基础教材、ITSS标准、ITSS服务人员培训教材、标准化、专业化、人员(People)、流程[1](Process)、技术(Technology)和资源(Resource),简称PPTR、规划设计(Planning&Design)、部署实施(Implementing)、服务运营(Operation)、持续改进(Improvement)和监督管理(Supervision),简称PIOIS、服务交付规范、资源要求、外包管理、服务交付、分类、代码、服务指南、通用要求、指标体系、ITSS落地实践交流-QQ群:21542747

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x




上一篇:数据中心规范运维标准要点及实施应用---2
下一篇:数据中心规范运维标准要点及实施应用---4
tom615

写了 325 篇文章,拥有财富 4189,被 6 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

返回顶部