设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国金融电脑 > 2013年9月
陈尚元:数据中心IT运维管理实践与探索

中国农业银行股份有限公司数据中心总经理 陈尚元

  农业银行经过多年信息化建设与实践,逐步走出了独具农业银行特色的IT 运维管理体系建设之路,保障了全行信息系统的安全稳定高效运行,为农业银行稳健经营和业务发展提供了高效的运行服务。

  一、农业银行“两地三中心”体系建设进程

  农业银行高度重视信息化建设,近些年特别强化了安全生产工作,加强了IT 运维管理。早在2005 年,农业银行就确立了“两地三中心”的IT 运维管理模式,即在上海建

  立数据中心和同城灾备中心,在北京部署异地灾难备份中心。数据中心作为生产中心,主要承担日常生产运维调度和一线生产运行管理。同城灾备中心采用GDPS/PPRC 数据实时备份技术进行数据备份,通过系统热备或双活模式,在生产中心发生灾难性事故时无缝对接,实现数据零丢失,快速恢复生产。灾难备份中心采用GDPS/XRC 数据准同步异地备份技术进行数据备份,确保一旦发生自然灾害或区域性灾难时,能利用备份数据快速恢复生产。

  2005 年,农业银行在上海成立了数据中心;2007 年实现了全行核心业务系统和数据由北京迁至上海;2008 年北京成立备援测试中心,实现了业务系统数据在北京和上海之间的远程实时数据备份,2010 年制定了上海同城灾备中心建设可行性研究报告,同时在北京启动了灾备中心建设。

  下一步,农业银行将按照“本地高可用、同城灾备为主、异地灾备为辅”的模式,构建以生产中心为核心的“三位一体”的IT 运维机制,覆盖生产运行、应急管理和灾备管理的各个环节,实现生产、灾备统一调度,设备、资源统一管理,人员定期流转,生产运行定期切换。“两地三中心”全部建成投入使用后,农业银行信息系统的持续运行能力将实现质的提升,综合保障能力将上一个新台阶。

  二、IT运维管理面临的挑战

  在移动互联、云计算、大数据等新技术的驱动下,基于互联网的各种网络金融业务蓬勃发展,给银行的数据中心带来前所未有的压力和挑战。

  一是,信息系统运行安全压力倍增。互联网金融的快速发展对银行提出7×24 小时不间断的业务需求,金融服务向全球化、全天候发展,给IT 生产运行带来巨大压力。2013 年农业银行全行日交易量峰值已突破2.2 亿笔,并以每年40% 的速度递增。此外,新型商业模式推升电子渠道类交易大幅度增长,农业银行电子渠道类交易占比由3 年前的34% 增长到70% 以上。在“双十一”电商大促销期间,短短24 小时农业银行电子商务渠道交易量增长5 倍,呈突发式爆发性的增长,对数据中心处理海量并发交易的能力带来巨大挑战。

  二是,信息系统运维工作的复杂度日益增大。农业银行数据中心生产网连接着全国36 个省域数据中心,联网2 万多个营业机构以及大量的自助设备,为数以亿计的客户提供着数据运行安全保障。大型数据中心规模日趋庞大,系统架构日趋复杂,运维的系统数量不断增加,复杂程度越来越高,运维的压力和风险巨大。

  三是,数据信息安全面临空前考验。互联网金融时代的病毒传播、黑客攻击、信息窃密等已成为银行数据中心的重要安全威胁。银行要进一步完善金融信息安全保密机制和应急处理机制,提升数据中心信息系统的检测、预警、防范、应急处理和自我恢复能力,最大限度降低数据风险,保护客户数据安全,保障业务持续稳定运行。

  三、依托IT运维管理的软实力,实现全方位精细化管理

  全国性的大型数据中心应对互联网金融、保障运行安全的关键在于依托IT 运维管理的软实力,实现全方位的精细化管理。农业银行数据中心在全行“科技先行”发展战略的指引下,始终坚持以安全生产为第一要务,不断推进生产运行的“标准化、规范化、自动化、一体化”建设,全力保障全行信息系统的安全稳定运行,为农业银行业务经营和发展提供强有力的运行保障。

  1. 建立了适应农业银行数据

  中心安全生产的标准化体系

  2009 年农业银行数据中心通过了ISO20000 服务管理体系认证,2010 年通过了ISO27001 信息安全管理体系认证,实现了“双认证”,全面规范了生产运维流程,强化了信息安全管理。与此同时,启动了分行简化版ISO20000 推广, 设计编制分行IT 服务管理标准流程,IT运维标准化体系向各一级分行全面推进,实现全行IT 运维标准化建设的总分联动。

  2. 加强生产运行的规范化建设

  运维操作和基础设施建设是IT运维风险防控的两大重点。一方面全行推广使用了生产运维操作规范,实现操作流程的统一规范和操作行为的可监督、可审计、可追溯,有效防范操作风险。另一方面,分步实施一、二级分行机房等基础领域五大达标工程,全面提升了分行的风险防控能力和基础环境规范化管理水平。

  3. 建设生产运维平台,实现运行作业自动化

  农业银行近几年着重通过搭建技术平台加强运维管理自动化建设。通过能够实时监控系统运行状况的集中监控系统、统一规范的电子化运行维护流程和服务支持平台、灵活准确的生产运行数据分析平台,逐步实现系统监控的集中化、服务流程的电子化、运维操作的自动化和决策支持的可视化,不断提高生产运行监控、操作和管理的信息化水平,进而提升服务可用性和客户满意度。

  4. 建立健全一体化生产运行体系

  农业银行在建立全行“统一响应支持、统一生产调度、统一布置维检、统一质量管理、统一生产培训”的准军事化管理模式方面坚持不懈地进行探索。近年来,通过生产运行日例会、月例会,生产运行指令单,生产调度管理等常态化的运行管理机制,加强考核,加大培训力度,强化数据中心在全行生产运行中的一线管理职能,一体化生产运行体系日益完善。

  四、做好风险防控,强化IT运维管理

  全国数据大集中导致风险随之集中。风险呈现出多样性和全局性特点,影响范围更广、程度更深。一旦IT 运维管理不当,容易引发运行中断事故,将对全行经营产生巨大影响, 造成不良的社会影响。数据中心通过“ 强化风险防控、加大数据管控、深化应急管理”等措施,努力保障对外服务的安全性和连续性。

  风险防控方面,运用管理和技术手段,多层次、全方位保障系统运维安全。管理上,建立健全文件化的信息安全管理体系,完善风险评估机制、监督检查机制、整改督办机制,及时发现薄弱环节,消除风险隐患。在日常运维中,狠抓操作风险控制,定期梳理IT 运维过程中的高风险操作,严格执行“双人操作、专人复核”,有效降低误操作,避免人为原因造成的故障。同时,注重员工安全意识培养,使员工牢固树立“违规就是风险,安全就是效益”的理念。技术上,加强工具平台风险防控能力建设,部署了数据中心终端安全防护策略,启动特权账号管理系统建设,推进生产系统集中安全审计,运用多种技术组合实现对生产系统病毒传播的全面监控以及黑客入侵的有效防范,提升了生产运维环境的安全性和保密性。数据管控方面,充分利用数据大集中的优势,运用数据分析和管控工具,驱动业务经营风险防范。通过持续推进不规范数据清理,深入开展生产数据后台风险监测和预警,查找业务经营中的风险隐患,助推业务经营稳健发展。应急管理方面,形成了以“快速响应、快速定位、快速处置”为指导原则的“三快”应急处置机制,强化风险防范。推进了总分行值班长机制,强化生产运维的现场组织保障,确保生产运维突发事件的高效处置。定期组织实施桌面应急演练、实战应急演练和全行性灾备应急演练,做到周周有演练,并实现演练从单一专业向多专业协作转变。五、应用新技术打造新一代数据中心农业银行数据中心在支持全行业务发展中发挥了重要的支撑和保障作用。数据中心是农业银行的“心脏”,其连续运行服务能力直接影响着全行业务经营和发展,直接关系到农业银行的品牌价值和社会美誉度。

    目前,农业银行数据中心生产系统整体可用率达到99.9%,基本实现了7×24 小时全天候不间断持续运行,为全行业务的发展提供了坚实基础。通过数据中心平台,可以实现产品的快速部署和全面应用。数据中心在推进全行业务拓展、提升农业银行市场竞争力方面发挥了积极作用。同时,农业银行通过加强对数据中心已投产产品质量、交易量、运维情况的评估和分析,对资源消耗大、使用效率低、有效用户少、经济效益差的产品进行综合分析,整合增效, 使信息系统资源使用更加合理、高效,实现集约化运营。近年来, 农业银行数据中心结合国内外信息技术发展趋势,积极研究新技术的应用。在硬件设施建设方面, 采用业界先进的SYSPLEX“ 并行耦合体”、PC服务器虚拟化、负载均衡等先进技术, 极大地保障了系统硬件的高可用性、性能可扩展能力和利用率,IT 运维管理的集约化程度大大提高。在基础设施管理方面,使用计算机设备硬件监控系统,实时监控大型主机、小型机、PC 服务器等生产设备的运行状态,运维管理效率进一步提高。自主研发了电网瞬间波动报警装置,监控灵敏度达毫秒级,实现了外电网电源异常波动报警的快速、有效,保障了数据中心基础环境安全。目前,国内银行数据中心普遍存在成本快速增加、资源管理日益复杂、信息安全、能源危机等问题, 建设新一代数据中心已成为了业界讨论的热门话题。新一代数据中心应大力倡导“节能、高效、集约”,通过虚拟化、云计算等新技术, 标准模块化软件以及太阳能、风能等环保能源,提高能源和空间的利用率, 实现自动化运营、集约化管理和智能化服务,打造“高效率、低能耗,高整合、低占空,高可用、低风险”的绿色数据中心。

 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年06月 2021年05月
查看所有过刊
本期精选
《中国金融电脑》2013年9月目录
陈尚元:数据中心IT运维管理实践与探索
打造新型金融IT运维管理模式——访中国光..
袁俊德:大型银行“两地三中心”运营体系..
张春林:招商银行“双中心运行”管理实践..
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多