设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国金融电脑 > 2022年8月
中国银行信息科技运营中心总经理刘鸿乾:智能运维构筑金融发展新格局


中国银行信息科技运营中心总经理 刘鸿乾

  当前,新一轮科技革命和产业变革正在深刻改变人类社会的组织和经济形态,数字化转型已成为构筑企业乃至国家竞争新优势的战略选择。与此同时,新冠肺炎疫情的常态化防控需求也驱动着各个行业服务模式向非接触、线上化加速演进。未来已来,中国银行作为我国金融体系的重要组成部分,以金融报国为己任,在全面推进集团数字化转型的过程中,积极开拓运维数字化转型之路,通过响应智数新要求、转变运维新思路、夯实运维新实践,加强智能运维建设,筑牢信息科技安全运营的生命线,力求最大化发挥科技价值,高质量赋能金融业务发展,为构筑金融发展新格局进行了积极探索和实践。

  一、数智时代,凸显智能运维全新要求

  数据中心是现代商业银行向客户提供优质金融服务的基石,也是银行防范信息科技风险的第一线。为融入银行业数字化转型的时代进程,银行IT技术架构正由“传统集中式”向“新型分布式”演进,云计算、大数据、人工智能平台等“新基建”快速落地。在“新时代、新基建、新架构”的形势下,IT运维体系建设新要求应时而生。

  一是“更大”,急需“规模化”运营能力。新型分布式架构需要通过大量设备的有机组合,实现基础设施平台整体的高可用性。同时,大数据分析和人工智能算法也需要更大规模的算力作为支撑。据了解,截至2021年底,我国数据中心机架总规模已达到520万架,近5年年均复合增长率超过30%。

  二是“更快”,期待“敏捷化”运营能力。以互联网金融为代表的快速业务创新,要求应用软件产品支持差异化需求实现和敏捷化迭代开发,同时,要求数据中心能够快速交付基础设施环境,支持敏捷投产上线,高效转化IT产出,为一线拼抢市场赢得先机。

  三是“更稳”,要求“安全化”运营能力。安全生产重于泰山,在分布式微服务架构下,应用和技术组件类型与数量繁多,运维对象颗粒度更加细微,架构关联关系异常复杂。生产事件精准定位和快速恢复的难度增大,给筑牢安全生产底线带来了巨大挑战。同时,日趋严格的监管形势也对数据中心的业务连续性管理和网络安全防护能力提出了更高要求。

  四是“更绿色”,希冀“效能化”运营能力。绿色是高质量发展的底色,我国已宣布力争于2030年前实现“碳达峰”、2060年前实现“碳中和”。“双碳”目标和可持续发展战略将长期驱动我国数据中心向绿色低碳方向发展。未来,数据中心的能效政策将不断趋严,并有可能会纳入更多的能效指标。因此,数据中心需要构建环境友好的运营能力,为云计算注入更多绿色动能。

  二、革故鼎新,重塑运维体系顶层设计

  为加快集团数字化转型,中国银行坚持激发活力、敏捷反应、重点突破,全面启动企业级架构建设,对治理体系、业务流程、技术架构和服务模式进行全方位重构,于2021年年底成功投产企业级技术平台,2022年5月成功投产首批业务,同时,力求在更大、更快、更稳、更绿色的运维体系发展要求下,同步实现规模化、敏捷化、安全化、效能化的运维能力目标。

  为此,中国银行根据企业级架构建设的工艺和方法论,重新制定了智能运维领域的顶层设计(如图1所示),规划了资源管理、监控管理、配置管理、服务流程管理、应急处置管理、例行任务管理、可靠性管理等多个能力主题,每个能力主题下设置一个或多个组件,明确了各个能力主题和组件的建设目标和实施路径,形成了智能运维的整体能力地图,指引智能运维整体建设有序开展。

图1 智能运维领域顶层设计

  为强化顶层设计的落地实施,中国银行基于智能运维能力地图,以系统化思维统筹标准、流程、场景、工具和组织等关键层面,形成以分布式智能化为核心的运维工艺体系(如图2所示),向标准、流程和组织要效率,用智能化工具和场景解决规模化和安全化运营难题。

图2 分布式智能运维工艺体系

  分布式智能运维工艺体系充分考虑分布式特性,结合生产运维特点,形成五级分布式智能运维目录,以运维主题领域为纲,以运维要素为目,细化运维活动和任务,夯实运维操作,围绕智能运维场景持续提升分布式智能化运维能力。

  三、步步为营,推进智能运维建设落地

  1.稳扎稳打,夯实智能化运维标准

  百业发展,标准为基;智能运维,标准先行。没有标准化很难实现智能化。中国银行结合新技术、新组件、新运维模式,对运营管理体系制度、技术标准、操作标准和非功能标准进行了再聚焦、再审视以及重检优化,为规模化生产运营提供规范化指导。

  具体而言,运营管理体系标准向分布式新模式延伸,做出适应性调整和优化;技术标准向分布式新技术扩展,对标企业级架构一层技术标准,细化二层技术标准;操作标准向分布式新组件深入,针对新增技术组件以及应用组件,完善形成操作类指南;非功能标准向开发左移,从软件版本、可靠性、可操作性、可扩展性、安全性、灾难恢复等多个层面强化落地效果。

  2.协作连接,优化智能化运维流程

  天下武功,唯快不破。在数字化时代,业务敏捷性对科技部门的快速响应能力提出了更高要求。中国银行将“敏捷化、服务化”作为运维流程的演进目标,为了实现分布式架构上线后变更、事件、监控和容量资源流程的有序衔接,设计了“流程制度+管理要求”相结合的双层管控模式,实现平稳过渡。

  同时,中国银行综合运用持续集成、自动化测试、持续交付、持续部署等多种技术,将立项排期、开发测试、环境交付等软件产品全生命周期各环节的协同流程在线上串联起来,形成开发和运维、管理流程和技术实施之间的数字化协作链条。

  3.激发活力,打造智能化运维组织

  治国经邦,人才为急。数字化时代,最重要的是人才,智能运维建设更需要激发出员工的创新活力。2022年上半年,中国银行完成了总行科技管理体制改革。在改革方案中,充分考虑了“开发与运维深度融合、应用与系统深度融合”的组织转型思路,实现贯穿规划设计、开发测试、投产运维全过程的组织架构对接,驱动同一个应用产品的运维工作从“多头对接”向“一站式”服务转变,形成科技部门全面紧贴业务、全程快速响应的高效融合服务模式,有效提高了支持保障的效率。

  在人才队伍培养和储备方面,中国银行围绕智能运维发展方向,着力建设数据分析师、网络安全专家、分布式尖兵、运维开发工程师等多支专业化队伍,目的是找准未来发展的重点领域,打破技术条线之间的壁垒,在重大工程项目中发挥突击队作用,同时,配套建立相应的激励机制,锤炼形成一支有能力、有干劲的运维“铁军”,收到了很好效果。

  4.励精图治,自研智能化运维工具

  工欲善其事,必先利其器。中国银行秉持“平台集成、数据驱动”的建设思路,基于云原生、大数据等技术,自主研发了“九天”智能化运维平台,集成了统一云资源管理、应用交易监控、配置管理、运维数据分析等模块组件,为运维人员提供了一站式、综合化的平台级运维功能。

  该平台采用需求侧带动供给侧的数据治理策略,明确云平台各类配置数据、日志数据、性能容量数据的消费场景,在此基础上,实现了云平台海量运维数据的统一、有效收集和检索,并充分挖掘这些数据在资源管理、自动化部署、监控应急等运维场景的使用价值;同步实现企业级异构云网资源的统一纳管,支持各种开闭源系统组件的一键式、自动化安装,做到应用运行环境的多地一体化、规模化、分钟级敏捷交付。此外,该平台还建设了以预防为主、以应用为核心、面向服务的全域监控体系,对分布式架构应用组件探索实施监控全覆盖,利用日志中的上下游关联信息,以自学习方式,智能识别并逐笔串联、缝合应用的交易路径和拓扑关系,实现端到端应用交易链路贯穿渠道至核心,确保可追踪、可视化、可诊断。

  5.精准发力,深化智能化运维场景

  直击痛点,以终为始。智能运维体系的建设,不仅仅是人工智能技术在运维领域的应用,还是一项复杂且庞大的系统工程。因此,在具体实施落地的过程中,要做到“知己知彼”。所谓“知己”,就是要找准在分布式架构运维上最急迫、最关键的痛点和薄弱点,优先发力、优先补足;所谓“知彼”,就是要充分认识技术的演进趋势和在一定时间窗口内的能力边界,找准其在运维管理中最契合的适用点和落脚点。

  企业级技术平台投产后,中国银行大幅提升了DevOps敏捷交付、统一云管理、自动化处置、全链路交易监控和可观测性等场景的能力,加强了大数据运维分析和AI智能算法的应用,并在部分智能运维场景实现落地。

  在敏捷交付领域,中国银行通过自动化部署和编排引擎,实现快速资源交付及应用版本部署,大幅缩短了应用版本的发布周期,实现了敏捷响应、高质量交付以及持续反馈,并利用大数据技术实现投产后自动验证。随着应用资源交付能力的显著提升,可在分钟级时间内完成应用的弹性扩缩容。

  在全链路观测领域,中国银行利用大数据流式计算引擎、动态基线、离群检测智能算法、告警智能分析等手段,初步构建秒级监控、全链路监控、动态异常检测、告警风暴抑制四大能力,大幅提升了可观测性,有效缩短了异常发现和问题定位时间。

  在智能应急领域,中国银行打造了应急处置的场景化、自动化和智能化能力,通过海量异构日志分析引擎和排障引擎,自动关联历史事件库,实现告警规则、故障规则和应急决策规则的场景化应用;基于动态资源供给和检测,实现分布式组件的弹性扩缩容、自动化熔断和限流,不断提高系统稳定性;采用组件单元化部署方式,实现交易智能分流,以达到同城双活异地可实切效果,使应急处理效率得到显著提高,特别是在分布式架构下,相比集中式架构,应急操作自动化能力有了质的飞跃。

  在信息安全领域,中国银行基于企业级安全运营中心(SOC)建设理念,与高校共同研发了基于图计算的资产信息系统,解决了资产信息碎片化、更新慢、维护难的问题,同时,加速推进网络安全态势数学模型研究,采用深度学习算法,开展威胁场景的智能化精确检测,取得了良好效果并申报了相关专利。

  四、展望未来,构建数字运维服务生态

  合抱之木,生于毫末;九层之台,起于累土。数字化转型,不仅仅是技术和业务的全面转型,也是制度、流程、工艺和认知的深度转型,将打造全新的一个生态体系。对于运维而言,服从于数字化转型、服务于数字化转型,形成了一个相对独立的运维生态,其努力的方向必然是IT运维的终极赛道——智能运维。未来也必然是建立在高度数字化和自动化基础上的智能化时代。因此,智能运维的前途是星辰大海,其目标不能局限于保障业务连续性、支持业务快速增长和灵活调整,还要实现运维效率的提高、运维成本的降低,完成从技术到价值的持续跨越。在智能运维的高阶阶段,数据中心将不再仅仅是企业的成本中心,而更是企业的核心竞争力。

  目前,中国银行的智能运维建设尚处于探索发展阶段。后续,中国银行将在筑牢安全生产底线的基础上,继续积极研究和应用新的技术成果,加快实现自身运维体系的数字化、智能化,以更好地服务全行发展战略,践行金融报国理念。

  潮平两岸阔,风正一帆悬。中国银行愿与广大同业一起,深入交流,相互借鉴,共同探索智能化运维体系的光明前路!

 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年06月 2021年05月
查看所有过刊
本期精选
《中国金融电脑》2022年第8期目录
工商银行数据中心总经理刘方洲:工商银行..
农业银行数据中心总经理佟梅:智能化赋能..
中国银行信息科技运营中心总经理刘鸿乾:..
兴业银行科技运维部总经理吴上荣:兴业银..
中国银联信息总中心总经理施跃跃:迈向数..
中国工商银行业务研发中心专家任长清:商..
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多