设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国金融电脑 > 2024年8月
中国农业银行数据中心总经理佟梅:打造安全高效绿色数据中心,推动算力基础设施高质量发展

中国农业银行数据中心总经理 佟梅

  为加强计算、网络、存储和应用协同创新,推动算力基础设施的高质量发展,工业和信息化部、中国人民银行等六部门联合印发了《算力基础设施高质量发展行动计划》。该行动计划以构建现代化基础设施体系为目标,明确完善算力综合供给体系、提升算力高效运载能力、强化存力高效灵活保障、深化算力赋能行业应用、促进绿色低碳算力发展、加强安全保障能力建设六个方面的重点任务,为金融业算力基础设施建设指明了方向。

  农业银行坚持统筹高质量发展和高水平安全,紧扣行党委“平稳、高效、安全、精准、敏捷、简单”的方针要求,扎实开展“提质、增效、降本”三维提升工程,大力推动云原生、数据湖等技术引入与落地,全面打造东西协同、总分协同的高效算力基础设施,初步建成一体协同、可靠安全、智慧运营、先进高效、绿色低碳的现代化计算、运载及存储中心,为全行业务发展提供更为精准、高效的算力支持。

一、提质——算力一体协同

  2022年,国家“东数西算”工程正式全面启动,农业银行积极落实国家“东数西算”战略,综合考量业务和技术发展趋势、灾备体系布局等,启动内蒙古数据中心建设工程,充分利用西部算力资源支撑东部数据处理业务,实现算力布局提质。2023年,在完成大数据系统规模化迁移工程及分行数据全面上云工程后,农业银行初步完成算力布局和信息系统部署架构优化(如图1所示),基本实现东西部算力高效互补、总分行一体协同联动。

图1 农业银行算力布局调优示意

  1.东西算力一体化

  农业银行综合考量业务属性、区域分布、运营成本等因素,将网络传输延时要求高、需要快速响应的“热数据”业务,保留在位于上海、北京的东部数据中心,提升客户体验;将对网络传输延时不敏感的业务向位于内蒙古的西部数据中心迁移,大数据、AI大模型等需求全部由西部数据中心承接,在低成本实现大规模、高效能海量算力扩展的同时,同步提升西部算力设施的利用效率。在行业实践方面,农业银行实施了“东数西算”规模化迁移工程,采用“以物理搬迁为主、以逻辑迁移为辅”的搬迁方案,把能源消耗大、机房空间占用多、以“温冷数据”为主的大数据平台系统迁移至内蒙古数据中心。

  2.总分算力协同化

  农业银行从算力设施稳定性、算力应用敏捷性、算力效能集约化三个方面,不断推进以“云平台+分布式数据库”为底座的基础设施高质量发展,并坚持精益化经营思路,基于全栈云原生框架在总行数据中心构建分行数据云,向分行提供总行级服务质量的运营支撑体系,构建了全集团一体化的“三地六中心+分行分布式云”算力网络。在行业实践方面,农业银行深入实施以“用数”为核心的分行应用、数据上云工程,进一步推动总分行算力与数据的协同化运用,实现了总分行之间的系统布局调优,让分行用数更方便、管数更规范、存数更安全。

二、提质——架构可靠安全

  农业银行在构建“三地六中心”算力布局的基础上,根据日常生产、同城灾备、异地容灾、极端条件保障能力等需求,细化构建了多层级、高可靠的算力设施架构,并通过容灾工程建设,打造了全天候自动化的一键切换能力,同时持续提升算力基础设施安全纵深防御能力,实现架构安全提质升级。

  1.打造多层次高可用架构

  农业银行在架构设计上采用区域级、园区级、设备级的高可用架构,以防范不同影响层面的故障。在区域级高可用方面,全面构建京沪蒙三地异地容灾架构,通过分级异地容灾部署,防止区域性灾难,具备良好的区域级高可用能力;在园区级高可用方面,大力挖潜同城机房容量,推进同城新机房建设,开展高等级应用双活架构改造,有效提升园区级高可用水平;在设备级高可用方面,每个机房模块的供配电、暖通、网络等基础设施均采用“2N+”双冗余容错架构,消除单点故障。农业银行北京数据中心为我国金融业首个获得权威认证机构Uptime Institute颁发的T4(最高级别)标准认证的数据中心,这充分印证了农业银行数据中心架构设计的高可靠与高容错性。

  2.增强业务连续保障能力

  在容灾建设方面,农业银行按照“容灾底线、统筹兼顾、安全优先、分级分类、迭代优化”的思路,持续推进“双活+灾备”的容灾工程建设,打造全天候、全场景、全链路容灾的业务连续性保障体系;已全部高标准完成高等级应用系统同城双活建设,为事件处置等提供了快速、高效的应急手段,能够有效保障重要业务的连续性。在容灾演练方面,农业银行面向业务链路和新技术栈,采用平战结合的模式,常态化开展同城及异地切换演练,形成了一套成熟稳定的监控、决策、切换处置机制流程与配套工具。

  3.提升网络安全防护能力

  为落实国家网络安全战略,提升全集团网络安全防护水平,农业银行推动关键技术创新和平台研发,打造了全周期、全覆盖、全资产、一体化的立体纵深防御体系,即构建全生命周期贯通的研发运营安全体系(DevSecOps),实现安全防控左移;构建全覆盖的“四横一纵”技防架构,实现对总分行、境外机构、子公司深度赋能;构建基于全量资产的新一代脆弱性管理平台,实现主动安全防护;构建企业级一体化安全运营中心,实现威胁发现、监测预警、应对处置效率的显著提升,坚实保障农业银行8亿个人客户和1000万企业客户的资金与信息安全。

三、增效——运营平稳智慧

  除了在架构设计与网络防护方面增强算力可靠性外,农业银行还通过自动化、智能化手段不断助力算力运营增效。经过近十年的探索与建设,农业银行按照一体化、平台化、数字化、智能化的原则,建设了基础设施全覆盖、应用和底层紧关联、总分行一体化的技术运营体系,算力基础设施运行态势日趋稳定。

  1.全局规划,构建统一运营平台

  为应对架构复杂性、故障隐蔽性、影响次生性等多重变化挑战,农业银行围绕全行统一的运维制度规范和工具平台,整体设计、全局规划,统筹实施了一体化生产运维平台提升工程,实现全行计算、网络、存储基础设施的统一纳管,并贯通各生产运行场景,打造了全行生产运行统一视图,构建了“监—管—控—配—析”五位一体联动的基础设施运营体系,助力上层应用与算力基础设施的联动分析处置。

  2.场景驱动,落地“无感”技控工具

  农业银行依托一体化生产运维平台,以合规为基础,以数据为支撑,以场景为驱动,将管理流程及数据交互融入各类场景化工作台的使用之中,确保操作与关联数据的实时联动,实现流程操作与数据保鲜的“无感”化技控。通过贯通研发测试、投产变更和日常维护三大流程,农业银行打造了可顺畅流转的算力运营全链条,高效开展容量评估、资源交付、数据维护、变更管理等工作。

  3.AI赋能,聚焦智慧运营建设

  在智慧运营方面,农业银行基于AIOps理念,聚焦监控、应急、变更等运维领域,构建了涵盖多维分析洞察、运行风险预测、故障智能诊断、无阈值告警、指标化运营等方面的AI运营体系,有效提升了全局分析能力和应急处置效率。例如,在故障智能诊断方面,农业银行复盘历史应急经验与需求,多点发力构建了基于AIOps的故障快处快恢体系,通过提升数据的全面性、准确性、关联性夯实诊断数据基础,基于算法自研和调优实现智能根因定位,通过多类别故障异常场景建设满足不同专业条线的诊断需求,实现故障诊断全覆盖、应急事件平均影响时间压降近40%。

四、增效——技术先进高效

  在保障算力基础设施安全、运营提质的同时,农业银行通过计算、网络、存储、应用的多维度创新,打造高效集约的信息运算资源、网络运载资源、数据存储资源等管理方案,推动算力基础设施增效发展。

  1.构建GPU、CPU异构资源池,释放计算潜能

  农业银行以云平台建设为核心,实现CPU、GPU算力资源的统一管理,打造灵活调度能力,构建了混合池化、算力拆借的异构算力体系;同时充分运用云原生快速供给能力及自动弹性伸缩能力,在提升应用开发和部署效率的同时提升算力资源利用率,使近一年云上CPU平均使用率提升了30%以上,实现了降本与增效的有机结合。

  2.应用“NoF+”技术,构建高效能存储

  农业银行构建了以NoF和RDMA为核心的无损以太网络,实现与传统光纤交换网络相当的IO吞吐表现,在支持存算分离架构和AIGC大模型训练方面,展现出资源和投入之间的良好平衡。利用“NoF+”端到端的NVMe技术,实现存储设备的即插即用和链路故障侦测,深入探索并实施了“分布式数据库+全闪存”的存算分离架构解决方案,充分发挥全闪存储并行数据访问优势,提供有状态应用上云的关键组件,构建了统一的计算和存储网络,实现稳定且更优的IOPS表现,有效提升数据处理的速度和效率,加速数据库和大数据的上云步伐。

  3.自研内容分发体系,优化金融服务体验

  农业银行通过建设全模块自主知识产权的内容分发平台,推出了面向全行的内容分发服务。一方面,以零耦合的形式,为行内各应用系统提供静态资源加速的支撑服务,每日可实现千万级缓存命中,提升了终端用户使用体验;另一方面,减少了各级分行对主干网的带宽消耗,大幅降低了行内通信网络运营成本。

五、降本——运行绿色低碳

  在降本方面,农业银行积极响应国家“双碳”战略,在优化算力布局的基础上,因地制宜在新建机房采取绿色节能技术、对在用机房开展效能优化等举措,积极降低能源消耗,提升数据中心绿色低碳运行水平。

  1.深植绿色低碳转型理念

  中国人民银行在《金融科技发展规划(2022—2025年)》中明确要求,积极应用绿色节能技术和清洁可再生能源,加快数据中心绿色化建设和改造,加强能耗数据监测与管理。农业银行以此为指引,在业界首次提出低碳转型“四多四少”原则,即“多自然少机电、多智能少人工、多循环少废弃、多预防少找补”,推动数据中心低碳转型创新实践。

  2.因地制宜推行绿色实践

  农业银行根据不同地区的气候特点、资源情况等因素,因地制宜选取适合的绿色低碳技术节流开源,在新建机房中采用了间接蒸发冷却、氟泵双循环、光伏发电等技术,节能技术应用处于行业领先水平;对于在用机房深度挖掘节能减排发力点,开展效能优化工作,通过在无人维护时打造“黑灯机房”、在老旧变压器更新扩容时优选高效能变压器,以及余热回收、自然冷却等节能技术应用和持续的节能调适优化等举措减少碳排放,实现PUE有效压降。

  3.人工智能辅助机房能效管理

  农业银行在数据中心能效管理中探索应用人工智能技术,借助AI智能化数据分析算法,识别机房能耗短板,发掘节能潜力,从内因、外因以及内外协同三个方面寻求电力、暖通系统最佳运行参数设置方案,显著降低了机房能耗。如通过对数据中心制冷系统进行数据加工、整合、训练,利用深度神经网络算法、增强学习算法等AI技术建立制冷能效预测模型,实现制冷系统能效智能寻优,进而优化运行工况,动态降低机房运行能耗,节约用电成本。

  农业银行统筹安全、高效与绿色发展,构建了数据中心计算、网络、存储一体的协同架构,持续提升资源供给能力与业务连续性保障水平,加快形成推动全行数字化转型的新引擎。农业银行数据中心将坚持以基础设施创新发展为己任,不断优化完善高效集约、融合互联、安全可靠的新型算力体系,提升配套运营能力,为智慧银行建设提供有力支撑。

 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年06月 2021年05月
查看所有过刊
本期精选
平安证券首席信息官张朝晖:打造高质量算..
中国工商银行数据中心总经理刘方洲:守正..
中国农业银行数据中心总经理佟梅:打造安..
交通银行数据中心总经理孙磊:算力为本,..
邮储银行运营数据中心副总经理巫建刚:算..
兴业银行数据中心总经理吴上荣:稳固算力..
广发银行数据中心副总经理唐海勇:夯实分..
中国银联信息总中心副总经理张翔:稳固算..
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多