中国银联信息总中心副总经理张翔
在当今信息化、数字化的浪潮中,金融业的高质量发展离不开坚实的算力基础设施作为支撑。2023年10月,工业和信息化部、中国人民银行等六部门联合印发《算力基础设施高质量发展行动计划》,从计算力、运载力、存储力以及应用赋能四个方面明确提出了到2025年的发展量化指标。其中,在计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%;骨干网、城域网全面支持IPv6、SRv6等新技术使用占比达到40%;存储总量超过1800EB,先进存储容量占比达到30%以上。这一目标的实现将极大提升各行各业的数字化水平和服务质量。
一、算力基础设施高质量发展的实践与成果
中国银联坚持守正创新,致力于稳固算力基础设施的基石,构筑新时代的转接清算网络。目前,基于自主可控设备和自主研发的关键技术,中国银联已成功构建体系完备、多中心协同、功能齐全且性能卓越的第三代跨行转接清算系统架构,高效支撑全球业务发展,实现系统处理能力、系统容量、交易成功率在行业内领先。同时,中国银联把握业务发展脉搏,在隐私计算、物联网以及AI大模型等前沿技术领域进行了深入探索,成功打造生物特征识别、智能风控、普惠金融、智能客服和智能运营等一系列智能应用场景,为金融业的高质量发展提供了源源不断的强劲动力。
在公司的统一战略规划下,中国银联信息总中心严守生产安全红线,紧跟技术发展的时代脉搏,勇于革新,以“战略驱动、价值引领、服务导向、绿色安全”为行动准则,积极践行数据中心绿色发展的新理念,深化“绿色、安全、智能、高效”数据中心的建设目标,不断优化数据中心布局,完善算力综合供给体系,致力于提升算力的高效运载能力,并强化算力的灵活性和统一调度;同时,深化算力在金融业应用的赋能作用,推动绿色低碳算力的发展,以更全面的视野、更大的力度、更高的质量,加速夯实算力基础底座,为公司及产业各方的业务发展提供强有力的支撑。
1.强化综合算力供给能力,构建绿色低碳数据中心
为提升综合算力供给能力,中国银联信息总中心不断加强算力基础设施建设。新建的黄山数据中心一期建筑面积达6.62万平方米,遵循国标A级机房标准设计,一期增加标准机柜数量近6000个,计划2026年底投入运营,以应对不断攀升的算力需求。
在提升算力供给能力的同时,中国银联信息总中心构建绿色低碳数据中心,积极开展可再生能源和液冷技术等绿色节能技术研究。黄山数据中心规划了间接蒸发冷却AHU系统、高效供配电技术和节能新技术应用路线,以进一步提高可再生能源利用率,降低PUE。上海和北京数据中心则采用冷源优化、自然冷却和高效供电等技术实现风冷空调节能改造,通过加装氟泵、压缩机变频改造和电子膨胀阀等技术,实现精密空调节能40%,年均节电约95万度,减少约400吨二氧化碳排放。
通过物联网和神经网络技术,结合IT负载与地域气候特性,中国银联信息总中心根据银联业务场景建立了全局能耗模型,提升制冷系统智能控制能力。自主研发的冷源能效管理系统可对大模型和高算力服务器进行优化,实现全局节能智控,算力能耗管理成果显著,荣获“科创中国”金融科技创新大赛(2023)“金融数字化基础设施创新专题赛项目奖”。中国银联信息总中心还通过能耗核查与评估,借助大数据平台构建能耗分析模块,实现数据中心能耗的精细化监控和管理,加速推动中心向更高效、更经济的运营目标迈进。
2.适度超前建设骨干网,提高算力运载能力和质量
为提升算力运载能力,中国银联信息总中心建设了高效骨干枢纽传输网。在上海、北京数据中心部署核心P(Provider)节点,在36个分公司所在城市部署PE(Provider
Edge)节点,通过OTN线路互联,构建了SRv6骨干网。目前,局域网已接入25G服务器和100G网络设备互联的SDN网络,较好地满足了转接清算等关键基础设施以及大数据、分布式存储、AI模型训练等新技术对于局域网带宽的需求。此外,中国银联信息总中心启动了400G/800G超宽局域网技术研究,以确保网络技术能够领先于未来发展的需求。
在算力运载管理方面,中国银联信息总中心通过构建算力网络融合控制器、云资源池,实现全网统一管控,利用多AZ及多Region部署,实现了云上云下流量的快速互通,通过对网络设备故障预测和发现,实现快速的根因分析和定位,有效保障算力网络高可用性和安全性。在此基础上,中国银联信息总中心采用拥塞通知技术以及流量控制和调度技术,不仅避免了网络拥塞,还实现了负载均衡和动态路由选择,确保了局域网的低延迟和零丢包性能,从而优化了算力的高效运载质量,满足了人脸识别等应用对低延迟、高可靠的网络性能需求。
在算力运载智能化方面,中国银联信息总中心利用网络流量可视化及智能调度技术,以及网络资源随业务量自动调整的能力,构建了边缘服务网络,实现就近、快速地为用户提供服务,进一步提高了用户体验和满意度。这些技术进步不仅提升了网络的运营效率,也为银联业务的持续扩展和创新奠定了坚实的基础。
3.开展算力统一调度探索,采用混合部署实现算力高效利用
信息总中心以中国银联云计算建设规划为核心,积极推进一云两线多芯架构规划落地,通过多层次算力调度,屏蔽平台差异,实现异构资源的统一管理和调度,实现CPU、GPU等多元异构算力跨平台、跨业务系统、跨层级算力资源的协同联动与精准匹配。在此基础上,中国银联信息总中心不断深化基于容器的算力调度探索,实现云原生应用、大数据和数据库的混合部署;利用预测和趋势分析等方法自动感知空闲算力资源,结合容器快速部署和弹性伸缩特性,智能选择最优的算力资源进行计算任务分配和执行,实现算力的高效利用。
在大数据方面,中国银联信息总中心在大数据集群存算分离架构上,探索计算资源的横向动态弹性扩展技术方案,自研了一种队列计算资源弹性调度算法。该算法参考集群队列资源使用情况的历史规律,并结合短期趋势分析,实现分钟粒度的准实时动态调整队列的内存和CPU资源配置。当前,该算法已被应用于生产大数据集群,使集群整体资源使用率提升了10%。
在数据库方面,中国银联信息总中心利用基于容器的智能化数据库云平台(DBaaS)开展多个层面的混合部署研究和实践,使用AHP算法,基于数据库资源需求特征进行重要程度赋值,通过特征值和层次迭代法确定方案层权重,并将其作为重要的调度依据。该平台在多品牌CPU架构服务器上,通过数据库和CPU测试,综合评估数据库算力,实现同集群、同服务内不同芯片混合部署,确保算力一致;利用容器弹性和数据库在线扩缩能力,落地基于告警触发和指数平滑预测的弹性扩缩方案,充分满足了规律性和突发性资源需求。
4.建设智能算力应用场景,提升智能算力应用程度
中国银联信息总中心以全领域、多层次、高质量的数据资产为驱动力,不断推进智能算力应用场景建设,以拓展智能算力应用的深度和广度。为实现这一目标,中国银联信息总中心建立了一套通用且具有行业参考价值的系统全景感知体系。该体系成功打破数据孤岛,实现了基于运维对象的全生命周期健康状态即时量化观测。依托这套感知体系,结合高效的工程化机器学习模型,中国银联信息总中心构建了异常因素传播链路,提供准确、及时的故障下探功能。这一功能不仅实现了从面向过程到面向对象的运维转变,还可帮助一线运维人员清晰地识别问题根源,并快速进行处置。
在智能算力场景建设方面,中国银联信息总中心重点构建无人值守的故障自愈智能决策能力,通过打通异常发现、逻辑计算、自愈下发的决策链路,实现应用中心切换、弹性扩容、云集群隔离、网络大通道切换、异常节点自愈等场景的无人值守决策。此外,中国银联信息总中心还开展大语言模型的本地化创新与实践,自主研发“谏言”大语言模型管理系统,在事件总结、知识问答、自然语言转SQL、故障诊断和处理、SQL语句优化、脚本编码、变更安全风险评估、入网测试、资源预测等十余个场景提供高效稳定的运营辅助服务,使运营效率整体提升20%以上。
5.推进算力新技术应用,参与算力基础设施标准制定
中国银联信息总中心积极开展计算存储、分布式存储、云存储等网络存储技术在核心业务场景的应用,实现数据的高效压缩、传输和共享。根据自身业务特性,中国银联信息总中心在数据库等场景探索落地存算一体化,将计算和存储紧密结合,把数据处理工作移到离数据更近的地方,减少数据传输延迟,提高数据处理效率;积极推进边缘计算应用的落地,试点建设了边缘计算节点,并有效推进边缘计算在金融领域的应用;实现算力智能化管理,打造算力基础设施全自动、全互联、自运维基础设施环境,实现全方位故障感知以及智能决策系统下发变更、指令维护。
中国银联信息总中心根据在算力基础设施建设中积累的实践经验,积极参与算力基础设施标准制定,为金融业算力发展贡献力量:参与金融业绿色高可用数据中心行业标准的编制,提出数据中心运行过程中在节能、低碳、节水、污染控制等方面的指导意见,确保日常运维符合绿色高标准;加入工业和信息化部中国电子技术标准化研究院计算产品性能基准工作组,参与计算产品性能标准的研制、工具验证和优化,为算力标准化和算力评价贡献金融业场景,提升金融业在算力基础设施标准制定中的影响力。
二、算力基础设施未来发展趋势
算力基础设施作为支撑数字经济发展的核心要素,展现出多元、智能、绿色和灵活的特征。长远来看,金融业算力基础设施的发展趋势大致可以归纳为以下四个方面。
一是算力需求多样化并且迅速增长。随着金融业数字化转型的不断深入以及智能算力、大模型等技术的广泛应用,金融业的算力需求将从单一通用算力向智能算力等多元方向发展,并且需求呈现快速增长趋势。未来,在算力方面,金融业将更加注重高性能计算和大规模数据处理能力,也会更加注重绿色化和智能化升级。
二是算力网络智能化程度不断提升。算力网络的演进将经历三个阶段,从算网协同逐步走向算网融合,最终发展为云网一体。未来,金融业的算力基础设施将更加注重网络协同,通过对算力资源、网络资源以及业务场景的协同感知,按照需要将业务调度到合适的节点,实现算网资源统一编排、统一运维、统一优化。
三是算力发展主旋律仍是绿色低碳。在金融业,建设绿色高可用数据中心已成为共识。液冷、异构计算等新兴技术将被广泛应用,以提高换热效率和计算性能。同时,金融数据中心将越来越多地采用无损网络,并按需调度计算资源进行云服务模式创新,以满足海量数据的高效计算需求。
四是算力调度更加高效灵活。为了应对数据的爆炸式增长,金融业需要通过智能分配策略实现算力的高效流动,实现全网算力资源的智能编排、弹性调度。金融业的算力基础设施将加速算力、存力和运力的灵活调度,达到算力需求和供给的平衡,快速满足上层应用多样化的算力需求。这一高效灵活的算力调度能力是金融数字化转型的重要保障。
算力基础设施的发展将会拓展金融场景应用,提升金融服务的效率和质量,为我国金融业高质量发展提供更加强有力的支持。中国银联在算力基础设施高质量发展方面取得了显著成效,但仍面临一系列挑战和机遇。中国银联信息总中心作为我国银行卡交易的核心处理和传输中心,将继续加强算力基础设施建设,提升多元算力供给能力和服务质量,积极推动支付行业的数字化转型和创新发展。同时,中国银联还将积极响应国家政策号召,加强与其他行业的合作与交流,共同推动算力基础设施的高质量发展,为数字经济的繁荣和发展贡献力量。
|