大家保险集团有限责任公司信息科技部总经理 郝晓波
近年来,大数据、云计算、人工智能等新技术与金融业深度融合,不仅为金融业务高效、安全发展提供了强大的基础设施支撑,也为金融业务创新注入了强劲动力。聚焦保险领域,保险科技目前已进入快速发展和应用阶段,正逐步改变着保险业的经营模式、竞争格局和产业生态。在此背景下,大家保险集团有限责任公司(以下简称“大家保险”)自成立以来即聚焦保险主业和本源服务,积极探索推动保险业健康发展的转型之路,并围绕业务前台、科技中台、资源后台和科技治理制定“3+1”科技蓝图,着力开展基础设施数字化建设,以实现对业务的敏捷性支持为关键动力,以打造弹性稳健的IT资源平台为核心目标,坚持用数字化能力赋能业务创新,致力于为个人客户、家庭客户和团体客户提供涵盖人身保险、财产保险、养老保障、财富管理的一站式保险服务方案。
一、混合云架构,从传统向云化转型
随着信息化水平的不断提高,传统物理机、虚拟机等架构设计已愈发难以支撑大家保险科技赋能战略,推动基础架构云化、容器化转型成为持续提升数字化能力的重要方向。自2019年起,大家保险结合公司科技战略,积极探索云计算、容器化技术的落地方案,历时三年建立贯穿基础设施、技术中台、业务平台的多层次混合云架构,倾力推动云计算技术与保险业务融合发展,进而在不断提升云计算服务能力与水平的同时,逐步构建了云计算基础资源可持续迭代体系。
在基础架构层面,大家保险搭建包括两地三中心、大家云(私有云)以及公有云在内的混合云架构,着力打造支持敏捷部署、快速响应、弹性拓展、可计量计费的私有云体系,以更好适应业务快速发展的需要;同时,引入先进的软件定义网络和存储技术,利用Spine-Leaf架构优化网络交互,根据不同的业务场景采取超融合和存算分离两种部署形态,打造高性能云基础底座,实现了IT基础资源的灵活扩展。截至目前,大家云已部署3000余台虚拟机,在支持业务创新、降低IT成本、提升运营能力等方面均取得了良好成效。大家保险混合云架构如图1所示。
图1 大家保险混合云架构
基于混合云平台建设,大家保险建立了统一、全面的上云评估机制,实现应用类系统快速上云,同时引入自动化手段显著降低了操作风险、提升了运维效率;此外,通过重新规划流程和规范,推动科技服务从运维向运营转型,进一步提升了服务能力和质量,并通过精细化管理多级租户及打造自动化工具平台,实现资源合理分配,不仅降低了科技运营成本,也提升了业务创新效率。作为“金融科技FinTech”基础平台,混合云平台不仅高效满足了保险业务对高可用、高性能和灵活扩展的需求,也为集团持续探索深度学习、生物识别等金融科技应用奠定了良好的环境基础。
二、打造容器云平台,实现稳敏双态支撑
随着业务系统云化需求的不断扩大,基于传统架构的系统服务在性能、效率等方面均迎来巨大挑战,已无法快速响应业务需求和市场变化。例如,在资源集约化管理方面,急需借助云原生技术实现资源的动态池化管理与应用集成复用,以避免出现重复建设、资源浪费等问题。鉴于此,大家保险建设容器云平台实现对应用、服务、镜像、集群的统一管理,并通过与DevOps实践紧密结合,促进开发、测试和运维流程高度统一,完成了容器层和基础设施层的深度集成。在此模式下,上层开发环境逐步向自动化、模块化、容器化转变,交付速度和质量均实现显著提高。此外,容器云平台还支持对服务进行细粒度监控和日志告警。大家保险容器云平台架构如图2所示。
图2 大家保险容器云平台架构
截至目前,大家保险容器云平台已上线集团及财险、寿险、养老险等各子公司的40余个核心业务系统,部署近4000个实例。此举不仅显著提升了业务运营效率,增强了IT服务化治理能力,也充分满足了业务对IT系统高可用性、高性能及灵活性的需求,为公司业务可持续发展奠定了良好基础。同时,通过规范化软件部署流程,实现自动化发布并打造可追溯和回滚能力,大幅提高了发布质量。在集中管理与统一控制方面,通过简化多环境管理,统一监控、告警和权限控制,优化了对应用组件及中间件的管理维护。此外,容器云平台还支持环境快速搭建,并可通过资源池动态调整资源配置,实现多环境、应用和实例的资源共享,大幅提升资源利用效率。
三、构建科技中台体系,助力业务平稳运行
科技中台包含数据中台和技术组件。作为大家保险数字化转型的关键战略之一,数据中台服务能力体系建设的核心目标是构建统一、高效的数据共享平台,以进一步提升数据服务能力,实现数据的自助化、智能化应用。为此,大家保险在2021年搭建公共数据仓库及企业级客户数据库,同时为公共数据基础平台接入寿险、财险、养老险、投资等重要数据,落地各主题模型675个、客户标签1200个;此外,构建风控、审计、监管报送等领域的多个数据集市,并在2023年对数据平台的所有集群进行重构升级,使数据处理的性能时效提升100%,为数据服务中台化奠定了坚实基础。在此基础上,大家保险采用数据准实时同步、接口调用、批量推送等多种共享传输方式,实现了毫秒级的线上查询服务响应。自数据中台上线以来,大家保险不仅完成了对数据资源的有效整合、共享和管理,也为未来以数据驱动创新打下了坚实基础。大家保险数据中台架构如图3所示。
图3 大家保险数据中台架构
除大数据技术外,OCR智能识别、人脸识别、公安核验等技术组件在保险行业的应用也愈发广泛。然而,单一服务通道、主备部署模式在发生系统故障时,不仅切换时间长、服务体验差,且如果备份系统使用相同的部署资源,还将面临沉默成本高、利用率较低等问题。对此,为进一步优化服务架构,提高系统的稳定性和可扩展性,大家保险在2024年将灾备方案升级为多通道架构,并基于多通道系统对业务使用指标进行了实时监控。在此模式下,一旦监测到某个服务出现堵塞或流量骤增,系统将可通过负载均衡自动将流量引导至其他通道进行处理,不仅可高效确保业务连续性和稳定性,还显著提高了系统的灵活性、可靠性以及资源的利用效率。
四、基础设施建设未来展望
1.同城双活,提升基础设施连续性能力
数字化转型背景下,如何避免单一机房故障造成系统中断风险,已成为基础设施建设领域必须面对的问题。现阶段,大家保险的系统主要采用主备部署模式,如果主机房发生故障,需要人工执行切换操作,而切换时长为30分钟到120分钟不等。为了更好地保障业务连续性,大家保险拟于2024年在同城机房之间开通裸光纤,并依靠云计算技术实现同城双活建设,进一步提升基础资源可用性。
2.统一云管,提升资源交付效能
现阶段,大家保险的云平台、容器以及少数物理机均使用了自有管理界面,在处理问题时需不断进行系统切换,处理效率较低。后续,大家保险拟打造统一云管平台,全面纳管云、容器、物理服务器、虚拟机、存储等设备,覆盖从资源申请、创建、交付、运维到最终释放销毁的全过程,实现资源一站式、全生命周期管理,持续提升资源交付效能。
3.入局AI,提升运维故障处置能力
在AI赋能层面,大家保险将在智能监控与故障预测、自动化问题解决、知识管理与决策支持、性能优化、安全增强等方面积极探索大模型应用,如通过模式识别和异常检测,提前预测潜在故障和性能瓶颈,实现主动运维;利用自然语言处理和机器学习技术,实现自动化流程运维和资源优化分配,在减少人工干预的同时,实现成本效益的最大化;此外,在安全增强方面,引入大模型技术实时监控网络安全威胁,以更为及时地发现和响应安全事件。
4.持续创新,提升自主可控能力
在自主创新方面,大家保险将坚持采用安全可控的技术和产品,不断增强应用系统建设的自主性和安全性。未来,大家保险将持续扩大创新型服务器、网络、数据库及中间件的应用范围,并尝试引入定制化开发模式,加速推动创新型应用软件与公司现有系统的集成(包括办公软件、业务管理系统等),确保新一代基础设施能够高效满足集团业务需求并提供良好的用户体验。
|